Media-alan tutkimussäätiö myönsi 1.4.2020 Isoft.ai Oy:lle 22 000 euroa tutkimustukea hankkeelle “Monikielisten ääniuutisten automaattinen luominen tekstimuotoisista uutisista”.
Nykyaikaiset tekoälyyn perustuvat puhesynteesipalvelut kykenevät tuottamaan koneääntä, joka on kohtalaisen lähellä normaalia ihmisen puhetta. Tällä hetkellä koneen tuottama ääni toimii parhaiten lyhyiden (1 lause) tekstien puheeksi muuttamiseen. Pitempi teksti (kuten uutisartikkeleissa) vaatii koneäänen optimointia ja parempaa vaihtelevuutta, jotta kuuntelukokemus olisi mahdollisimman hyvä.
Isoftin tekstistä puheeksi -ratkaisujen kehityksen yhteydessä on havaittu useita puutteita erityisesti suomenkielisissä koneäänissä. Puutteita on erityisesti lauseiden dynamiikassa (painotuksissa, äänen vaihtelevuudessa), numeroiden, päivämäärien ja suomen kielen sijamuotojen kanssa. Lisäksi vaikka teksti on kirjoitettuna selkeää, sen suora muuttaminen ääneksi voi toimia huonosti ääniuutisissa.
Tutkimuksen tavoitteena on
Tutkimuksen tuloksia voidaan käyttää hyväksi kehitettäessä media toimialalle korkealaatuisia ääniuutis- ja automaattisen kääntämisen ratkaisuja. Tutkimus tuottaa tietoa täysin uusien palvelujen (automaattisesti luodut ääniuutiset) mahdollisuuksista. Tulokset ovat myös nopeasti siirrettävissä käytäntöön uusien palvelujen kehittämisessä.