Stipendiblogi: Kaleva: Generatiivisen tekoälyn hyödyntäminen journalistisen tekstin tiivistämisessä

Stipendikilpailu Stipendit

Joona Eerola tarkasteli AMK-opinnäytetyössään, kuinka journalismin pelisäännöt pätevät, kun tekoälyä hyödynnetään nimenomaan uutistyössä. Tutkimuksen keskiössä oli generatiiviseen tekoälyyn pohjautuva tiivistysmoottori, joka tunnetaan tuttavallisemmin nimellä Timo. Eerola palkittiin tutkielmastaan Media-alan tutkimussäätiön stipendikilpailussa.

Tekoäly tukee journalistista työtä – vai tukeeko? 

Tein opinnäytetyöni osana Media-alan tutkimussäätiön rahoittamaa teemahanketta Generatiivisen tekoälyn hyödyntäminen tekstin tiivistämisessä: Kaleva ja Turun Sanomat. Tarkastelin työssäni hankkeessa kehitetyn tekoälypohjaisen tiivistysmoottori Timon toimintaa, kun se tiivisti Kalevan uutisartikkeleita radioon soveltuviksi sähkeuutisiksi. 

Journalismia opiskellessani ehdin kuulla miltei kyllästymiseen asti, kuinka tärkeää on tuntea alan ja erityisesti uutistyön pelisäännöt läpikotaisin. Toimittajan työssä ei riitä vain oikeat faktat, vaan oleellista on se, miten ja millä perusteilla ne esitetään.

Vuonna 2021 alkaneita opintojani ehti kulua hädin tuskin vuottakaan, kun pelisääntöjä alettiin alleviivata entistä enemmän. Yhtäkkiä oli nimittäin huomattavissa, että tekoälyn käsite oli esimerkiksi ChatGPT:n myötä tulossa mediakentällä tutuksi valtavaa vauhtia. Tämä vaikutti ja vaikuttaa luonnollisesti edelleen myös suoraan siihen, miten yllä mainittuja sääntöjä, eli journalismin periaatteita, käytäntöjä ja etiikkaa, vaalitaan, kun sisältöön on toimittajan itsensä lisäksi vaikuttanut jollain tavalla myös kone ja sen arvaamattomat algoritmit.

Opinnäytetyössäni syvennyin tutkimaan kiehtovaa kysymystä, kuinka journalismin pelisäännöt pätevät, kun tekoälyä hyödynnetään nimenomaan uutistyössä. Tutkimuksen keskiössä oli generatiiviseen tekoälyyn pohjautuva tiivistysmoottori, joka tunnetaan tuttavallisemmin nimellä Timo. Käytännössä Timo sai eteensä Kalevan verkkosivuilta poimittuja uutisartikkeleita, joista sen oli sille annetun kehotteen pohjalta tarkoitus tiivistää lyhyitä ja radiossa äänen luettaviksi soveltuvia sähkeitä. Tähän Timo käytti kahta eri kielimallia. Tekoälyn kontekstissa kielimallien tehtävänä on käsitellä meille ihmisille ominaista kieltä ja ennustaa seuraavan sanan todennäköisyyttä käsillä olevan aiheen perusteella.

Pyrkimyksenä oli selvittää, kuinka tarkasti Timon tekemissä sähkeissä vastataan uutisen kannalta olennaisiin kysymyksiin, eli uutiskysymyksiin mitä, missä, milloin, miten, miksi ja kuka. Tämän lisäksi luupin alla oli, miten tiivistysmoottori on huomioinut Journalistin ohjeet eli journalismin etiikan ja sananvapauden kannalta keskeisimmät ohjenuorat.

Analysoin kymmenen uutista eri aihealueilta. Aineistoni oli peräisin viikonloppuisin julkaistuista jutuista, jotka valitsin siten, että mukana oli uutisia alueittain Oulusta, Pohjois-Suomesta, kotimaasta sekä ulkomailta ja aihepiireittäin urheilusta ja kulttuurista. Tutkimusmenetelmäni avulla vertasin Timon tiivistämää radiosähkettä alkuperäisen uutisen sisältöön uutiskysymysten ja Journalistin ohjeiden näkökulmasta.

Tulos oli lopulta hyvin kaksijakoinen. Tekoäly pärjäsi varsin hyvin uutiskysymyksiin vastaamisessa, mutta sen sijaan todellista huojuntaa aiheutti Journalistin ohjeisiin nojaavat eettiset valinnat: tekoäly jätti usein pois alkuperäisen uutisen kannalta jopa kriittisiä asioita, ei huomioinut lähteiden asianmukaista mainitsemista ja esitti asioita tavalla, joka oli hyvin harhaanjohtavaa. Esimerkiksi voidaan nostaa tilanne, jossa Timo oli yhdistänyt harhaanjohtavasti ja osin sepitteellisesti kaksi asiaa, jotka eivät alkuperäisessä uutisessa edes liittyneet toisiinsa.

Opinnäytetyöni vahvisti osaltaan käsitystä siitä, että tekoäly ei ole läheskään valmis korvaamaan ihmistä. Jossain määrin se voi toki helpottaa työtä ja nopeuttaa prosesseja, mutta viimeinen vastuu sisällöstä on ja pysyy toimituksella, kuten Journalistin ohjeetkin painottavat. Ihmisen pitää tarkistaa, että kaikki on asianmukaista. Aina. Nähdäkseni kone ei vielä ymmärrä, mitä journalistinen vastuu tai edes vastuu tarkoittaa.

Ehdottomasti huomionarvoista ja kiinnostava oli se, miten kehotteiden muotoilu vaikutti lopputulokseen. Käytin tutkimuksessa vain yhtä kehoteversiota, jonka tavoitteena oli ohjata tekoälyä kirjoittamaan 700–900 merkin mittainen radiosähke. Kehotteen muotoilu ei lopulta ollut kovin yksinkertainen temppu, koska kielimallit olivat ongelmissa esimerkiksi oikean pituuden löytämisessä. Lisäksi eri tavalla muotoiltu kehote tuottaisi todennäköisesti toisenlaisen lopputuloksen, joten kiinnostavaa on, olisiko mahdollista luoda kehote, joka huomioisi yllä mainitun rinnalla myös journalismin fundamentaalit kokonaisuudessaan?

Yhtä kaikki, tässä vaiheessa uraani on ollut arvokasta päästä tutkimaan ilmiötä, joka vaikuttaa varmasti paitsi journalismin myös koko digitaalisen median tulevaisuuteen. Kuten on jo yleisesti tiedossa, tekoäly ei ole enää vain teoreettinen mahdollisuus, vaan nopeasti kehittyvä konkreettinen työkalu. Toivon, että työni voi osaltaan tarjota näkökulmia esimerkiksi siihen, miten tekoälyä voidaan hyödyntää eettisesti nimenomaan niin, että se tukee meitä ihmisiä tekemään samalla myös kilpailukykyisempää sisältöä. Ja mitä kaiken edellä mainitun suhteen pitäisi huomioida.

Havaintojeni perusteella tekoäly ei ole hyvä eikä paha. Se on työkalu. Ja kuten jokaisen työkalun kanssa, tärkeintä on se, kuka sitä käyttää ja miten. Tässä niin journalisteilla kuin muillakin sisältöä tuottavilla on yhä paljon opeteltavaa. Puhumattakaan tekoälyn ja kielimallien oppimisesta tai pikemminkin niiden opettamisesta.

 

Joona Eerola palkittiin tutkielmastaan Media-alan tutkimussäätiön stipendikilpailussa.

AMK-opinnäytetyö Theseus-julkaisuarkistossa.