Stipendiblogi: Laajan kielimallin hyödyntäminen kolumnien kääntämisessä – Tapaustutkimus suomi–saksa-kieliparin tekoälykäännösten laadusta ja niiden jälkieditoinnin kognitiivisesta työmäärästä

Stipendikilpailu Stipendit

Juuli Muona käsitteli maisterintutkielmassaan generatiivisen tekoälyn hyödyntämistä lifestyle-median kansainvälistämisessä. Tutkimuksessa pyrittiin selvittämään, kuinka hyvin ChatGPT 4.0 onnistuu kolumnien kääntämisessä, minkälaisia virheitä laaja kielimalli tekee käännöksissä, mikä on virheiden kognitiivinen työmäärä ja miten käännöksiä tulisi jälkieditoida, jotta ne olisivat julkaisukelpoisia. Muona palkittiin tutkielmastaan Media-alan tutkimussäätiön stipendikilpailussa.

Miten ChatGPT onnistuu kolumnien kääntämisessä? – Tekoälyn hyödyntäminen lifestyle-sisältöjen kansainvälistämisessä 

Pohjoismainen elämäntapa herättää yhä enenevissä määrin kiinnostusta maailmalla, mikä houkuttelee myös suomalaisia mediakonserneja laajentumaan uusille markkinoille. Vauhdikkaasti kehittyvä generatiivinen tekoäly on tuonut uudenlaisia mahdollisuuksia kansainvälisten yleisöjen tavoittelemiseen: se kääntää tekstejä nopeasti kieleltä toiselle, on helppokäyttöinen ja lähtökohtaisesti kaikkien internetkäyttäjien saatavilla. Sitä, miten hyvin tekoäly onnistuu käännöksissä, on kuitenkin tutkittu vasta vähän. 

Generatiiviset tekoälytyökalut eivät ole esimerkiksi tilasto- ja neuroverkkopohjaisten kääntimien tapaan varsinaisia konekääntimiä, jotka on tarkoitettu nimenomaan kääntämiseen. Siksi niiden hyödyntämiseen kääntämisessä liittyy sekä uusia mahdollisuuksia että omanlaisiaan haasteita. Jotta saisimme parhaan hyödyn irti tekoälystä kääntämisessä ja toisaalta välttäisimme myös mahdolliset sudenkuopat, tekoälyavusteista kääntämistä on tärkeää tutkia lisää. 

A-lehdet tarttui tuumasta toimeen ja lähti yhteistyössä Helsingin yliopiston käännöstieteilijöiden kanssa selvittämään, miten generatiivista tekoälyä voidaan hyödyntää suomalaisten lifestyle-sisältöjen kääntämisessä englanniksi ja saksaksi. Tutkielmani on osa kyseistä Helsingin yliopiston ja A-lehtien Aikakausmedian kansainvälistäminen -projektia

Tutkielmani tavoitteena oli selvittää, miten ChatGPT 4.0 onnistuu A-lehtien meillakotona.fi-sivuston kolumnien kääntämisessä suomesta saksaan. Tutkin erilaisia tutkimusmenetelmiä hyödyntäen, minkälaisia virheitä tekoäly tekee käännöksissä ja miten käännöksiä tulee muokata, jotta ne olisivat julkaisukelpoisia. Samalla arvioin sitä, miten kognitiivisesti kuormittavaa käännösten muokkaus eli jälkieditointi on niitä käsittelevälle ihmiselle.

Tutkimuksessani merkittävässä roolissa on ollut yhteistyö kahden muun saksan kielen ja kääntämisen asiantuntijan kanssa. Virheanalyysi ja tutkimustulokseni pohjautuvat yhdessä tekemäämme jälkieditointiin sekä käännösten laadusta käytyihin keskusteluihin. 

Tutkimustuloksista ilmenee, että tekoäly teki käännöksissä virheitä, jotka vaikuttavat sisällön ymmärrettävyyteen ja tyyliin. Tekoäly saattoi luoda ensisilmäyksellä onnistuneelta vaikuttavan tekstin. Yksityiskohtaisemmassa tarkastelussa käännöksistä löytyi kuitenkin tekoälytyökaluille tyypillisiä käännösvirheitä. Tässä blogissa käyn läpi tärkeimpiä tutkimustuloksiani ja johtopäätöksiä tutkimuksesta. 

Tutkimukseni tarjoaa tietoa, joka auttaa organisaatioita pohtimaan, miten generatiivista tekoälyä voi hyödyntää journalististen sisältöjen kääntämisessä ja milloin se on laadullisesti sekä ajallisesti ja siten taloudellisesti kannattavaa. Esittelen seuraavaksi tutkimuksen tärkeimpiä havaintoja.

ChatGPT 4.0 onnistui kieliopissa, mutta kompastui kontekstiin ja kulttuurien välisiin eroihin 

Tutkimukseni keskittyy A-lehtien oman ChatGPT 4.0 -pohjaisen tekoälytyökalun tuottamiin käännöksiin. Tutkin yhteensä viittä noin 200–500 sanan pituista kolumnia, jotka työkalu käänsi suomesta saksaan. 

Kieliopissa ja oikeinkirjoituksessa tekoäly onnistui hyvin. Käännöksistä ei nimittäin juurikaan löytynyt kielioppiin liittyviä virheitä. Teksteistä ei myöskään löytynyt vääriä tai puuttuvia välimerkkejä. Käännöksissä ilmeni kuitenkin muita virheitä, jotka vaikuttivat merkittävästi tekstien laatuun. Joukosta erottui kolmenlaisia virheitä, joita esittelen seuraavaksi tarkemmin. 

Suurin osa käännöksistä löytämistäni virheistä liittyi idiomaattisiin ilmaisuihin. Idiomaattisilla ilmaisuilla tarkoitan tutkimuksessani sanoja tai fraaseja, jotka ovat usein tietylle kielelle ja kulttuurille tyypillisiä, eikä niitä yleensä voi kääntää sana sanalta suoraan kohdekieleen. Niiden merkitys ei välttämättä muodostu yksittäisistä sanoista vaan kokonaisuudesta. Siksi niitä voi olla vaikeaa tunnistaa ilman syvällistä kielellistä ja kulttuurista ymmärrystä. Tekoäly kompastui idiomaattisiin ilmaisuihin, sillä se ei tunnistanut niitä vaan käänsi ilmaisut nimenomaan hyvin suoraan sana sanalta. 

Pahimmassa tapauksessa idiomaattisten ilmaisujen kääntäminen väärin voi johtaa merkittäviin väärinymmärryksiin ja jopa loukkaaviin muotoiluihin kohdekielellä. Omassa tutkimuksessani idiomaattisuuteen liittyvät virheet eivät olleet tässä mielessä vakavia, mutta vaikuttivat merkittävästi tekstin sujuvuuteen ja ymmärrettävyyteen. Kolumnien tarkoituksena on viihdyttää lukijaa. Tekstin miellyttävyys ja viihdyttävyys kärsi, kun tekoäly ei osannut luontevasti kääntää alkuperäistekstin ilmaisuja. 

Joissain tapauksissa tekoäly käänsi yksittäisiä sanoja ja fraaseja niin, että ne olivat ymmärrettäviä, mutta eivät syystä tai toisesta sopineet tekstin tyyliin. Näitä virheitä löytyi teksteistä toiseksi eniten. 

Lisäksi teksteissä oli paljon suomalaiseen kulttuuriin liittyviä asioita ja ilmiöitä, joiden merkityksiä on käännettäessä hyvä selventää esimerkiksi lisäämällä tekstiin kuvaileva sana tai selittävä lause. Tekoäly ei useissa tapauksissa havainnut tarvetta selvennyksille. Nämä virheet muodostivat kolmanneksi suurimman virheluokan. 

Virheluokittelussa käy ilmi, että suurin osa virheistä ei ole kognitiivisesti kovin kuormittavia. Toisaalta virheiden määrän ja jälkieditointiin kuluneen ajan perusteella (keskimäärin 84 minuuttia/teksti) voi kuitenkin päätellä, että jälkieditointiprosessi on kognitiivisesti kuormittava. 

Johtopäätöksiä tutkimuksesta 

Käännösten laatu ja jälkieditointiin käytetty aika herättelevät pohtimaan sitä, onko tekoälykäännöksen jälkieditointi tässä tapauksessa kannattavaa ja miten prosessi vertautuu siihen, että ihmiskääntäjä kääntäisi tekstin ilman tekoälyn apua. Tutkimuksessa korostui myös alkuperäistekstin vaikutus käännöksen laatuun: osa kolumneissa käytetyistä ilmauksista ei ole vakiintuneita suomen kielessä, mikä saattoi osaltaan vaikuttaa tekoälyn kykyyn kääntää niitä saksaksi. 

Tekoäly kehittyy kovaa vauhtia ja oppii tulevaisuudessa todennäköisesti ratkomaan yhä paremmin myös tutkielmassani ilmenneet käännöshaasteet. Harkiten käytettynä tekoäly voi siis olla hyvä apuväline kääntämisessä. Kääntämisen asiantuntijoilla on kuitenkin erityisosaamista sekä ainutlaatuinen kokemus ihmisyydestä ja kulttuurista, joita kannattaa hyödyntää tekoälyn kehittämisessä ja tekoälyn kääntämien tekstien jälkieditoinnissa. 

 Lue lisää A-lehtien hankkeesta.

 

Maisterintutkielma Helsingin yliopiston Helda-julkaisuarkistossa.

Juuli Muona palkittiin tutkielmastaan Media-alan tutkimussäätiön stipendikilpailussa.