15.9.2020

Personointi ja ennakoiva analytiikka – tehokkuutta tekoälyllä

Media-alan tutkimussäätiö järjesti Personointi ja ennakoiva analytiikka -verkkoseminaarin 9.9.2020. Seminaarissa esiteltiin rahoitusta saaneiden hankkeiden sisältöä ja tuloksia. Aiheet vaihtelivat otsikoinnin tehostamisesta kontekstitietoiseen kohdentamiseen ja mediasisällön personointiin.

Verkkoseminaarissa esiteltiin tuloksia viidestä eri hankkeesta.

Maksumallien soveltuvuus Suomen media-alalle

Nordic Institute of Business & Society NIBS Osuuskunnan hanketta maksumallien soveltuvuudesta Suomen media-alalle oli esittelemässä NIBSin toimitusjohtaja Juho-Petteri Huhtala. Hankkeen tavoitteena oli kartoittaa, millaisia maksumalleja eri uutis- ja aikakausmediat käyttävät kansainvälisesti. Toiseksi tavoitteena oli selvittää, miten maksumallit soveltuvat Suomen media-alalle.

Hankkeessa tutkittiin yhteensä 140:ä kansainvälistä uutis- ja aikakausmedian toimijaa. Toimijoiden joukosta löydettiin maksumalleja, jotka ryhmiteltiin kolmeen ryhmään: freemium-malliin, digilehti-malliin ja kovan maksumuurin malliin.

NIBS laati löydettyjen maksumallien pohjalta joukon toimenpidesuosituksia Suomen media-alalle. Ensinnäkin suosituksena on, että suomalaisten uutismediatoimijoiden tulee soveltaa freemium-mallia, jossa osa sisällöistä on maksullista ja näitä ei voi lukea ilmaiseksi lainkaan. Myös dynaamisen maksumuurin käyttöä ja soveltuvuutta tulee ryhtyä selvittämään entistä laajemmin.

Kovaa maksumuuria ei suositella käytettäväksi laajamittaisesti. Vaikka tutkimusaineiston mukaan malli on yleinen ulkomaisissa medioissa, NIBS ei näe sen soveltuvan Suomeen markkinan pienuuden vuoksi. Lahjoituksia ei tule käyttää ainoana ansaintalogiikkana, mutta yhtenä ansaintalogiikkana sen käyttöä on selvitettävä. Mediatoimijoiden on kiinnitettävä enemmän huomiota mainontaan ansaintamuotona: lisäämällä mainontaa mediasivustolla, mutta myös kehittämällä mainontaa yhä personoidummaksi.

Mikromaksamista tulee selvittää lisää. Tässä voidaan hyödyntää myös edellä mainittua dynaamista maksumuuria. Lisäksi mediatoimijoiden tulee kääntää katseet kuluttajaan – tilausprosessit ovat kankeita ja sivustot toimivat tällä hetkellä pitkälti järjestelmät edellä -periaatteella. Medioiden kannattaa alkaa totuttaa kuluttajia maksulliseen sisältöön entistä vahvemmin. Ilmaisen sisällön osuus kannattaisi yleisesti pitää mahdollisimman pienenä, jotta kuluttajat tottuisivat maksamaan mediasisällöistä.

Maksumallien kehittämistä edistääkseen media-alan on NIBSin suositusten mukaisesti ryhdyttävä voimakkaampiin toimiin yhteistyön parantamiseksi. Yhteistyöhön tulisi panostaa erityisesti digialustakehityksen saralla. Uutismediatoimijoiden tulisi panostaa enemmän omaan digikehitykseensä ja kuluttajien käyttäytymisdatan hyödyntämiseen. Erityisesti tulevaisuuden media-alan digiosaajien ennakoivaa kouluttamista tulee tehdä niin oppilaitoksissa kuin yrityksissäkin.

NIBS Osuuskunnan hanke vastasi säätiön vuoden 2018 erityisteemaan: sisältöjen maksullisuus ja globaali kehitys.

Tekoälyä mediasisällön personointiin ja kohderyhmien tunnistamiseen

Johtava tutkija Asta Bäck esitteli VTT:n hanketta mediasisällön personoinnista ja kohderyhmien tunnistamisesta.

Tavoitteena tutkimuksessa oli tarkastella vahvistusoppimisen käyttömahdollisuuksia mediatuotannossa ja sitä kautta saada suuntaviivoja jatkotutkimukselle ja yritysten kehitystoimenpiteille. Tarkennettuna kohdealueena oli mediasisältöjen esittäminen etusivulla: sekä juttujen sijainnin vaikutus niiden suosioon että etusivun koostaminen vahvistusoppimista hyödyntäen tilausten aikaansaamiseksi.

Ensimmäisessä tutkimuksen casessa tarkasteltiin etusivun järjestyksen vaikutusta klikkausmääriin sekä klikkausmäärien ennustamista. Tarkastelussa oli etusivun artikkelien järjestys viiden minuutin välein kerättynä lähdekoodista. Tulos oli odotettu: juuri julkaistu ja etusivulla ylhäällä oleva juttu kiinnostaa ja sitä klikataan auki, mutta ajan myötä juttu painuu alemmas ja samalla klikkausmäärät vähenevät.

Myös osastolla ja paikalla oli vaikutusta klikkauksiin. Aivan ylimpänä olevat jutut klikattiin useammin auki, mutta klikkausmäärät tasoittuivat nopeasti. Merkittävää oli myös se, että aiempi klikkausmäärä ennakoi myös odotettavissa olevaa klikkausmäärää, kun vertailtiin klikkauksia 5 minuutin ja 30 minuutin välillä.

Toisena casena oli tilausten tekemisen edistäminen vahvistusoppimisen avulla. Tutkimuksessa käytettiin simuloitua aineistoa, josta saatujen tulosten avulla voidaan rakentaa käytännön sovellusta. Casessa tutkittiin niin ilmaisten kuin maksumuurin takana olevien artikkeleiden tarjoamista. Oletuksena oli, että avoimia ja maksullisia artikkeleita on esitettävä sopivassa suhteessa, jotta käyttäjä päätyisi tekemään tilauksen.

VTT:n hanke vastasi säätiön vuoden 2018 tutkimusteemaan: personointi ja ennakoiva analytiikka sisällöntuotannossa ja medialiiketoiminnassa.

Toimitustyön ohjaaminen ennustavan analytiikan avulla

Fourkindin hanketta toimitustyön ohjaamisesta olivat esittelemässä Atte Jääskeläinen LUT-yliopistolta sekä Fourkindin Tomas Heiskanen. Hankkeen tarkoituksena oli tarkastella, millaista arvoa toimitus tuottaa valinnoillaan. Tämä toteutettiin tarkastelemalla toimituksellista päätöksentekoa ennustavan analytiikan keinoin.

Tutkimus toteutettiin haastattelemalla media-alan johtavia asiantuntijoita kansainvälisesti. Tämän jälkeen mallinnettiin liiketoimintamalleja ja tehtiin kausaalimallinnus siitä, millä päätöksillä on merkitystä menestykselle. Kausaalimallinnuksen pohjalta tunnistettiin käyttötapauksia, joissa ennustavaa analytiikkaa voitaisiin mahdollisesti käyttää.

Hankkeessa luotiin koneoppimiseen perustuva ennustejärjestelmä, joka ennusti artikkelien menestystä sisällön perusteella. Malli rakennettiin ensin suomen kielen ja sen jälkeen regressio- tai luokittelumalliin. Malli oppi siis ensin suomen kieltä, jonka pohjalta se oppi ennakoimaan artikkelien vastaanottoa.

Regressiomalli opetettiin artikkelien ja sivulatausten pareilla, joiden perusteella se oppi ennustamaan artikkelien sivulatausten määrää. Regressiomalli oli virheherkkä ja vaikeasti tulkittavissa toimituksissa. Siksi hankkeessa päädyttiin lopulta luokittelumalliin, jossa sisältö luokiteltiin sivulatausten määrän perusteella.

Käytännössä luokittelumalli toimi toimituksessa siten, että artikkelia kirjoitettaessa toimittaja pystyi luomaan ennusteen laskennan, joka sitten näytti, oliko artikkeli menestyvä vai ei menestyvä. Tällöin artikkelia pystyttiin muokkaamaan toistuvasti ja tarkastelemaan uudestaan mallin avulla, kunnes malli ennusti artikkelin menestyvän.

Fourkindin hanke vastasi säätiön vuoden 2018 tutkimusteemaan: personointi ja ennakoiva analytiikka sisällöntuotannossa ja medialiiketoiminnassa.

Personointi ja ennakoiva analytiikka osana kontekstitietoista kohdentamista

Adfore Technologies Oy:n toimitusjohtaja Markus Tallgren esitteli hanketta, jossa tutkittiin kontekstitietoista kohdentamista. Kontekstitietoista kohdentamista lähdettiin tutkimaan hankkeessa kolmen casen kautta.

Ensimmäisessä casessa luotiin suosituskone, jonka tavoitteena oli luoda vakioitu ratkaisu pienille sanomalehdille. Suosituskone todettiin kustannustehokkaaksi ja edullisimmaksi tavaksi hyödyntää tekoälyä personoinnissa. Toisaalta suosituskoneen heikkoutena nähtiin sen, ettei konetta ole mahdollisuutta kehittää eteenpäin – mitään kontekstitietoa ei ollut mahdollisuutta ottaa mukaan.

Toisessa casessa luotiin maakuntalehdille ennakoivaa analytiikkaa asiakkaiden poistumasta. Casessa luotiin räätälöityjä malleja kuluttajakäyttäytymisen parempaan ymmärtämiseen luomalla tekoälypohjainen segmentointi digilehden lukijoista. Tulokset olivat positiivisia: Lukijoista löytyi selkeitä segmenttejä ja malli tarjosi selkeän pohjan personoinnille. Myös poistuman ennustaminen antoi hyviä tuloksia. Sen sijaan haasteeksi huomattiin käyttäjädatan kerääminen, sillä laadukkaan ja kontekstitietoa sisältävän datan kerääminen ei välttämättä ole vielä arkipäivää.

Viimeisessä casessa tarkasteltiin, mitä kontekstit tarjoavat digitaalisessa ulkomainonnassa. Reaaliaikainen mainontaratkaisu käytti hyödykseen konteksteja, joiden perusteella busseissa olevia digitaalisia näyttöjä ohjailtiin. Mainontaa kohdennettiin ajan, sijainnin ja sään perusteella. Samaa mainontaa ohjattiin myös mobiilikanavaan. Case osoitti, että kontekstin hyödyntäminen avaa uusia mahdollisuuksia mainontaan. Mobiilin yhdistäminen ulkomainontaan mahdollisti myös personoinnin.

Adfore Technologies Oy:n hanke vastasi säätiön vuoden 2018 tutkimusteemaan: personointi ja ennakoiva analytiikka sisällöntuotannossa ja medialiiketoiminnassa.

Tekoälyllä tehokkuutta otsikointiin

VTT:n erikoistutkija Sari Järvinen esitteli hanketta tekoälyn hyödyntämisestä otsikoinnin tehostamiseen. Tavoitteena hankkeessa oli kartoittaa tehokkaan uutisotsikon ominaisuudet online-mediassa, toteuttaa työkaluja, joilla tehokkuutta voidaan mitata sekä kehittää algoritmi ennustamaan uutisotsikon tehokkuutta. Tehokasta otsikkoa kartoitettiin kahden suureen avulla: lukijoiden lukumäärällä sekä artikkelisivulla vietetyllä ajalla. Hankkeessa haluttiin toteuttaa työkalu tehokkaan, mutta ei klikkiotsikon, luomiseen uutistoimittajan työn tueksi.

Kartoituksen perusteella luotiin Otsikkokone-työkalu, jota voidaan hyödyntää ennen artikkelin julkaisua. Otsikkokone käyttää tietoina otsikon tekstiä sekä otsikosta laskettuja piirteitä, kuten otsikon pituutta ja erisnimien määrää. Lisäksi kone voi käyttää metatietoa kuten jutun osastoa, maksullisuutta sekä julkaisuaikaa.

Tietojen perusteella kone ennustaa juttujen menestystä otsikon perusteella luokittelemalla otsikkoja neljään luokkaan tehokkuuden ja houkuttelevuuden mukaan. Koneen onnistumisprosentit olivat hyviä – tehokkuuden perusteella kone onnistui luokittelemaan jutut jopa melkein 60 prosentin tarkkuudella. Tarkempia ennustuksia saatiin, kun tutkittiin 2-luokkaisia ennustuksia: klikkejä keräävä otsikko vai ei (77 %), jutun lukuaika (n. 72 %) ja tehokas vai ei tehokas juttu (78 %).

Tutkimuksessa otsikon piirteistä löydettiin vaikuttavan otsikon piirteitä. Aineiston perusteella otsikon vaikuttavuutta lisäsi se, että otsikosta löytyy sana ”Oulu”, se sisälsi lainauksen tai siitä löytyi lukumääriä tai rahaa tarkoittavia sanoja.

Otsikkokoneen tarkkuutta testattiin vertailemalla sen onnistumisprosenttia oikeiden toimittajien tekemään luokitteluun. Toimittajien keskimääräinen tarkkuus jakaa otsikot oikein neljään eri luokkaan oli noin 26 prosenttia, kun taas Otsikkokoneen tarkkuus oli noin 61 prosenttia.

VTT:n hanke vastasi säätiön vuoden 2018 tutkimusteemaan: personointi ja ennakoiva analytiikka sisällöntuotannossa ja medialiiketoiminnassa.