4 helmikuun, 2020

Mediasisältöjen esittämisessä voidaan hyödyntää koneoppimismenetelmiä

VTT:n tutkimuksen tavoitteena oli tarkastella koneoppimismenetelmien ja erityisesti vahvistusoppimisen hyödyntämismahdollisuuksia mediatuotannossa. Tutkimuskohteena oli mediasisältöjen esittäminen etusivulla.

Tietoverkkoja.

Media-alan tutkimussäätiön rahoittamassa Tekoäly mediasisältöjen esittämisen tukena -hankkeessa oli kaksi tutkimuskysymystä: mikä on paikan merkitys juttujen suosioon ja miten esitettävät jutut valitaan, kun tavoitellaan uusia tilauksia.

Paikan merkitys juttujen suosioon

Paikan vaikutuksen selvittämisessä käytettiin esimerkkilehden aineistoa, josta ilmeni jutun sijainti etusivulla yläreunasta katsottuna, jutun ominaisuudet kuten ikä, kategoria ja otsikko, sekä etusivun kautta tulleet klikkaukset viiden minuutin aikavälein.

Tilastollinen tarkastelu osoitti, että mitä korkeammalla juttu on etusivulla, sitä enemmän se saa klikkauksia. Merkitys kuitenkin tasoittuu suhteellisen nopeasti mentäessä etusivulla alemmaksi.

Kerätyn aineiston pohjalta tehtiin ennustava koneoppimismalli, joka edeltävän aikajakson klikkausten ja jutun ja etusivun dynaamisten ja staattisten ominaisuuksien pohjalta tekee ennusteen jutulle eri paikoissa kertyvästä klikkausmäärästä. Tätä voidaan käyttää määrittelemään etusivun artikkeleille hyvä järjestys.

Esitettävien juttujen valinta

Esitettävin juttujen valinnan selvittämisessä käytettiin simuloitua dataa eli generoitiin annettujen parametrien perusteella käyttäjät, jutut ja käyttäjäsessiot. Aineiston avulla laadittiin malli, joka arvioi tarjolla olevien juttujen käyttäjäkohtaisen hyvyyden, kun hyvyys määriteltiin tilaukseen johtavana käyttäytymisenä. Tilausta indikoivina merkkeinä käytettiin maksullisten artikkeleiden klikkaamista. Malli opetettiin simuloidulla datalla, ja sitä voidaan käyttää pohjana todellisen datan kanssa tehtävälle jatkokehitystyölle.

Hankkeen tulokset

Tutkimushanke avaa mahdollisuuksia hyvän esitysjärjestyksen ja etusivun määrittelemiseen koneoppimismenetelmiä hyödyntäen. Ensimmäisen tutkimuskysymyksen kohdalla selvisi, että jos käyttäjistä ei ole tausta- tai preferenssitietoa, esitysjärjestyksen määrittelyssä voidaan käyttää aiemmilta käyttäjiltä syntynyttä palautetietoa sekä myös juttujen joitakin ominaisuuksia.

Toista tutkimuskysymystä tarkasteltaessa oletettiin, että on olemassa tietoa käyttäjien preferensseistä ja istunnoista sekä tilaukseen johtaneista käyttäytymispoluista. Näiden pohjalta vahvistusoppimismalli pystyy generoimaan käyttäjäkohtaisia suosituksia. Kehitetty ohjelmisto tarjoaa ympäristön, jossa voidaan tehdä ensimmäisen vaiheen kokeiluja ennen todellisen tiedonkeruun käynnistämistä ja menetelmien käyttöä todellisella aineistolla.

Lisätiedot:

Asta Bäck
VTT
asta.back_vtt.fi (laita -viivan tilalle @-merkki)
p. 050 5515 187

Tekoäly mediasisältöjen esittämisen tukena (pdf)