Tekoäly äikän tunnilla

Tekoäly äikän tunnilla

Suomessa on käynnissä kansainvälisestikin ainutlaatuinen Lahjoita puhetta -hanke. Tavoitteena on opettaa tekoäly ymmärtämään suomea – kenties jopa silikkaa savvoo.

Monet puheentunnistusta hyödyntävät tekniset sovellukset toimivat jo kohtalaisesti englanniksi ja muilla suurilla kielillä. Suomeksi palveluita on kuitenkin saatavana rajallisesti tai huonolaatuisina. Alan kansainväliset suuryritykset eivät ole aina välttämättä kovin kiinnostuneita harvinaisesta kielestä ja pienestä markkina-alueesta.

Suomessa käynnistyi puoli vuotta sitten Lahjoita puhetta -hanke, jonka tavoitteena on kehittää suomenkielistä tekoälyä. Siinä kerätään tutkijoiden ja sovelluskehittäjien käyttöön ihmisten tavallista arkipuhetta. 

Hankkeen ohjausryhmään kuuluva Aalto-yliopiston professori Mikko Kurimo kertoo, että ideana on, että suomen kieltä saataisiin talteen mahdollisimman paljon ja erilaisten ihmisten puhumana.

Mikko Kurimo. Kuva: Anni Hanen/Aalto-yliopisto

”Tavoitteena on, että näytteitä olisi ympäri maata eri murrealueilta. Tärkeää olisi saada puhetta sekä miehiltä että naisilta ja eri-ikäisiltä ihmisiltä, myös lapsilta ja vanhuksilta. Olennainen ryhmä ovat myös esimerkiksi suomea omalla aksentillaan puhuvat maahanmuuttajat.” 

Hän lisää, että lapset, vanhukset ja maahanmuuttajat ovat kaikki ryhmiä, jotka saattavat hyötyä aivan erityisesti erilaisista ääniohjatuista palveluista.

Lahjoita puhetta -hankkeen keskeisiä toimijoita ovat Yle sekä Helsingin yliopiston kielipankki.

Lahjoituksissa loppukiri

Projektisuunnittelija, kielitieteilijä Mietta Lennes Helsingin yliopistolta kertoo, että hankkeeseen on lahjoitettu tähän mennessä noin 3000 tuntia puhetta. 

”Tavoitteena on ottaa vuoden vaihteeseen mennessä loppukiri, vielä ainakin 2000 tuntia puhetta tarvittaisiin.”

Mietta Lennes. Kuva: Veikko Somerpuro

Kun tekoälylle opetetaan uutta kieltä, niin lähtökohtana eivät ole yksittäiset puheessa esiintyvät sanat, vaan ne voidaan pilkkoa lyhyempiin merkityksellisiin pätkiin. Tämä auttaa tekoälyä selviämään esimerkiksi suomen sanojen lukuisista sijamuodoista ja muusta rikkaasta taivutuksesta. Kun aineistoa on tarpeeksi paljon, kone oppii ennustamaan yhä tarkemmin, mitä sanoja ja muotoja todennäköisesti sanotaan seuraavaksi.

”Lisäksi myös suomen kielessä pitää kiinnittää paljon huomiota esimerkiksi äänenpainoihin, sävelkulkuun ja rytmiin. Tällaiset asiat vaikuttavat siihen, miten sanojen ja lauseiden merkitys lopulta tulkitaan.”

Tekoälylle pitää ehkä opettaa myös suomalaisten lukemattomat tavat olla hiljaa.

Misä miun liäkkeet on?

Suomenkielisen tekoälyn yksi mahdollinen sovelluskohde ovat erilaiset hoivarobotit.

”Hoivarobotin kohdalla korostuu ehkä erityisesti se, että tekoälyn on oltava hyvin luotettava. Jos hoivarobotti ei ymmärrä tai tulkitsee väärin, mitä sille puhutaan, seuraukset voivat olla varsin ikäviä”, Lennes pohtii.

Suomen murteet poikkeavat toisistaan merkittävästi. Maallikolle tulee mieleen, että olisikohan järkevää tehdä erikseen savvoo ja toisaalta turkulaist ymmärtäviä hoivarobotteja?

”Ensimmäiset tekoälysovellukset eivät vielä välttämättä ymmärrä kaikkien murteiden erikoisuuksia. Ehkäpä niihin voi myöhemmin hankkia vaikka savolaispäivityksen?”

Palveluita Suomessa – ja ulkomailla

Mikko Kurimo mainitsee yhtenä sovelluskohteena erilaiset litterointipalvelut, joilla suomenkielinen puhe, esimerkiksi haastattelut, kääntyvät suoraan tekstiksi.

Ääniohjaus tulee auttamaan myös esimerkiksi erilaisten lomakkeiden täyttämistä puhelimitse – sekä tehostamaan ylipäätään palveluita. 

”Jonakin päivänä voimme ehkä puhua sujuvasti suomen kielellä robotin kanssa. Silloin meidän ei tarvitse maksaa kalliita palvelumaksuja tai jonottaa puolta tuntia puhelimessa, jotta pääsisimme keskustelemaan oikean ihmisen kanssa.”

Mutta koska voimme sitten seikkailla vaikkapa Aasiassa, niin että kone kääntää puheemme automaattisesti suomesta mandariinikiinaksi?

”Tulevaisuudessa tuokin saattaa olla mahdollista. Isojen kielten kohdalla tuohon suuntaan ollaan jo menossa. Matka on kuitenkin vielä pitkä”, Kurimo miettii.

Puhetta voi lahjoittaa osoitteessa: https://lahjoitapuhetta.fi/


Ihmisen apuna epätäydellisessä maailmassa

Suomalaiset haluavat kehittää tekoälyä, joka ymmärtää ihmisen tavoitteita ja auttaa häntä ongelmien ratkaisussa.

Suomen tekoälykeskus (Finnish Center for Artificial Intelligence FCAI) on osaamiskeskittymä ja Suomen Akatemian lippulaiva, joka kokoaa yhteen alan huippututkijoita sekä teollisuuden ja julkisen sektorin toimijoita. Ideana on ratkoa tosielämän ongelmia niin nykyisen tekoälyosaamisen kuin aivan uusien tekoälymenetelmien avulla.

FCAI:n johtaja, Aalto-yliopiston tietojenkäsittelytieteen professori Samuel Kaski kertoo, että kansainvälisten vertailujenkin perusteella Suomessa on vahvaa tekoälyosaamista, erityisesti maan koko huomion ottaen. 

Samuel Kaski. Kuva: Aalto-yliopisto

”FCAI:n tutkimukselle on tyypillistä, että meillä pohditaan, miten voidaan luoda tekoäly, joka toimii ihmisen rinnalla, ymmärtää hänen tavoitteitaan, täydentää häntä sekä auttaa ongelmien ratkaisussa. Muualla lähtökohtana saattaa olla usein vain se, että miten erilaisia asioita voitaisiin automatisoida.”

FCAI on keskeinen toimija Suomen tekoälyohjelman toteuttamisessa: teollisuuden, terveydenhuollon ja työelämän uudistamisessa sekä tutkimukseen perustuvien innovaatioiden käyttöönotossa.

Kasken mukaan on äärimmäisen tärkeää, että Suomessa on ihmisiä, jotka ymmärtävät tekoälytekniikoita ja voivat osallistua niiden kehittämiseen, usein osana kansainvälisiä verkostoja. 

Tämä auttaa esimerkiksi siinä, että käyttöön otettavat sovellutukset ovat lopulta sitä, mitä halutaan. 

Myös valmiiden ratkaisujen ostaminen vaatii paljon osaamista. Tällöin on esimerkiksi varmistauduttava siitä, että sovellukset ovat vain sitä, mitä on tilattu.


Teksti: Matti Välimäki

css.php