Käyttöliittymänä ääni

Ääniohjaus yleistyy väistämättä. Suomalainen Speechgrinder kehittää älykaiuttimista riippumatonta, uuden sukupolven teknologiaa.

Radiot.fi -applikaatiossa käyttäjä voi ohjata radiota äänellään ja valita kanavan tai ohjelman esimerkiksi autoa ajaessaan. S-ryhmän S-ostoslistassa käyttäjä taas voi muodostaa älypuhelimeen ostoslistan puheella.

Kummankin sovelluksen takaa löytyy suomalaisyritys Speechgrinder. Se tekee ohjelmistokehittäjille työkaluja, joilla tuotteisiin ja palveluihin voidaan lisätä puheohjaus helposti ilman, että asiakasdataa tarvitsee luovuttaa teknojäteille.

– Työkalut on sijoitettu asiakkaan tarpeen mukaan joko pilveen tai asiakkaan omaan konesaliin. Jos asiakas ei halua, luottamuksellista dataa ei käsittele kukaan eikä se siirry muualle, Speechgrinderin toimitusjohtaja Otto Söderlund kuvailee.

Puhuminen on luontevaa

Söderlund on vakuuttunut siitä, että ääni on seuraava käyttöliittymämme.

– Ääniohjauksen avulla ihmiset voivat kommunikoida koneiden kanssa luontevammin kuin ennen. Näppäimistön, hiiren tai kosketusnäytön käyttäminen ei ole samalla tavalla luontevaa kuin puhuminen.

Ääniohjaus on erityisen hyvä tilanteissa, joissa käsillä on muuta työtä. Autoilun lisäksi tällaisia käyttökohteita on paljon esimerkiksi teollisuudessa. Ääniohjauksen avulla on myös kätevä listata monimutkaisia asioita tai hakea tietoa.

Tekoäly aloitti englannilla

Maailmalla ääniohjauksessa ollaan jo pitkällä. Alan suuret pelurit Amazon, Apple ja Google ovat keskittyneet erityisesti älykaiuttimiin. Yhdysvalloissa jo joka kolmannessa ja Iso-Britanniassa noin joka kuudennessa kotitalouksessa on älykaiutin.

Aasiassa tärkein käyttökohde taas on viestien sanelu. Ilmiön taustalla vaikuttavat monimutkaiset merkkijärjestelmät, jotka vaativat paljon näppäilyä.

– Jos viisi vuotta sitten Aasian suurkaupungeissa kaikki näpyttelivät viestejä kännyköillään, nykyään samoissa kaupungeissa näkyy, että ihmiset ovat nostaneet matkapuhelimen suunsa eteen. He sanelevat viestejä, jotka sitten muuttuvat merkeiksi näytöillä.

Suomikin sujuu jo

Nykyään muun muassa Applen Siri ja Google puhuvat jo suomea. Yleiskielen tekstiksi muuttaminen suomeksi on jo hyvällä tasolla. Ongelmia syntyy, kun mennään yritysten tarvitsemaan erityiseen sanastoon, vaikkapa lääkärin tai lakimiehen kieleen. Tällaisiin käyttötarkoituksiin ei riitä yksi yleinen puheentunnistusmalli, vaan malli täytyy kouluttaa erikseen.

Suomessa älykaiuttimien yleistymistä on hillinnyt myös se, että niiden tuki suomen kielelle on vielä heikko tai olematon. Älykaiuttimilla ei siksi pysty esimerkiksi tilaamaan ruokaa suomalaisesta kaupasta tai olemaan yhteydessä suomalaiseen pankkiin.

Esimerkkejä S-ostoslistan näkymästä.

Söderlundin mielestä ääniohjaus yleistyy silti väistämättä myös meillä. Hän mainitsee, että yksi erittäin potentiaalinen ääniohjauksen käyttöalue olisi vaikkapa juuri lääkärin työ, missä korkeasti koulutetun ammattilaisen ajasta suuri osa kuluu mekaaniseen muistiinpanojen tekemiseen.

– Speechgrinderin teknologia mahdollistaa tekoälyn kouluttamisen ymmärtämään mitä tahansa kieltä tai erikoissanastoa. Lisäksi kouluttaminen auttaa puheentunnistusta vaikeissa akustisissa olosuhteissa, kuten kovaäänisissä tehtaissa.

Kasvavia alueita ovat myös virtuaalitodellisuus ja lisätty todellisuus. Puhe on luontevin ohjausväline paikoissa, jossa näppäimiä tai kosketusnäyttöjä ei ole lainkaan ulottuvilla.

Speechgrinder on alan edelläkävijä

Älykaiuttimista riippumatonta, uuden sukupolven ääniohjausteknologiaa kehittävä Speechgrinder on valittu Pohjoismaiden kiinnostavimpien start up -yritysten joukkoon.

– Meillä on sikäli harvinainen tilanne, että olemme saaneet mukavasti rahoitusta edullisin ehdoin. Oma vaikutuksensa on varmasti silläkin, että vaikka yritys on varsin nuori, niin avainhenkilöillä on jo paljon kokemusta ääniohjauksesta esimerkiksi Amazonilta ja Applelta, Söderlund kertoo.

Hän uskoo, että viiden vuoden päästä on aivan tavallista, että puhumme vaikkapa leivänpaahtimellemme tai jääkaapillemme.

– Puhe ei varmastikaan syrjäytä kokonaan muita ohjausvälineitä, mutta se täydentää näitä ja luo entistä paremman käyttökokemuksen.

Video ääniohjauksesta >>
www.speechgrinder.com

Teksti: Matti Välimäki

css.php