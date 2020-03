TTÜ keeletehnoloogia laboris välja töötatud kõnetuvastussüsteem võimaldab muuta kõne tekstiks ning suhelda kõne abil ka arvutite ja seadmetega. Kõigile tasuta kättesaadavat süsteemi arendab Tanel Alumäe juhitav töörühm, kuhu kuuluvad veel Ottokar Tilk ja Asadullah.

Tekstiks muudetud 10 000 helifaili

Alumäe sõnutsi on viimase aasta jooksul tekstiks muudetud ligemale 10 000 helifaili. Põhilised kasutajad on olnud ajakirjanikud, humanitaarteadlased, valitsusasutused. Loetavaks on muutunud raadiosaadete arhiiv ning lähikuude jooksul on oodata otsustavat pööret ka riigikogus.

«Sealne stenogramm jõudis juba niigi päris kiiresti avalikkuseni, aga nüüd saab seda teha märksa vähema arvu inimestega,» mainis töörühma juht.

Kõnetuvastuseks on Alumäe selgitusel esmalt vaja inimese kõnet ja käsitsi tehtud ümberkirjutust. Selle järgi õpib süsteem häälikuid eristama. Lisaks on vaja suuri tekstikogumeid. Mis keelega on parasjagu tegemist, ei ole oluline, sest kasutatakse samasugust metoodikat. «Eestikeelse süsteemi loomiseks ei ole põhimõtteliselt vaja eesti keelt osatagi. Ise olen loonud vastava võimaluse 27 väiksemale keelele, mida ma ei oska,» märkis ta.

Nõrk koht on spetsiifilisem erialasõnavara, samuti laste ja seenioride jutt. Samuti peaks salvestusseade asuma võimalikult rääkija lähedal ning ka taustamüra ei tule kasuks.

Abimees õppetöös ja koosolekutel

Üks potentsiaalne kasutusvaldkond on Alumäe sõnutsi õppetöös. «Näiteks kui tudeng õpib eksamiteks ja tahab mingit asja üle korrata, leiab ta vastava koha üleskirjutusest hõlpsalt üles. Oleme juba loonud kõnetuvastussüsteemi radioloogidele, kes saavad nüüd samal ajal pilti vaadata ja seda kirjeldada.»

Keeletuvastussüsteem muu hulgas ka ennustab, mida inimene võib öelda.

Ka kirjavahemärke ning suuri ja väikseid algustähti panema on arvutiprogramm õppinud tekstikogumite põhjal. «Päris perfektseks ei saa kõnetehnoloogiat ilmselt kunagi. Isegi kui näeme, et süsteem teeb vigu, ei ole neid parandada kuigi lihtne. Me ei saa mingeid reegleid niisama lisada. Lihtsam viis on pakkuda rohkem andmeid, aga see on tihti kulukas,» tõdes töörühma juht.

Keeletuvastussüsteem muu hulgas ka ennustab, mida inimene võib öelda.

Üks tulevikusuundi on Alumäe sõnutsi spontaanse kõne muutmine kirjakeelseks. «Näiteks kui tegemist on korteriühistu koosolekuga, kus kõik räägivad segiläbi, sünniks sellest lõpuks korrektne protokoll,» pakkus ta.

Tartu Ülikoolis loodud neurotõlge on tehisnärvivõrkudel põhinev masintõlge, mis toetab tõlkimist eesti-inglise, eesti-vene ning eesti-läti keelesuundadel. Keele tuvastamisega saab neurotõlge ise hakkama, ise tuleb määrata sihtkeel ja stiiliväljund. Neurotõlge oskab parandada ka eesti keele grammatikavigu.

Töörühma juhib Mark Fišel ning liikmed on Andre Tättar, Lisa Yankovskaya, Lisa Korotkova, Liisa Rätsep, Maksym Del ja Annika Laumets-Tättar.

Kuna üks keeleteo nominente oli Vikerraadio virgutusvõimlemine, tegid selle läbi ka keeleteolised. FOTO: Mati Määrits

Õigekirjagurmaanil tuhandeid jälgijaid

Rahvaauhinna võitnud Õigekirjagurmaani Instagram on nüüdisaegne meedium, mille kaudu vahendatakse keelenõu, uusimaid keelesoovitusi ja teateid keelemaailmast. Kert Kask avas vastava konto mullu juunis ja sealtpeale on kaheksa kuu jooksul avaldatud üle 145 postituse, mida jagatakse edasi nii Facebookis kui Twitteris. Õigekirjagurmaanil on Instagramis juba üle kümne tuhande jälgija.

Haridusministritest koosnev žürii tõstis esile veel kahte keeletegu: 140 uut artiklit Vikipeediale ning eesti teaduskeele konverentsi «Eestikeelne ja üleilmne teadus».

Kadrioru saksa gümnaasiumi õpetajad ja õpilased algatasid mullu ettevõtmise, kus Vikipeediasse kirjutati üle 140 eestikeelse artikli. Tallinna Ülikooli teaduskeelekeskus on Peep Nemvaltsi juhtimisel arendanud eesti teaduskeelt ja teadvustanud selle vajalikkust aastaid, kirjutades artikleid ja korraldades konverentse.

Keeletegude kordasaatjaid tunnustas haridus- ja teadusminister Mailis Reps kolmapäeval Põlva gümnaasiumis. «34 esitatud keeletegu annab julgust mõelda, et tegemist on vaid jäämäe tipuga,» lausus ta.

Aasta keeleteod valisid endised haridusministrid koos praegusega välja 14. korda.