Aivo Olev: tehisaru ei hakka mõtlemist asendama, vaid täiendama

03.07.2026
Aivo Olev: tehisaru ei hakka mõtlemist asendama, vaid täiendama. 03.07.2026. Tallinna Tehnikaülikooli doktorant-nooremteadur Aivo Olev on valinud oma valdkonnaks keeletehnoloogia, milles kogetakse praegu kiireid muutusi. Majandust, psühholoogiat ja korduvalt IT-d õppinud teadlane töötas aastaid õpingute kõrvalt ettevõtetes ning leidis seejärel enda koha teaduses. Valdkonna kiire arengu tõttu on kõnetuvastusega tegelev Olev pidanud muutma oma doktoritöö fookust, aga tema lahendused on võitnud suuri võistlusi. Kõnetuvastusmudelid, mis mõistavad muuhulgas estonglish’it ja mitmesuguseid aktsente, leiavad kiiresti praktilise väljundi, mis on tema jaoks teaduse juures tähtis. Oled doktoriõppes 2021. aastast. Tõsi, väikese vaheajaga. Kuidas oled enda jaoks sõnastanud teadustöö mõtte? Teadustöö tähendab vaevelda kitsas valdkonnas spetsiifilise probleemi kallal ja otsida sellele lahendusi, eelduseks ala laiem tundmine. Õnneks on minu valdkonna doktorantidel väga suur vabadus ise probleeme valida. Jah, osaliselt sõltub valik rahastusallikast, aga praktikas olen ma alati saanud tegeleda just minule huvipakkuvate ja ühtlasi praktiliste teemadega. Arvestatav osa mu väljundist ongi läinud praktilisse kasutusse, tasub mainida kas või kõnetuvastuse teenust Tekstiks.ee ja vabavaralise kõnetuvastuse tarkvara Jutukuva. Sel aastal oleme kasutanud ideede katalüsaatorina võistlusi, mille kaudu on toodud meile konkreetsed probleemid lausa kandikul ette. Hiljuti ehitasin tarkvara kirjeldustõlkidele ja vaegkuuljatele. See muudab reaalajalise kõnetuvastusmudeli otseselt kasulikuks. Kas sa unistasid juba lapsena teadlaseks saada? Seda mitte. Aga kuna mu mõlemal vanemal oli kõrgharidus, teadsin alati, et ülikooli pean minema. Mul võttis lihtsalt aega, et oma eriala leida. Isa kaudu olin juba väiksena puutunud kokku arvutitega, mistõttu maandusingi pärast keskkooli IT kolledžis, kuigi püsisin seal ainult ühe aasta. Seejärel läksin Tartu Ülikooli, õppisin majandust, hiljem psühholoogiat. Lõpetasingi psühholoogia bakalaureusetaseme. Lõpuks asusin siiski IT-tööle. Kaheksa aastat hiljem jõudsin taas ülikooli, seekord TalTechi. Valisin magistritööks väga praktilise kõnetuvastuse platvormi, mis nüüd, seitse aastat hiljem, on Tekstiks.ee veebilehel kõigile kättesaadav. Selle tulemusena kutsus mu juhendaja professor Tanel Alumäe mind ülikooli ning poolteist aastat pärast magistriõppe lõpetamist tulin doktorandina TalTechi tagasi. Alles siis tekkis tõsine huvi teadust teha. Miks magistriõpinguteni nii kaua läks? Töötasin aastaid tarkvaraarendusprojektides analüütikuna, olin tellijate ja programmeerijate vaheline ühenduslüli. Ajapikku sain aga aru, et tahaksin teada rohkem teada sellest, kuidas tarkvara tegelikult tehakse. Hakkasin ennast harima ja samas tundsin ka, et äkki kaob see eriala hoopis ära … Ma ei soovinud jääda kinni ühte rolli, tahtsin avardada oma arusaamu, rohkendada kompetentse. Nii tulingi magistriõppesse, et saada võib-olla programmeerijaks, teha väike kannapööre. Kuidas TalTechist saadud haridust hindad? Magistrantuuris hakkasin esimest korda ülikooli nautima! Suutsin seostada õpingud seniste kogemustega, mis tundus väga põnev. Tõsi, ma ei saanud kohe informaatikasse astuda, sest mul polnud reaalainete bakalaureust. Tulin äriinfotehnoloogiasse ja pärast esimest semestrit vahetasin eriala. Töö kõrvalt õnnestus õpingud lõpetada nominaalaja ehk kahe aastaga. Ja cum laude’ga. Räägitakse, et IT-s on hästi suured palgad ja ülikoolis mitte. Oled sissetulekus kõvasti kaotanud? Ei, minu palk polnud varem märkimisväärselt suurem kui nüüd doktorantuuris. Ma ei pidanud doktorandiks tulles oma elus midagi muutma. Kõnetuvastus, millega tegeled, tundub esmapilgul lihtne: paneme seadme salvestama, see tuvastab kõne, muudab selle tekstiks. Sedasama teeme vesteldes praegugi. Mis seal siis keerulist on? Keeruliseks muudab asja tehisintellekt (TI). Meie valdkonnas on üle mindud mudelitele, mida treenitakse algusest lõpuni puhtalt andmete pealt. See eeldab ühelt poolt häid andmeid, teisalt sobivat arhitektuuri, mida saab nende andmetega hästi treenida. Sageli kasutame mudeleid, mida on treenitud teistel keeltel. Mu doktorantuuri tuleku hetkel peeti suureks probleemiks, et eesti keelt kiputi inglise keelega segama, kasutati võõrväljendeid, mida hääldati vahel eesti-, vahel inglispäraselt. Nüüd on mitme keele toel eeltreenitud mudelid selle takistuse peaaegu kaotanud. Mudel ise teab, millal missuguse keele sõnavara kasutada. Tahame, et mudel suudaks eristada erinevaid kõnelejaid. See aitab ühtlasi kõnetuvastuse kvaliteeti parandada. Tekstiks.ee on samuti võimeline erinevaid kõneakte välja tooma. Selles valdkonnas võitsime hiljuti ühe võistluse, mille eesmärk oligi ennustada keelt või seda, kas keel on jäänud samas vestluses samaks. Samuti tegeleme teksti struktureerimise ja lõppotstarbe jaoks kohandamisega, subtiitritega. Nii et kui me praegu vestleme, siis suudab salvestav seade eristada mind kui küsijat ja sind kui vastajat? Süsteem on täpsem, kui talle ette öelda, et kõnelejaid on kaks. Igal juhul üritab ta rühmitada helitükke sarnasteks hulkadeks ning ennustab kõnelejate arvu, et jagada seejärel nende vahel ära helitükid. Kas keskendute oma töös eelkõige eesti keelele? Mitte tingimata. Tihti aitab publitseerimisele kaasa see, kui oleme teinud midagi laiemalt kasulikku. Aga kui suudame tehisintellektiga suhelda eesti keeles, peame vähem kasutama inglise või mõnda muud keelt, millel on kasutada paremad nn kommertslikud tooted. Suured korporatsioonid ei fookusta ju alla miljoni kõnelejaga keeltele. Selleks, et meil oleksid eesti keelele toetuvad alternatiivid, mis võimaldaksid meie keelt rohkem kasutada, peame ise rohkem pingutama. Olen laborijuhataja Tanel Alumäega ühte meelt, et peaksime ise panustama, et eestikeelsed treeningandmed oleksids tasuta või mõistliku tasu eest lihtsalt kättesaadavad. Sest kui andmed on kättesaadavad, lisavad suured ettevõtted, kelle jaoks pole me keel prioriteetne, enda praktikatesse eesti keele toe. Tartu Ülikoolis ollakse samal seisukohal. Missugused need treeningandmed on? Kust nad pärinevad? Kõnetuvastuse puhul on see heli või tekstiga kõrvutatud heli, kusjuures tekst võib toimida sõna, aga ka hääliku täpsusega. Samuti tõlkekorpused, milles on kõtvuti ingliskeelne tekst ja eestikeelne tõlge. Iga keeletehnoloogia probleemiga tegelemiseks on olemas omad võrdluskorpused. Teatud otstarbeks sobib juba see, kui on olemas lihtsalt heli, teisel juhul piisab tekstiks. Samuti on hea, kui heli ja tekst on omavahel joondatud. Meie ise toetume vägagi suures oas ETV arhiivile. Andmed ei pea tingimata olema tasuta kättesaadavad, aga kui neid saaks mõistliku ja kindla tasu eest kasutada, oleks huvilisi palju. Muidu jäädakse andmeid lihtsalt internetist kaevandama – kui need vähegi leitavad on. Mida kõnetuvastatud tekstiga edasi teha? Tihti on vaja kõneakte analüüsida, teha näiteks koosoleku kokkuvõtteid, jõuda räägitu põhjal järeldusteni. Tõsi, niisuguste kokkuvõtete tegemist oli varem päris keeruline uurida, ent suurte keelemudelite arengu käigus on see probleem peaaegu ära lahendatud. Kokkuvõtteid  saaks täiendava treenimisega veel paremaks timmida, aga sageli pole see enam õigustatud. Suudame lisada helile või videole kõiksugu subtiitreid, kasvõi selleks, et andmed oleksid kuulmispuudega inimestele kättesaadavad. Ülikoolis saab hakata loengud sel moel alternatiivselt kasutama, neile tekib juurdepääs inimestel, kelle eesti keel pole veel nii hea. Ühesõnaga, teksti otstarbekuse areaal kasvab, kui seda on lihtsam otsida ja töödelda, või kui seda on võimalik kiiremini haarata, kui heli saab võimalikult suure täpsusega tekstiks pöörata. Et kaitsta doktoritööd, peab see olema unikaalne. Samas töötab su valdkonnas nii Tehnikaülikoolis, Tartus kui ka üle terve maailma rohkelt teadlasi. Kui lihtne või raske on niisugustes tingimustes midagi uut luua? Meie valdkond elab pidevalt läbi suuri muutusi, teatud uurimisvaldkonnad võivad kiiresti tekkida ja ka kaduda. Võtame kas või sellesama kõnetuvastuse, meie labori põhifookuse – suurte keelte mudelid suudavad sisestada endisse juba nii teksti, heli, pilti kui ka videot. Need teevad seda nii hästi, et varsti võib-olla polegi eraldi kõnetuvastuse moodulit vaja. Siiski näen, et kui töötada väikeste kõnetuvastustükkidega eesti või mõnes muus väiksemas keeles ning oma arvutis või mobiilis, säilitavad need veel pikaks ajaks oma efektiivsuse. Publitseerimine on sellises virvarris ilmselt raskendatud? Ühe minu artikli avaldamiseks kulus kolm aastat. Tihti võib aga aasta või isegi pool sellest olla juba liiga pikk aeg, valdkond liigub aina edasi, keegi teine lahendab vahepeal probleemi. Õnneks on meil nii TalTechis kui ka Tartus arvutusvõimsust ning ligipääs Lumi superarvutile. Jah, me ei hakka siin päris suuri keelemudeleid algusest peale treenima, mõne probleemiga me ei saagi tegeleda. Samas on ka valdkondi, mille puhul pole eesti keel küll keskne, aga milles saame olla väga head. Aastate jooksul kogetud võistluste edu näitab, et suudame leida unikaalseid lahendusi. Kogu teadusvaldkond ongi uuenduslikkuse poole tugevalt kaldu. Kui korrata kellegi teise tehtud avastust, pole sel sisulist väärtust. Sa pead kogu aeg midagi uut välja mõtlema ning sellealast teavet avaldama. Ja see, et meie teadlastel õnnestub ikkagi avaldada, näitab, et TalTechis tehakse midagi olulist. Kui kaugel oled sa oma doktorikraadiga? Mul oli varasemast kaks vastuvõetud artiklit, seejärel aga läksid neli esitamist järjest vett vedama. Nüüd õnnestus mul esitada nelja kuuga neli artiklit ja esialgse info põhjal tundub, et vähemasti kolm neist võetakse vastu. Aga taas häda – need on liiga erinevad! Doktoritöö lõpetamiseks läheb vaja kolme seotud artiklit, nii et mul on tõenäoliselt pean kirjutama veel ühe … Seega jah, olen lõpusirgel, aga lõputööd veel ei kirjuta. Doktoritöö teema on sul samuti mitu korda muutunud. On see pigem hea või halb? See on täiesti paratamatu. 2021. aastal ei saanudki ma seada endale praegust sihti. Probleem, mida teha siis, kui eestikeelne kõneleja pikib oma jutu vahele ingliskeelset teksti, on lahenenud. Sellega olnuks tarbetu edasi tegeleda. See-eest saan nüüd töö kiirendamiseks kasutada suuri keelemudeleid. See muutis täielikult mu ambitsiooni – seda, mida ma kas üksinda või väikese tiimiga teha suudan. Milline roll on juhendajal? Eestil on vedanud, et meil on professor Tanel Alumäe, kes on nii pikalt selles valdkonnas tegut­senud, kõnetuvastust aina paremaks muutnud ega ole midagi pooleli jättes mõne ettevõtte palgale läinud. Meil on loodud võimalus uurida probleeme ning katsetada vähegi asjakohaseid ideid. Ja samas on juhendaja alati nõu andmas või konverentsidel käimist toetamas. Mul on olnud väga suur privileeg töötada sedavõrd kompetentse professori käe all. Kui mul on küsimusi, kui ma valin mingit suunda või kui me kirjutame koos artiklit, saan temalt enamasti hinnangu, mida ja kuidas tasub üldse teha. See on ära hoidnud palju mõttetut rapsimist – doktorant vajabki tippteadusega täiesti kursis olevalt juhendajalt kiiret tagasisidet, et ta ei liiguks liiga kaua vales suunas. Tanel Alumäele sobivad ettevõtlikud doktorandid, üldse töötajad, keda iseloomustab tugev isiklik huvi asju uurida, paremaks teha. Minagi ei tegele ainult ühe artikliga, vaid treenin mitut mudelit, muudan asju paremaks. Sageli mul on käsil kolm-neli tööd korraga – lihtsalt isiklikust huvist, mitte sellepärast, et doktoritöö kiiremini ära teha. Sinagi pole pääsenud pettumusteta. Mu algne suund oli teha midagi kahe teadusvaldkonna vahelist, arendasin koos Tallinna Ülikooli teadlastega inimese ja arvuti interaktsiooni. Töö pidi ühendama keeletehnoloogiaid ja kasutama osalusdisaini meetodit. See ebaõnnestus, ma ei mõistnud toda valdkonda piisavalt, kasutasime kvalitatiivseid meetodeid, aga need pole minu valdkonnas tüüpilised. Kummalgi pool ei tuntud lõpuks meie töö vastu huvi. Võtsin selle järel väikese mõtlemispausi. Aga olen taas siin, kaasas nüüd juba suhteliselt suur ebaõnnestumiste ja õnnestumiste pagas. Kuidas paistab sulle kraadi kaitsmisele järgnev tulevik? Mulle pakub mu valdkond üha rohkem huvi, näen, et seda on tõesti tarvis. Võtkem kas või needsamad koosolekud, eri valdkondade, olgu siis meditsiini, juuridika või riigiasutuste transkriptsioonid ja kokkuvõtted, mille puhul ei tohi kasutada mujal majutatud suuri keelemudeleid ja pilveteenuseid. Seal oleks vaja erialaseid, eesti keelel töötavaid lahendusi. Siis veel kõnesüntees ehk tehiskõne. Nüüd kõlab see juba nagu räägiks sinuga eestlane, pealegi erineva häälega. Aga siingi on oma ohud, mille kohta võime lugeda ajakirjanduse krimikülgedelt. Kui ma ka mõne aasta pärast enam ülikoolis ei tööta, jääb mu tulevik ikkagi teadusega seotuks. Kindlasti kasutan teaduslikke meetodeid ja mõõtmisi, et hinnata objektiivselt, kas miski läks paremaks. Võib-olla teen seda mõnes ettevõttes, võib-olla isegi enda omas. Oled väitnud, et tehisaru ei asenda mõtlemist, vaid võib seda ainult võimendada. Jah, tänapäeval muudab tehisaru teatud asjad palju lihtsamaks, aga seda vaid niikaua, kuni ise kaasa mõtled, samal ajal õpid. Ainult siis, kui lased tehisarul endale midagi õpetada, suudad õppida kiiremini, saad üle alguses keerulisetki tunduvatest asjadest. Kui vaatan oma teekonda, siis arvan, et oleksin jõudnud varem IT-sse, kui mu kõrval olnuks keegi, kes suutnuks rasked küsimused selgeks teha. Näiteks tehisaru. Mul oli hiljuti vaja kirjutada kakssada sõna inglise keeles, milles suured keelemudelid peaks olema väga võimekad. Aga mul läks vähemalt kuus tundi, et neid kahtsadat sõna viimistleda. Jah, tehisintellekt aitab leida infot, fakte, korrigeerib keelt. Aga kui sa lased tal lihtsalt kirjutada, annad vajaliku info ette, võib ta igas lauses kirjutada ikkagi seda, mis tundub talle tõenäoline. Sest keelemudelid ongi treenitud ennustama järgmist kõige tõenäolisemat sõna. Tihti ei taipa nad hakata fakte kontrollima, kirjutavad inimesest erinevalt. Nad ei hinda asju meiega identselt. Koodi kirjutamisel meeldib mulle aga see, kui süsteem mõtleb teistmoodi kui mina. Me täiendame üksteist. Tehisintellekt on ju lihtsalt töövahend, mis aitab asju kiiremini teoks teha. Talle peab andma täpse suuna, loodut kontrollima, valideerima. Teda peab pidevalt suunama, sest ta jookseb üliinimlikul kiirusel ühes suunas, toodab meeletu kiirusega koodi, aga kui ta hakkab vales suunas kihutama … Neile, kes säilitavad mõtlemisvõime ja suhtuvad kriitilisest sellesse, mida TI-vahendid toodavad, võib ta olla väga suureks abiks. Aga need, kes muutuvad liiga mugavaks ja usaldavaks, võivad sattuda eksiteele või kontrollimata infot levitades lausa häbiväärsesse olukorda. Usalda, kuid kontrolli – see ütlus on taas asjakohane. Paraku jah, suured keelemudelid on sellise arhitektuuriga, et mõtlevad ise asju välja ega kontrolli alati fakte. Neid on küll üha enam võimalik suunata oma väljundit üle vaatama, aga veel pole näha, et inimese saaks siin kõrvale heita. Hiljuti tegime ühe katse ja kirjutasime sellest teadusartikli. Lasime tehisaruagendil etteantud metoodika ja andmete põhjal teha järeldused, palusime neid võrrelda ja mitmel korral ümber teha. Jah, me jõudsime niiviisi lõpptulemuseni palju kiiremini. Aga ikkagi vajasime eksperti, kes kogu väljundi üle vaataks, et lõpptulemus oleks selline, millele meie oleksime teadlastena valmis tehtule oma nimed alla panema; ütlema, et jah, tulemus on niisugune, milleni oleksime ka ise, omal käel jõudnud, võib-olla lihtsalt paar nädalat hiljem. Kuidas on võimalik, et inimene on meisterdanud valmis millegi, mis ei mõtle sugugi nii nagu tema ise? Tehisaru meenutab küll lahenduselt aju arhitektuuro, aga ta on ikkagi selle väga lihtsustatud vorm. Tõsi, neid treenitakse näidetega, kuidas inimesed kirjutavad, kuidas koodi kirjutavad, kuidas disainivad. Neid peenhäälestatakse kõvasti, et tulemus inimestele meeldiks, et see vastaks seatud kvaliteedile. Aga põhimõtteliselt töötavad nad ikka inimestest erinevalt. Need statistilised-matemaatilised mudelid võtavad ühe sõna korraga, ennustavad kogu varasema konteksti alusel järgmist sõna. Inimene aga ei suuda töötada nii, et talle antakse ülesanne ja juhis, kuidas seda ülesannet lahendada, ja siis ta ainult nendest lähtubki. Inimene ehitab väga väheste kogemuste alusel endale arusaama maailmast, sellest, kuidas asjad toimivad. Kuhu me tehisaru abil teel oleme? On juba väga mõistlik arvutiga hääle abil rääkida. Võib-olla mitte terve päeva vältel, et oma häält liigselt väsitada, aga kõnetuvastus on ingliskeelsetesse TI-vahenditesse juba sisse ehitatud. Kindlasti aitab see aega säästa. Eks tehisaruvaldkond otsib pidevalt uusi rakendusvõimalusi, et õigustada andmekeskuste ehitamist, suurt treenimist ja tehtavaid kulutusi. Kindlasti hakatakse seda aina rohkem kasutama. Kuigi paljudes valdkondades on see raske, kuna pole tagasisidestamise võimalust ega hästi kättesaadavaid andmeid. Pealegi pole mudeleid treenivatel inimestel nendes valdkondades ekspertiisi. Nad ostavad treeningandmed kusagilt sisse … Ja siiski saabub päev, millal tehisaru su eest kõik ära teeb. Praegugi on väga raske kõikidest võimalustest üldse veel aru saada. Kuigi mind huvitabki ennekõike see, mis on hetkel võimalik. Arvan, et olen Tehnikaülikoolis üks suuremaid TI kasutajaid. Me peamegi õppima neid asju kasutama, tunnistama, et nad töötavadki täiesti teistmoodi ega saa ise oma vigadest aru. Tehisaru on ilma igasuguse mäluta, iga päev nagu uus. Põhimõtteliselt algab iga vestlus temaga puhtalt lehelt. Iga päring, mille ta teeb, võib toimuda hoopis teises andmekeskuses, kus vestluse tulemust talletatakse võib-olla ainult viis minutit või üks tund. Pärast seda on see kõik läinud. Tuleb päris kaua harjutada ja kogemusi koguda, et õppida tehisaru vajadusel usaldama või temasse ettevaatlikult suhtuma. Kas tehisaru loob sinu hinnangul eelise suurematele või väiksematele kooslustele või ettevõtetele? Kindlasti on üksi või väikese tiimiga võimalik tehisintellekti abil palju rohkem ära teha. Eriti varases faasis, kui alles mõtled uut toodet luua, soovid aru saada, mis on mis, millist teenust oleks kasulik pakkuda. Siis saad otsekui kesktasemel eksperdi käest nõu küsida või talle ülesandeid delegeerida ega pea väikeses ettevõttes kohe kõiki rolle mehitama. Kui oled julge, siis lased tal luua juriidilised dokumendid, koostada valdkonna analüüse, valmistada toodete prototüüpe – ja seda küllalt kiiresti. Kui sul on hiljem vaja head kvaliteeti, palkad tõenäoliselt inimeksperdi. Kasvõi turundussõnumite jaoks, sest kõik ju saavad aru, kui oled tehisaru kasutanud. Mulle endale meeldibki tehisaru just prototüüpimise ja katsetamise faasis. Teen ju tihti asju, milles ma ei ole veel täiesti kompetentne. Siis saan tehisarult nõu küsida. Tema astub minu eest mitu sammu, hiljem saan otsustada, kas läbitud suund on mõistlik või mitte. Mina saan paljut kiiresti katsetada ja seejärel otsustada, kas tahan millestki veel rohkem teada saada, kas see on mulle oluline. Siis ma kas muudan tulemuse paremaks või jätan selliseks, nagu tehisaru selle tegi, ja keskendun millegi muule. Minu töös kulub eksperimenteerimisele niiviisi palju vähem aega. Ja sama põhimõtet saab rakendada ka äris. Anna üks soovitus ka tänastele lõpetajatele. Soovitan lõpetajatel mitte karta oma fookust muuta ega uuesti õppima hakata. Uutest tööriistadest, eriti tehisarust, võib olla väga palju abi, aga ainult siis, kui säilitate kriitilise mõtlemise. Kasutage neid julgelt, kuid ärge usaldage neid pimesi. Edu tuleb uudishimust, katsetamisest ja soovist oma tegevust süvitsi mõista. Edu keelemudelite võistlustel Interspeech 2026 konverentsi raames toimunud võistlusel Audio Reasoning Challenge võitsime koos prof Tanel Alumäega Agent Tracki osa. Ülesanne oli ehitada agent, mis lahendab 1000 heli mõistmise ülesannet. Kasutada võis kõike vabavaralist. Võit tuli ka TidyLang Challenge Odyssey 2026 konverentsi raames peetud võistlusel. Seal tuli tuvastada kõneldavat keelt või verifitseerida, kas räägitakse samas keeles, kusjuures enamikes kõnenäidetes rääkisid inimesed mitte emakeeles, mistõttu tuli tulla toime aktsentidega.
Keeletehnoloogia teadlasena otsib Aivo Olev lahendusi, mis jõuaksid laborist päris kasutusse. Näidetena nimetab ta Tekstiks.ee teenust ja vabavaralist Jutukuva tarkvara. Foto: Karl-Kristjan Nigesen

Keeletehnoloogia teadlasena otsib Aivo Olev lahendusi, mis jõuaksid laborist päris kasutusse. Näidetena nimetab ta Tekstiks.ee teenust ja vabavaralist Jutukuva tarkvara. Foto: Karl-Kristjan Nigesen

Artikkel ilmus ajakirjas Mente et Manu nr. 1908

TalTechi doktorant-nooremteadur Aivo Olev usub, et tehisaru võib anda tööle suure hoo, kuid ainult siis, kui inimene ise kaasa mõtleb, tulemusi kontrollib tulemusi ja nende eest vastutab.

Tallinna Tehnikaülikooli doktorant-nooremteadur Aivo Olev on valinud oma valdkonnaks keeletehnoloogia, milles kogetakse praegu kiireid muutusi. Majandust, psühholoogiat ja korduvalt IT-d õppinud teadlane töötas aastaid õpingute kõrvalt ettevõtetes ning leidis seejärel enda koha teaduses.

Valdkonna kiire arengu tõttu on kõnetuvastusega tegelev Olev pidanud muutma oma doktoritöö fookust, aga tema lahendused on võitnud suuri võistlusi. Kõnetuvastusmudelid, mis mõistavad muuhulgas estonglish’it ja mitmesuguseid aktsente, leiavad kiiresti praktilise väljundi, mis on tema jaoks teaduse juures tähtis.

Oled doktoriõppes 2021. aastast. Tõsi, väikese vaheajaga. Kuidas oled enda jaoks sõnastanud teadustöö mõtte?

Teadustöö tähendab vaevelda kitsas valdkonnas spetsiifilise probleemi kallal ja otsida sellele lahendusi, eelduseks ala laiem tundmine.

Õnneks on minu valdkonna doktorantidel väga suur vabadus ise probleeme valida. Jah, osaliselt sõltub valik rahastusallikast, aga praktikas olen ma alati saanud tegeleda just minule huvipakkuvate ja ühtlasi praktiliste teemadega. Arvestatav osa mu väljundist ongi läinud praktilisse kasutusse, tasub mainida kas või kõnetuvastuse teenust Tekstiks.ee ja vabavaralise kõnetuvastuse tarkvara Jutukuva.

Sel aastal oleme kasutanud ideede katalüsaatorina võistlusi, mille kaudu on toodud meile konkreetsed probleemid lausa kandikul ette. Hiljuti ehitasin tarkvara kirjeldustõlkidele ja vaegkuuljatele. See muudab reaalajalise kõnetuvastusmudeli otseselt kasulikuks.

Kas sa unistasid juba lapsena teadlaseks saada?

Seda mitte. Aga kuna mu mõlemal vanemal oli kõrgharidus, teadsin alati, et ülikooli pean minema. Mul võttis lihtsalt aega, et oma eriala leida.

Isa kaudu olin juba väiksena puutunud kokku arvutitega, mistõttu maandusingi pärast keskkooli IT kolledžis, kuigi püsisin seal ainult ühe aasta. Seejärel läksin Tartu Ülikooli, õppisin majandust, hiljem psühholoogiat. Lõpetasingi psühholoogia bakalaureusetaseme. Lõpuks asusin siiski IT-tööle.

Kaheksa aastat hiljem jõudsin taas ülikooli, seekord TalTechi. Valisin magistritööks väga praktilise kõnetuvastuse platvormi, mis nüüd, seitse aastat hiljem, on Tekstiks.ee veebilehel kõigile kättesaadav.

Selle tulemusena kutsus mu juhendaja professor Tanel Alumäe mind ülikooli ning poolteist aastat pärast magistriõppe lõpetamist tulin doktorandina TalTechi tagasi. Alles siis tekkis tõsine huvi teadust teha.

Miks magistriõpinguteni nii kaua läks?

Töötasin aastaid tarkvaraarendusprojektides analüütikuna, olin tellijate ja programmeerijate vaheline ühenduslüli. Ajapikku sain aga aru, et tahaksin teada rohkem teada sellest, kuidas tarkvara tegelikult tehakse. Hakkasin ennast harima ja samas tundsin ka, et äkki kaob see eriala hoopis ära …

Ma ei soovinud jääda kinni ühte rolli, tahtsin avardada oma arusaamu, rohkendada kompetentse. Nii tulingi magistriõppesse, et saada võib-olla programmeerijaks, teha väike kannapööre.

Aivo Olevi hinnangul ei asenda tehisaru mõtlemist, vaid võib seda võimendada – kui inimene säilitab kriitilise hoiaku. Foto: Karl-Kristjan Nigesen

Aivo Olevi hinnangul ei asenda tehisaru mõtlemist, vaid võib seda võimendada – kui inimene säilitab kriitilise hoiaku. Foto: Karl-Kristjan Nigesen

Kuidas TalTechist saadud haridust hindad?

Magistrantuuris hakkasin esimest korda ülikooli nautima! Suutsin seostada õpingud seniste kogemustega, mis tundus väga põnev.

Tõsi, ma ei saanud kohe informaatikasse astuda, sest mul polnud reaalainete bakalaureust. Tulin äriinfotehnoloogiasse ja pärast esimest semestrit vahetasin eriala. Töö kõrvalt õnnestus õpingud lõpetada nominaalaja ehk kahe aastaga. Ja cum laude’ga.

Räägitakse, et IT-s on hästi suured palgad ja ülikoolis mitte. Oled sissetulekus kõvasti kaotanud?

Ei, minu palk polnud varem märkimisväärselt suurem kui nüüd doktorantuuris. Ma ei pidanud doktorandiks tulles oma elus midagi muutma.

Kõnetuvastus, millega tegeled, tundub esmapilgul lihtne: paneme seadme salvestama, see tuvastab kõne, muudab selle tekstiks. Sedasama teeme vesteldes praegugi. Mis seal siis keerulist on?

Keeruliseks muudab asja tehisintellekt (TI). Meie valdkonnas on üle mindud mudelitele, mida treenitakse algusest lõpuni puhtalt andmete pealt. See eeldab ühelt poolt häid andmeid, teisalt sobivat arhitektuuri, mida saab nende andmetega hästi treenida. Sageli kasutame mudeleid, mida on treenitud teistel keeltel.

Mu doktorantuuri tuleku hetkel peeti suureks probleemiks, et eesti keelt kiputi inglise keelega segama, kasutati võõrväljendeid, mida hääldati vahel eesti-, vahel inglispäraselt. Nüüd on mitme keele toel eeltreenitud mudelid selle takistuse peaaegu kaotanud. Mudel ise teab, millal missuguse keele sõnavara kasutada.

Tahame, et mudel suudaks eristada erinevaid kõnelejaid. See aitab ühtlasi kõnetuvastuse kvaliteeti parandada. Tekstiks.ee on samuti võimeline erinevaid kõneakte välja tooma.

Selles valdkonnas võitsime hiljuti ühe võistluse, mille eesmärk oligi ennustada keelt või seda, kas keel on jäänud samas vestluses samaks. Samuti tegeleme teksti struktureerimise ja lõppotstarbe jaoks kohandamisega, subtiitritega.

Nii et kui me praegu vestleme, siis suudab salvestav seade eristada mind kui küsijat ja sind kui vastajat?

Süsteem on täpsem, kui talle ette öelda, et kõnelejaid on kaks. Igal juhul üritab ta rühmitada helitükke sarnasteks hulkadeks ning ennustab kõnelejate arvu, et jagada seejärel nende vahel ära helitükid.

Aivo Olev vestlemas loo autoriga TalTechi raamatukogus. Foto: Karl-Kristjan Nigesen

Aivo Olev vestlemas loo autoriga TalTechi raamatukogus. Foto: Karl-Kristjan Nigesen

Kas keskendute oma töös eelkõige eesti keelele?

Mitte tingimata. Tihti aitab publitseerimisele kaasa see, kui oleme teinud midagi laiemalt kasulikku.

Aga kui suudame tehisintellektiga suhelda eesti keeles, peame vähem kasutama inglise või mõnda muud keelt, millel on kasutada paremad nn kommertslikud tooted. Suured korporatsioonid ei fookusta ju alla miljoni kõnelejaga keeltele. Selleks, et meil oleksid eesti keelele toetuvad alternatiivid, mis võimaldaksid meie keelt rohkem kasutada, peame ise rohkem pingutama.

Olen laborijuhataja Tanel Alumäega ühte meelt, et peaksime ise panustama, et eestikeelsed treeningandmed oleksids tasuta või mõistliku tasu eest lihtsalt kättesaadavad. Sest kui andmed on kättesaadavad, lisavad suured ettevõtted, kelle jaoks pole me keel prioriteetne, enda praktikatesse eesti keele toe. Tartu Ülikoolis ollakse samal seisukohal.

Missugused need treeningandmed on? Kust nad pärinevad?

Kõnetuvastuse puhul on see heli või tekstiga kõrvutatud heli, kusjuures tekst võib toimida sõna, aga ka hääliku täpsusega. Samuti tõlkekorpused, milles on kõtvuti ingliskeelne tekst ja eestikeelne tõlge.

Iga keeletehnoloogia probleemiga tegelemiseks on olemas omad võrdluskorpused. Teatud otstarbeks sobib juba see, kui on olemas lihtsalt heli, teisel juhul piisab tekstiks. Samuti on hea, kui heli ja tekst on omavahel joondatud. Meie ise toetume vägagi suures oas ETV arhiivile.

Andmed ei pea tingimata olema tasuta kättesaadavad, aga kui neid saaks mõistliku ja kindla tasu eest kasutada, oleks huvilisi palju. Muidu jäädakse andmeid lihtsalt internetist kaevandama – kui need vähegi leitavad on.

Mida kõnetuvastatud tekstiga edasi teha?

Tihti on vaja kõneakte analüüsida, teha näiteks koosoleku kokkuvõtteid, jõuda räägitu põhjal järeldusteni.

Tõsi, niisuguste kokkuvõtete tegemist oli varem päris keeruline uurida, ent suurte keelemudelite arengu käigus on see probleem peaaegu ära lahendatud. Kokkuvõtteid  saaks täiendava treenimisega veel paremaks timmida, aga sageli pole see enam õigustatud.

Suudame lisada helile või videole kõiksugu subtiitreid, kasvõi selleks, et andmed oleksid kuulmispuudega inimestele kättesaadavad. Ülikoolis saab hakata loengud sel moel alternatiivselt kasutama, neile tekib juurdepääs inimestel, kelle eesti keel pole veel nii hea.

Ühesõnaga, teksti otstarbekuse areaal kasvab, kui seda on lihtsam otsida ja töödelda, või kui seda on võimalik kiiremini haarata, kui heli saab võimalikult suure täpsusega tekstiks pöörata.

TalTechi doktorant-nooremteadur Aivo Olev tegeleb keeletehnoloogia ja kõnetuvastusega valdkonnas, mis muutub praegu erakordse kiirusega. Foto: Karl-Kristjan Nigesen

TalTechi doktorant-nooremteadur Aivo Olev tegeleb keeletehnoloogia ja kõnetuvastusega valdkonnas, mis muutub praegu erakordse kiirusega. Foto: Karl-Kristjan Nigesen

Et kaitsta doktoritööd, peab see olema unikaalne. Samas töötab su valdkonnas nii Tehnikaülikoolis, Tartus kui ka üle terve maailma rohkelt teadlasi. Kui lihtne või raske on niisugustes tingimustes midagi uut luua?

Meie valdkond elab pidevalt läbi suuri muutusi, teatud uurimisvaldkonnad võivad kiiresti tekkida ja ka kaduda. Võtame kas või sellesama kõnetuvastuse, meie labori põhifookuse – suurte keelte mudelid suudavad sisestada endisse juba nii teksti, heli, pilti kui ka videot. Need teevad seda nii hästi, et varsti võib-olla polegi eraldi kõnetuvastuse moodulit vaja.

Siiski näen, et kui töötada väikeste kõnetuvastustükkidega eesti või mõnes muus väiksemas keeles ning oma arvutis või mobiilis, säilitavad need veel pikaks ajaks oma efektiivsuse.

Publitseerimine on sellises virvarris ilmselt raskendatud?

Ühe minu artikli avaldamiseks kulus kolm aastat. Tihti võib aga aasta või isegi pool sellest olla juba liiga pikk aeg, valdkond liigub aina edasi, keegi teine lahendab vahepeal probleemi.

Õnneks on meil nii TalTechis kui ka Tartus arvutusvõimsust ning ligipääs Lumi superarvutile.

Jah, me ei hakka siin päris suuri keelemudeleid algusest peale treenima, mõne probleemiga me ei saagi tegeleda. Samas on ka valdkondi, mille puhul pole eesti keel küll keskne, aga milles saame olla väga head. Aastate jooksul kogetud võistluste edu näitab, et suudame leida unikaalseid lahendusi.

Kogu teadusvaldkond ongi uuenduslikkuse poole tugevalt kaldu. Kui korrata kellegi teise tehtud avastust, pole sel sisulist väärtust. Sa pead kogu aeg midagi uut välja mõtlema ning sellealast teavet avaldama. Ja see, et meie teadlastel õnnestub ikkagi avaldada, näitab, et TalTechis tehakse midagi olulist.

Kui kaugel oled sa oma doktorikraadiga?

Mul oli varasemast kaks vastuvõetud artiklit, seejärel aga läksid neli esitamist järjest vett vedama. Nüüd õnnestus mul esitada nelja kuuga neli artiklit ja esialgse info põhjal tundub, et vähemasti kolm neist võetakse vastu. Aga taas häda – need on liiga erinevad!

Doktoritöö lõpetamiseks läheb vaja kolme seotud artiklit, nii et mul on tõenäoliselt pean kirjutama veel ühe … Seega jah, olen lõpusirgel, aga lõputööd veel ei kirjuta.

Doktoritöö teema on sul samuti mitu korda muutunud. On see pigem hea või halb?

See on täiesti paratamatu. 2021. aastal ei saanudki ma seada endale praegust sihti. Probleem, mida teha siis, kui eestikeelne kõneleja pikib oma jutu vahele ingliskeelset teksti, on lahenenud. Sellega olnuks tarbetu edasi tegeleda.

See-eest saan nüüd töö kiirendamiseks kasutada suuri keelemudeleid. See muutis täielikult mu ambitsiooni – seda, mida ma kas üksinda või väikese tiimiga teha suudan.

Kõnetuvastuse ja suurte keelemudelite areng on muutnud ka Olevi doktoritöö fookust: kiiresti arenevas valdkonnas võib uurimisteema paari aastaga sisuliselt ümber sündida. Foto: Karl-Kristjan Nigesen

Kõnetuvastuse ja suurte keelemudelite areng on muutnud ka Olevi doktoritöö fookust: kiiresti arenevas valdkonnas võib uurimisteema paari aastaga sisuliselt ümber sündida. Foto: Karl-Kristjan Nigesen

Milline roll on juhendajal?

Eestil on vedanud, et meil on professor Tanel Alumäe, kes on nii pikalt selles valdkonnas tegut­senud, kõnetuvastust aina paremaks muutnud ega ole midagi pooleli jättes mõne ettevõtte palgale läinud.

Meil on loodud võimalus uurida probleeme ning katsetada vähegi asjakohaseid ideid. Ja samas on juhendaja alati nõu andmas või konverentsidel käimist toetamas.

Mul on olnud väga suur privileeg töötada sedavõrd kompetentse professori käe all. Kui mul on küsimusi, kui ma valin mingit suunda või kui me kirjutame koos artiklit, saan temalt enamasti hinnangu, mida ja kuidas tasub üldse teha. See on ära hoidnud palju mõttetut rapsimist – doktorant vajabki tippteadusega täiesti kursis olevalt juhendajalt kiiret tagasisidet, et ta ei liiguks liiga kaua vales suunas.

Tanel Alumäele sobivad ettevõtlikud doktorandid, üldse töötajad, keda iseloomustab tugev isiklik huvi asju uurida, paremaks teha. Minagi ei tegele ainult ühe artikliga, vaid treenin mitut mudelit, muudan asju paremaks. Sageli mul on käsil kolm-neli tööd korraga – lihtsalt isiklikust huvist, mitte sellepärast, et doktoritöö kiiremini ära teha.

Sinagi pole pääsenud pettumusteta.

Mu algne suund oli teha midagi kahe teadusvaldkonna vahelist, arendasin koos Tallinna Ülikooli teadlastega inimese ja arvuti interaktsiooni.

Töö pidi ühendama keeletehnoloogiaid ja kasutama osalusdisaini meetodit. See ebaõnnestus, ma ei mõistnud toda valdkonda piisavalt, kasutasime kvalitatiivseid meetodeid, aga need pole minu valdkonnas tüüpilised. Kummalgi pool ei tuntud lõpuks meie töö vastu huvi. Võtsin selle järel väikese mõtlemispausi. Aga olen taas siin, kaasas nüüd juba suhteliselt suur ebaõnnestumiste ja õnnestumiste pagas.

Kuidas paistab sulle kraadi kaitsmisele järgnev tulevik?

Mulle pakub mu valdkond üha rohkem huvi, näen, et seda on tõesti tarvis. Võtkem kas või needsamad koosolekud, eri valdkondade, olgu siis meditsiini, juuridika või riigiasutuste transkriptsioonid ja kokkuvõtted, mille puhul ei tohi kasutada mujal majutatud suuri keelemudeleid ja pilveteenuseid. Seal oleks vaja erialaseid, eesti keelel töötavaid lahendusi.

Siis veel kõnesüntees ehk tehiskõne. Nüüd kõlab see juba nagu räägiks sinuga eestlane, pealegi erineva häälega. Aga siingi on oma ohud, mille kohta võime lugeda ajakirjanduse krimikülgedelt.

Kui ma ka mõne aasta pärast enam ülikoolis ei tööta, jääb mu tulevik ikkagi teadusega seotuks. Kindlasti kasutan teaduslikke meetodeid ja mõõtmisi, et hinnata objektiivselt, kas miski läks paremaks. Võib-olla teen seda mõnes ettevõttes, võib-olla isegi enda omas.

Aivo Olevi enda tee teadusesse ei olnud sirgjooneline: enne keeletehnoloogiat õppis ta majandust, psühholoogiat ja IT-d ning töötas tarkvaraarenduse projektides. Foto: Karl-Kristjan Nigesen

Aivo Olevi enda tee teadusesse ei olnud sirgjooneline: enne keeletehnoloogiat õppis ta majandust, psühholoogiat ja IT-d ning töötas tarkvaraarenduse projektides. Foto: Karl-Kristjan Nigesen

Oled väitnud, et tehisaru ei asenda mõtlemist, vaid võib seda ainult võimendada.

Jah, tänapäeval muudab tehisaru teatud asjad palju lihtsamaks, aga seda vaid niikaua, kuni ise kaasa mõtled, samal ajal õpid. Ainult siis, kui lased tehisarul endale midagi õpetada, suudad õppida kiiremini, saad üle alguses keerulisetki tunduvatest asjadest.

Kui vaatan oma teekonda, siis arvan, et oleksin jõudnud varem IT-sse, kui mu kõrval olnuks keegi, kes suutnuks rasked küsimused selgeks teha. Näiteks tehisaru.

Mul oli hiljuti vaja kirjutada kakssada sõna inglise keeles, milles suured keelemudelid peaks olema väga võimekad. Aga mul läks vähemalt kuus tundi, et neid kahtsadat sõna viimistleda.

Jah, tehisintellekt aitab leida infot, fakte, korrigeerib keelt. Aga kui sa lased tal lihtsalt kirjutada, annad vajaliku info ette, võib ta igas lauses kirjutada ikkagi seda, mis tundub talle tõenäoline. Sest keelemudelid ongi treenitud ennustama järgmist kõige tõenäolisemat sõna. Tihti ei taipa nad hakata fakte kontrollima, kirjutavad inimesest erinevalt. Nad ei hinda asju meiega identselt.

Koodi kirjutamisel meeldib mulle aga see, kui süsteem mõtleb teistmoodi kui mina. Me täiendame üksteist. Tehisintellekt on ju lihtsalt töövahend, mis aitab asju kiiremini teoks teha. Talle peab andma täpse suuna, loodut kontrollima, valideerima. Teda peab pidevalt suunama, sest ta jookseb üliinimlikul kiirusel ühes suunas, toodab meeletu kiirusega koodi, aga kui ta hakkab vales suunas kihutama …

Neile, kes säilitavad mõtlemisvõime ja suhtuvad kriitilisest sellesse, mida TI-vahendid toodavad, võib ta olla väga suureks abiks. Aga need, kes muutuvad liiga mugavaks ja usaldavaks, võivad sattuda eksiteele või kontrollimata infot levitades lausa häbiväärsesse olukorda.

Usalda, kuid kontrolli – see ütlus on taas asjakohane.

Paraku jah, suured keelemudelid on sellise arhitektuuriga, et mõtlevad ise asju välja ega kontrolli alati fakte. Neid on küll üha enam võimalik suunata oma väljundit üle vaatama, aga veel pole näha, et inimese saaks siin kõrvale heita.

Hiljuti tegime ühe katse ja kirjutasime sellest teadusartikli. Lasime tehisaruagendil etteantud metoodika ja andmete põhjal teha järeldused, palusime neid võrrelda ja mitmel korral ümber teha.

Jah, me jõudsime niiviisi lõpptulemuseni palju kiiremini. Aga ikkagi vajasime eksperti, kes kogu väljundi üle vaataks, et lõpptulemus oleks selline, millele meie oleksime teadlastena valmis tehtule oma nimed alla panema; ütlema, et jah, tulemus on niisugune, milleni oleksime ka ise, omal käel jõudnud, võib-olla lihtsalt paar nädalat hiljem.

Olevi hinnangul ei pea tehisaru kartma, kuid seda ei tohi ka pimesi usaldada: “Usalda, kuid kontrolli” on tema sõnul taas asjakohane põhimõte. Foto: Karl-Kristjan Nigesen

Olevi hinnangul ei pea tehisaru kartma, kuid seda ei tohi ka pimesi usaldada: “Usalda, kuid kontrolli” on tema sõnul taas asjakohane põhimõte. Foto: Karl-Kristjan Nigesen

Kuidas on võimalik, et inimene on meisterdanud valmis millegi, mis ei mõtle sugugi nii nagu tema ise?

Tehisaru meenutab küll lahenduselt aju arhitektuuro, aga ta on ikkagi selle väga lihtsustatud vorm. Tõsi, neid treenitakse näidetega, kuidas inimesed kirjutavad, kuidas koodi kirjutavad, kuidas disainivad. Neid peenhäälestatakse kõvasti, et tulemus inimestele meeldiks, et see vastaks seatud kvaliteedile. Aga põhimõtteliselt töötavad nad ikka inimestest erinevalt.

Need statistilised-matemaatilised mudelid võtavad ühe sõna korraga, ennustavad kogu varasema konteksti alusel järgmist sõna. Inimene aga ei suuda töötada nii, et talle antakse ülesanne ja juhis, kuidas seda ülesannet lahendada, ja siis ta ainult nendest lähtubki. Inimene ehitab väga väheste kogemuste alusel endale arusaama maailmast, sellest, kuidas asjad toimivad.

Kuhu me tehisaru abil teel oleme?

On juba väga mõistlik arvutiga hääle abil rääkida. Võib-olla mitte terve päeva vältel, et oma häält liigselt väsitada, aga kõnetuvastus on ingliskeelsetesse TI-vahenditesse juba sisse ehitatud. Kindlasti aitab see aega säästa.

Eks tehisaruvaldkond otsib pidevalt uusi rakendusvõimalusi, et õigustada andmekeskuste ehitamist, suurt treenimist ja tehtavaid kulutusi. Kindlasti hakatakse seda aina rohkem kasutama. Kuigi paljudes valdkondades on see raske, kuna pole tagasisidestamise võimalust ega hästi kättesaadavaid andmeid. Pealegi pole mudeleid treenivatel inimestel nendes valdkondades ekspertiisi. Nad ostavad treeningandmed kusagilt sisse …

Ja siiski saabub päev, millal tehisaru su eest kõik ära teeb.

Praegugi on väga raske kõikidest võimalustest üldse veel aru saada. Kuigi mind huvitabki ennekõike see, mis on hetkel võimalik. Arvan, et olen Tehnikaülikoolis üks suuremaid TI kasutajaid.

Me peamegi õppima neid asju kasutama, tunnistama, et nad töötavadki täiesti teistmoodi ega saa ise oma vigadest aru. Tehisaru on ilma igasuguse mäluta, iga päev nagu uus.

Põhimõtteliselt algab iga vestlus temaga puhtalt lehelt. Iga päring, mille ta teeb, võib toimuda hoopis teises andmekeskuses, kus vestluse tulemust talletatakse võib-olla ainult viis minutit või üks tund. Pärast seda on see kõik läinud. Tuleb päris kaua harjutada ja kogemusi koguda, et õppida tehisaru vajadusel usaldama või temasse ettevaatlikult suhtuma.

Aivo Olev näeb oma tulevikku teadusega seotuna ka siis, kui see ei pruugi tähendada töötamist ülikoolis: oluline on mõõta, katsetada ja hinnata, kas lahendus läks päriselt paremaks. Foto: Karl-Kristjan Nigesen

Aivo Olev näeb oma tulevikku teadusega seotuna ka siis, kui see ei pruugi tähendada töötamist ülikoolis: oluline on mõõta, katsetada ja hinnata, kas lahendus läks päriselt paremaks. Foto: Karl-Kristjan Nigesen

Kas tehisaru loob sinu hinnangul eelise suurematele või väiksematele kooslustele või ettevõtetele?

Kindlasti on üksi või väikese tiimiga võimalik tehisintellekti abil palju rohkem ära teha. Eriti varases faasis, kui alles mõtled uut toodet luua, soovid aru saada, mis on mis, millist teenust oleks kasulik pakkuda. Siis saad otsekui kesktasemel eksperdi käest nõu küsida või talle ülesandeid delegeerida ega pea väikeses ettevõttes kohe kõiki rolle mehitama.

Kui oled julge, siis lased tal luua juriidilised dokumendid, koostada valdkonna analüüse, valmistada toodete prototüüpe – ja seda küllalt kiiresti. Kui sul on hiljem vaja head kvaliteeti, palkad tõenäoliselt inimeksperdi. Kasvõi turundussõnumite jaoks, sest kõik ju saavad aru, kui oled tehisaru kasutanud.

Mulle endale meeldibki tehisaru just prototüüpimise ja katsetamise faasis. Teen ju tihti asju, milles ma ei ole veel täiesti kompetentne. Siis saan tehisarult nõu küsida. Tema astub minu eest mitu sammu, hiljem saan otsustada, kas läbitud suund on mõistlik või mitte.

Mina saan paljut kiiresti katsetada ja seejärel otsustada, kas tahan millestki veel rohkem teada saada, kas see on mulle oluline. Siis ma kas muudan tulemuse paremaks või jätan selliseks, nagu tehisaru selle tegi, ja keskendun millegi muule. Minu töös kulub eksperimenteerimisele niiviisi palju vähem aega. Ja sama põhimõtet saab rakendada ka äris.

Anna üks soovitus ka tänastele lõpetajatele.

Soovitan lõpetajatel mitte karta oma fookust muuta ega uuesti õppima hakata. Uutest tööriistadest, eriti tehisarust, võib olla väga palju abi, aga ainult siis, kui säilitate kriitilise mõtlemise. Kasutage neid julgelt, kuid ärge usaldage neid pimesi. Edu tuleb uudishimust, katsetamisest ja soovist oma tegevust süvitsi mõista.

Edu keelemudelite võistlustel

Interspeech 2026 konverentsi raames toimunud võistlusel Audio Reasoning Challenge võitsime koos prof Tanel Alumäega Agent Tracki osa. Ülesanne oli ehitada agent, mis lahendab 1000 heli mõistmise ülesannet. Kasutada võis kõike vabavaralist.

Võit tuli ka TidyLang Challenge Odyssey 2026 konverentsi raames peetud võistlusel. Seal tuli tuvastada kõneldavat keelt või verifitseerida, kas räägitakse samas keeles, kusjuures enamikes kõnenäidetes rääkisid inimesed mitte emakeeles, mistõttu tuli tulla toime aktsentidega.