Tanel Tammet: AI tulekuga tekib palju võitjaid

18.06.2024

Tanel Tammet: AI tulekuga tekib palju võitjaid. 18.06.2024. Kas sa oled täna juba AI-d kasutanud? Ma olen täna AI-d tundide kaupa kasutanud, aga mina kasutan seda eksperimenteerimiseks mitte selleks, et ta mulle mingeid vastuseid või jutte räägiks. Sa oma veebiotsingusse, töösse, kirjutamistesse ei ole teda rakendanud? Ei. Olen proovinud mitmel moel, olen lasknud tal artikli osi ilusamaks kirjutada ja koodi kirjutamisel assisteerida, aga ma polnud tulemusega rahul. Ma küsin sellepärast, et suurte keelemudelite laiema avalikkuse ette jõudmisest on poolteist aastat möödas, aga endiselt on selline tunne, et laine alles tuleb, kuid pole veel kohal. See on minus tekitanud kahtlusi, kas me üldse ajame õiget asja ja kas see laine üldse ongi olemas. Ma olen päris veendunud, et on olemas. Keegi ei oska prognoosida, milles see laine seisneb, mis tegelikult hästi tööle hakkab ja mille jaoks laine kasulik on või millal miski juhtuma hakkab. Minu jaoks oli ChatGPT põhiline efekt selles, et ta muutis tuleviku palju prognoosimatumaks. ChatGPT niivõrd hea tase oli enamusele erialainimestele, ka tema ehitajatele, väga suur üllatus. Aga kas see maailma muutev pauk või pikem protsess ikkagi tuleb? See mitte lihtsalt ei tule, vaid see käib juba tükk aega. Selle sajandi esimese kahekümne aasta jooksul pole tehnoloogia jaoks juhtunud midagi nii üliproduktiivset, kui meile tundub. Kõikvõimalikud asjad arvutites või internet ja mobiiltelefonid ei ole tööviljakust nii väga palju muutnud. Produktiivsus kasvab maailmas ühe aeglasemalt ja see on probleem. Tööprotsesside automatiseerumise tempo on pidurdunud ja läheb edasi üha aeglasemalt. Tegelikke töid teevad endiselt inimesed. Kõik asjad, mida on lihtne automatiseerida, on juba tehtud, aga jäigas programmikoodis ning seda on vaevaline kirjutada. Mul on masinõppe osas suur lootus, et me oleme uue kiire tehnoloogilise tõusu alguses. Kas sa tead seda vana nalja, et arvuti ei tee kunagi seda, mida sa tahad, vaid ta teeb alati seda, mida sa ütled, et ta teeks? Olen ikka kuulnud, jah. Mulle tundub, et esimest korda on mingi lootus, et arvuti hakkab tegema seda, mida sa tahad, et ta teeks ja sa saad selle talle inimese moel ära seletada. Inimese ja masina suhtlusse tekib teistlaadne kvaliteet. Need asjad lähevad kõik palju aeglasemalt, kui alguses tundub. See värk on ikka päris keeruline. Mina ei tea, kui kiiresti seda reaalselt majanduses kasutada õnnestub ja kuidas. Praegu on kõik tegevused eksperimentaalsed, proovime ühes ja teises kohas. Masinõpe toimib hästi pildituvastuses ja aegridade pealt toimuva ennustamises, need on reaalselt kasutuses. Palju inimesi kasutab oma projektiplaanide genereerimiseks suuri keelemudeleid, nad küsivad mõne töö jaoks kümme ideed või et kirjuta mulle kümme küsimust. See on tõsi, personaalse assistendi tasemel ta kahtlemata natuke inimesi aitab. Hiljuti olid suured skandaalid, et Google’i AI soovitas inimestel süüa iga päev ühe väikse kivi, sest see olevat tervislik ja andis nõu, et kui juust ei püsi pizza peal, siis tuleks pizzakastmesse lisada liimi. Me tegime hiljuti ühe taskuhäälinguepisoodi Kristjan Korjusega Pactumist. Tema ütleb, et suurte keelemudelite äkiline ebausaldusväärsus või loomulik kalduvus fantaseerida on selle tehnoloogia paratamatu osa ja see probleem jääb tehnoloogiaga kaasas käima. Targa arvuti puhul on valetamisega raske harjuda. Kui ma palun tal Excelis veeru kokku liita, siis ma ju ei mõtle, et äkki ta liitis valesti. See tundub imelik. See tundub natuke aega imelik, aga inimesed harjuvad sellega suhteliselt ruttu ära. Ma olen täpselt sama meelt nagu Kristjan, et see tehnoloogia oli üllatavalt hea, aga ta on olemuslikult mitmes dimensioonis piiratud. Seda, et ta põhimõtteliselt valetab, ei saa kuidagi ära võtta. Teine asi on see, et ta põhimõtteliselt ei teosta otsinguid või planeerimist, tal pole sellist mehhanismi sees. Ta saab baaskasutada olemasolevaid lihtsamaid otsingustruktuure, aga ise ta neid ei teosta. See kõik ei tähenda, et me siit kuidagi edasi ei saa ja et see ongi keelemudelite ajaloo lõpp, vaid praegu on lihtsalt käsil üks silmapaistev vaheetapp. Nii et me peame harjuma sellega, et kui ma arvuti käest midagi küsin, siis sealt ei tule mitte õige, vaid teatud tõenäosusega vastus? See on niikuinii niimoodi. Guugeldades saad ka igasuguseid vastuseid. Mis sel vahet on, kas see on inimese tehtud või mitte? Ega me ei saa sellest niigi aru. Me oleme läinud oma mõtlemises automaatselt seda teed, et AI on meile täpne faktiline partner. Äkki me peaksimegi temasse teistmoodi suhtuma? Ükski AI ei ole täpne faktiline partner, ta ei saa põhimõtteliselt seda olla. AI on selline asi, mis teeb olemuslikult midagi sellist, mida me ei oska ette ennustada. Muidu me seda AI-ks ju ei nimetaks, vaid arvaks, et see tegu on mingi kalkulaatoriga. AI peabki olema kuigivõrd ennustamatu ja sel juhul ei saa ta olla garanteeritult õige. Millisena sa näed AI tootestamise tulevikku? Täna käibsuhtlus temaga nagu 1980. aastatel arvutiterminali taga: sul on vilkuv kursor, sisestad teksti ja siis ootad vastust. Mina ei usu, et see nii jääbki. Google on töötanud aastakümneid täpselt samamoodi, et kirjutad ja Google vastab ja see on väga hästi saanud niimoodi püsida. Aga selle kallal, kuidas LLMi (suur keelemudel; matemaatiline mudel, mis modelleerib osade jada) tootestada, tehakse praegu väga palju tööd. Head keelemudelid on suhteliselt värsked ja katsetamine võtab veel päris tükk aega. Minu ideaalpilt oleks, et me saaksime palju kergemini hakata tegema inimkeelse kasutajaliidesega tarkvara. Et saad mingeid asju seletada ja kirjeldada ja arvutiga dialoogi pidada ning see kaadervärk suudab sulle vastata. Mistahes põhjalikuma programmi kasutamine on praegu ju õudselt keeruline. See takistab arvuteid võimsalt kasutada, isegi paljud spetsialistid ei viitsi neid asju ära õppida. Võtame näiteks andmebaasid, millele on läbi aegade püütud teha pooleldi inimkeelseid kasutajaliideseid. Näiteks SQL oli alguses mõeldud selleks, et oleks natuke nagu inimese moodi. Tegelikult on see ikkagi hirmkeeruline ja päringuid suudab koostada ainult karm spetsialist. Me oleksime võimelised seda suurte keelemudelite abil palju lihtsamaks muutma. See lootus on väga reaalne. Mina mõtlen sellest väga tarbijakeskselt, ma näen oma elus lõpmatul hulgal kohti, kus inimese ja masina suhtlust saaks põhjalikult muuta, alates maja küttesüsteemist ja lõpetades perearsti või millega iganes. Maja küttesüsteem ja perearstiasi on natuke huvitav küll, aga mitte nii väga. Mind huvitavad oluliselt rohkem suured tööstusprotsessid nagu asjade tootmine, kaubandus, finants, juhtimine. Et viia edasi nende automatiseerimist, et seal läheks vaja vähem inimesi. Nii et paljukardetud AI kui valgekraede koondaja võib saada tõeks? See on võibolla ainult alguses niimoodi. Tihtipeale muudab tehnoloogia töö efektiivsemaks. Pole nii, et AI hakkab ise tarkvara arendama ja inimesi pole sinna üldse enam vaja, vaid me pigem arvame vastupidi: arendajate efektiivsus tõuseb ja nende võime asju teha hakkab kasvama. Nad muutuvad hoopis tähtsamaks. Ka valgekraedega võib juhtuda samamoodi. Alati on kaotajad ja võitjad, aga ma arvan, et siin on päris palju võitjaid, kelle võimekus hakkab kasvama. Teiseks, kui me vaatame füüsilist tegevust nagu kasvõi ehitamine, siis see on nii megakeeruline ülesanne, et keelemudelid ei oska seal praegu kuidagi aidata. Hetkel pole siin läbimurde algeidki. Küll nad tulevad, aga ma ei oska ennustada, millal. Kas sa näed, et suured keelemudelid on üks keeruline asi ja maailmas saab neid olema käputäis või muutuvad need üldteadmiseks ja me võime teha neid siia Eestisse kasvõi mitu tükki? Alguses paistis, et on jah kaks-kolm tükki ja teised keegi ei jõua teha, aga praegu mulle paistab, et nii ei ole. Keelemudelite arv on kiiresti kasvanud ja kasvamise tempo kogu aeg tõuseb. Asi läheb kogu aeg odavamaks ja lihtsamaks, mudeleid saab ehitada olemasolevate peale ja nii edasi. Nad ei muutu nähtavas tulevikuks selliseks, et ma hakkan oma sülearvutis suuri keelemudeleid ehitama, aga väikseid võib luua juba täna. Neist pole küll eriti kasu, aga nad täitsa töötavad. Viis aastat tagasi tuli välja GPT2, mille kohta ütles OpenAI, et sedavõrd ohtlikku relva ei tohi inimestele kätte anda, nad saadavad sellega korda mingit hullu kurja. Näiteks on seda võimalik täitsa ise ehitada. Kas te ehitate neid ka TalTechi laborites või eksamitööna? Mõned kolleegid on küll selliseid asju katseliselt ehitanud, aga see pole põhitegevus, sest me ei jõua kuidagi valmistada suurt mudelit ja suur mudel on igal juhul palju parem. Ma ise tegelen põhiliselt uurimisega, kuidas neid saaks mõistlikumalt kasutada. Mitte et kus nad eksivad, vaid et kus annavad nad regulaarselt mõistlikke rakendatavaid tulemusi. Kui palju andmeid on ühe mudeli tegemiseks vaja? Kas me võime ette kujutada, et valmistama näiteks Eesti kirjanduse peale, näiteks Tammsaare romaanide peale spetsialiseerunud suure keelemudeli? Tammsaare ja kogu Eesti kirjanduse suure keelemudeli saab heas sülearvutis juba ise mõne päevaga valmis ehitada. Siis ta hakkabki produtseerima Eesti kirjanduse moodi teksti, nii naljakas kui see ka pole. Kasu on temast küll vähe, sest kasu tuleb praeguse GPT4 taseme juures ja sellel tasemel treenimiseks on vaja palju rohkem andmeid. Samas pole vajalike andmete hulk astronoomiliselt suur ja asja ei pidurda mitte niivõrd andmete hulk, vaid eeskätt ikkagi treenimise rehkendustöö. See on koletu suur. Kas me peaksime mõtlema Eestis selle peale, et kui me läheme näiteks Google’i või Meta või kellegi tehtud AI käest küsima, mis on Eesti, ja võibolla ta vastab meile, et Eesti on üks mõttetu väikeriik Venemaa külje all, siis meil peaks olema oma eestimeelne keelemudel? Selline, mis annaks vastuseid ja oskakski rääkida meile asjadest eestlase vaatepunktist? Nagu digitaalne eestlane. Jumala õige. Mõni selline täitsa mõistlik Eesti keelemudel on muide juba olemas ja praegu ehitatakse neid suuremaks ja paremaks, see töö täitsa käib. Küsimus on selles, mis on pärast sellest kasu peale selle, et tegu on sellise huvitava asjaga. Seda küsimust tuleks veidi laiendada. Suur probleem on see, et keelemudelid üldiselt ei tea suurt midagi peale selle, mille peal neid on treenitud ja kui sa tahaksid neid mõnes organisatsioonis kasutada, näiteks vastata kliendi küsimusele, siis ta ei tea ta seal organisatsioonis toimuvast midagi. See on üldine küsimus, kuidas saada keelemudel mingi organisatsiooni infot kasutama. Praegu seisneb üks peamine tehnoloogia lihtsalt selles, et sa võtad suure portsu organisatsiooni dokumente, indekseerid need ära ja kui küsimus tuleb, siis otsid kõigepealt nendest välja tükid, mis paistavad olevat küsimusega relevantsed ja siis paned tükid keelemudeli promptile juurde lootuses, et ehk töötab. Enamasti see töötab, aga niipea kui sa ütleksid, et ma tahan andmebaasist ka midagi pärida või et Eestis on X-tee ja küsime sealt, siis see enam nii kenasti ei läheks. Võib kujutada ette huvitavat rakendust, et ma olen lihatööstuse juht ja toksin arvutisse küsimuse, et miks mu viimase kahe nädala müük on madalam kui mullu samal ajal. Just. Selliste asjade juurde me tahakski tegelikult jõuda, aga kuidas seda teha, ei oska keegi väga täpselt öelda. Selle kallal tehakse praegu massiliselt tööd. Mõnel maailma riigil on oma AI-strateegiad juba olemas, et proovida AI jaoks ette valmistuda. Tundub, et Eestis me seda väga palju ei tee. Kas me peaksime riiklikul tasemel praegu midagi tegema või on selleks liiga vara ja me ei oskakski midagi ette võtta? Kindlasti oleks tark, kui inimeste hulk, kes oskab keelemudelitega midagi praktilist ette võtta ja neid uurida, oleks suurem. Rahvast pole vaja massiliselt harida, sest inimesed saavad ise ka aru, mis on põnev, nad lähevad ja katsetavad, aga spetsialistide hulka oleks küll väga mõistlik suurendada. Nii et ülikoolis tuleks avada uus bakalaureusekava? Pigem ma ütleksin, et olemasolevaid kavasid oleks mõttekas sättida niimoodi, et kompetents kasvaks. Ülikooli tuleks võtta inimesi, kes on nende asjadega juba tegelenud ja ega neid polegi väga palju kusagilt võtta. Tudengeid on ka vaja motiveerida, et nad teeksid keerulisi asju, sest loomu poolest kaldub tudeng lihtsate asjade poole, kes see ikka viitsib keerulisi asju ette võtta. Me oleme täna ChatGPT 4.0 versioonis. Millise versiooni saab sinu arvates võtta südamerahuga tootvasse töösse nii, nagu me täna kasutame Excelit ? Pole aimugi. Prognoosid algavad poolest aastast kuni selleni, et taolist asja ei tule mitte kunagi. Täiesti targad inimesed arvavad ühte ja arvavad teist ning kummalgi pole sellisteks oletusteks alust. Kõik pakkumised on tehtud kõhutunde pealt. Mina arvan, et see värk tuleb, aga mitte poole aasta pärast, see tuleb üles-alla lainetustena, kuid pidevalt kasvades. Suured keelemudelid enam lõpmatult palju ei arene, tõenäoliselt lisanduvad neile natuke teistsugused tehnoloogiad. Sellised asjad, mis saavad inimese jutust aru ja oskavad talle vastata midagi mõistlikku, kasvavad igal juhul. Ma olen optimist ja arvan, et midagi hirmsast ei juhtu ja seisma see asi ei jää. Nii et sina Jaan Tallinna ja mitmete teiste inimeste maailmalõpumeeleolu ei jaga? Ei jaga. Ma saan neist aru ka, riskid on kuigivõrd olemas, aga sõltub, kui suureks keegi mingit riski peab. Meil pole ka eriti võimalusi neid riske maandada. Nende ürituste mõju, et midagi pidurdada või reguleerida, on prognoosimatu. Need ei pruugi mitte midagi paremaks teha. Targem on võtta vastu see, mis tulema peab? Mingi piirini. Ühte riski saaksime maandada, kui me ise sellesse usume ja sellega tegeleme. Kogu see arvutivärk üldisemalt on üks suur risk. On võimalik väga hästi automatiseerida suuri tööprotsesse, nii et see aitab kaasa tsentraliseerimisele. Saad teiste süsteemidega kaugelt sidet pidada ja nii edasi. Tänu sellele on olemas Amazon, Google, Bolt, Wise ja kõik sellised asjad. Suurfirmad monopoliseerivad majandusest üha rohkem suuri tükke, nii et väikesed tegijad jäävadki väikeseks. See toob automaatselt kaasa suurema majandusliku ja sotsiaalse kihistumise, see hakkab kaasa riigivõimu tsentraliseerumisele ja demokraatia vähenemisele, sest kui majandus tsentraliseerub, teeb poliitika sama. Sellised asjad on ajaloos viinud alati päris jõledate olukordadeni, mis lõppevad sõdade, revolutsioonide ja ei tea millega. Kasvab risk, et senine rahulik ühiskondlik elu ei jätku. See on päris suur risk. Tehisintellekt aitab sellele kaasa, muutes tsentraliseerimist veelgi kergemaks ja paremaks. Me näeme ju praegugi, et AI on põhiliselt suurfirmade käes. See on kogu ühiskonna mure ja siin on küll võimalik inimestel midagi ära teha, püüdes jälgida, et monopole väga ei soodustata ja et väikesed saaksid ka elada. See on päris keeruline, aga tehtav asi. Siin vist AI-st palju abi ei ole, vaid see osa tuleb meil endal ära teha. See tuleb täitsa ise ära teha jah. Üks levinud arvamus, mis ei pruugi tingimata õige olla, aga natuke siiski, on see, et katsed keelemudelite ja masinate asja pidurdada on eeskätt vesi nende veskile, kelle käes need asjad juba on, sest teistel oleks raskem konkureerida.

Henrik Roonemaa

Ajakirjanik

TalTechi tarkvarateaduse instituudi professor Tanel Tammet Innovatsioonifestivalil 5. juunil 2024 | Foto: TalTech

Kunas täpselt ja kuidas tehisintellekt meie ellu tugevalt tuleb, on praegu võimatu ennustada, aga see juhtub kindlasti. Esimese hooga võib see endaga kaasa tuua töökohtade kadumist ja inimlikke probleeme, kuid tegelikult sünnitab AI-revolutsioon palju võitjaid, rääkis TalTechi tarkvarateaduse instituudi professor Tanel Tammet intervjuus Henrik Roonemaale.

Kas sa oled täna juba AI-d kasutanud?

Ma olen täna AI-d tundide kaupa kasutanud, aga mina kasutan seda eksperimenteerimiseks mitte selleks, et ta mulle mingeid vastuseid või jutte räägiks.

Sa oma veebiotsingusse, töösse, kirjutamistesse ei ole teda rakendanud?

Ei. Olen proovinud mitmel moel, olen lasknud tal artikli osi ilusamaks kirjutada ja koodi kirjutamisel assisteerida, aga ma polnud tulemusega rahul.

Ma küsin sellepärast, et suurte keelemudelite laiema avalikkuse ette jõudmisest on poolteist aastat möödas, aga endiselt on selline tunne, et laine alles tuleb, kuid pole veel kohal. See on minus tekitanud kahtlusi, kas me üldse ajame õiget asja ja kas see laine üldse ongi olemas.

Ma olen päris veendunud, et on olemas. Keegi ei oska prognoosida, milles see laine seisneb, mis tegelikult hästi tööle hakkab ja mille jaoks laine kasulik on või millal miski juhtuma hakkab.

Minu jaoks oli ChatGPT põhiline efekt selles, et ta muutis tuleviku palju prognoosimatumaks. ChatGPT niivõrd hea tase oli enamusele erialainimestele, ka tema ehitajatele, väga suur üllatus.

Aga kas see maailma muutev pauk või pikem protsess ikkagi tuleb?

See mitte lihtsalt ei tule, vaid see käib juba tükk aega.

Selle sajandi esimese kahekümne aasta jooksul pole tehnoloogia jaoks juhtunud midagi nii üliproduktiivset, kui meile tundub. Kõikvõimalikud asjad arvutites või internet ja mobiiltelefonid ei ole tööviljakust nii väga palju muutnud. Produktiivsus kasvab maailmas ühe aeglasemalt ja see on probleem. Tööprotsesside automatiseerumise tempo on pidurdunud ja läheb edasi üha aeglasemalt.

Tegelikke töid teevad endiselt inimesed. Kõik asjad, mida on lihtne automatiseerida, on juba tehtud, aga jäigas programmikoodis ning seda on vaevaline kirjutada. Mul on masinõppe osas suur lootus, et me oleme uue kiire tehnoloogilise tõusu alguses.

TalTechi tarkvarateaduse instituudi professor Tanel Tammet ja doktorant-nooremteadur Elli Valla TalTechi Innovatsioonifestivalil 5. juunil 2024 | Foto: TalTech

Kas sa tead seda vana nalja, et arvuti ei tee kunagi seda, mida sa tahad, vaid ta teeb alati seda, mida sa ütled, et ta teeks?

Olen ikka kuulnud, jah.

Mulle tundub, et esimest korda on mingi lootus, et arvuti hakkab tegema seda, mida sa tahad, et ta teeks ja sa saad selle talle inimese moel ära seletada. Inimese ja masina suhtlusse tekib teistlaadne kvaliteet.

Need asjad lähevad kõik palju aeglasemalt, kui alguses tundub. See värk on ikka päris keeruline. Mina ei tea, kui kiiresti seda reaalselt majanduses kasutada õnnestub ja kuidas.

Praegu on kõik tegevused eksperimentaalsed, proovime ühes ja teises kohas. Masinõpe toimib hästi pildituvastuses ja aegridade pealt toimuva ennustamises, need on reaalselt kasutuses.

Palju inimesi kasutab oma projektiplaanide genereerimiseks suuri keelemudeleid, nad küsivad mõne töö jaoks kümme ideed või et kirjuta mulle kümme küsimust.

See on tõsi, personaalse assistendi tasemel ta kahtlemata natuke inimesi aitab.

Hiljuti olid suured skandaalid, et Google’i AI soovitas inimestel süüa iga päev ühe väikse kivi, sest see olevat tervislik ja andis nõu, et kui juust ei püsi pizza peal, siis tuleks pizzakastmesse lisada liimi. Me tegime hiljuti ühe taskuhäälinguepisoodi Kristjan Korjusega Pactumist. Tema ütleb, et suurte keelemudelite äkiline ebausaldusväärsus või loomulik kalduvus fantaseerida on selle tehnoloogia paratamatu osa ja see probleem jääb tehnoloogiaga kaasas käima. Targa arvuti puhul on valetamisega raske harjuda. Kui ma palun tal Excelis veeru kokku liita, siis ma ju ei mõtle, et äkki ta liitis valesti. See tundub imelik.

See tundub natuke aega imelik, aga inimesed harjuvad sellega suhteliselt ruttu ära. Ma olen täpselt sama meelt nagu Kristjan, et see tehnoloogia oli üllatavalt hea, aga ta on olemuslikult mitmes dimensioonis piiratud.

Seda, et ta põhimõtteliselt valetab, ei saa kuidagi ära võtta. Teine asi on see, et ta põhimõtteliselt ei teosta otsinguid või planeerimist, tal pole sellist mehhanismi sees. Ta saab baaskasutada olemasolevaid lihtsamaid otsingustruktuure, aga ise ta neid ei teosta.

See kõik ei tähenda, et me siit kuidagi edasi ei saa ja et see ongi keelemudelite ajaloo lõpp, vaid praegu on lihtsalt käsil üks silmapaistev vaheetapp.

Nii et me peame harjuma sellega, et kui ma arvuti käest midagi küsin, siis sealt ei tule mitte õige, vaid teatud tõenäosusega vastus?

See on niikuinii niimoodi. Guugeldades saad ka igasuguseid vastuseid. Mis sel vahet on, kas see on inimese tehtud või mitte? Ega me ei saa sellest niigi aru.

TalTechi tarkvarateaduse instituudi professor Tanel Tammet Innovatsioonifestivalil 5. juunil 2024 | Foto: TalTech

Me oleme läinud oma mõtlemises automaatselt seda teed, et AI on meile täpne faktiline partner. Äkki me peaksimegi temasse teistmoodi suhtuma?

Ükski AI ei ole täpne faktiline partner, ta ei saa põhimõtteliselt seda olla. AI on selline asi, mis teeb olemuslikult midagi sellist, mida me ei oska ette ennustada. Muidu me seda AI-ks ju ei nimetaks, vaid arvaks, et see tegu on mingi kalkulaatoriga. AI peabki olema kuigivõrd ennustamatu ja sel juhul ei saa ta olla garanteeritult õige.

Millisena sa näed AI tootestamise tulevikku? Täna käibsuhtlus temaga nagu 1980. aastatel arvutiterminali taga: sul on vilkuv kursor, sisestad teksti ja siis ootad vastust. Mina ei usu, et see nii jääbki.

Google on töötanud aastakümneid täpselt samamoodi, et kirjutad ja Google vastab ja see on väga hästi saanud niimoodi püsida. Aga selle kallal, kuidas LLMi (suur keelemudel; matemaatiline mudel, mis modelleerib osade jada) tootestada, tehakse praegu väga palju tööd. Head keelemudelid on suhteliselt värsked ja katsetamine võtab veel päris tükk aega.

Minu ideaalpilt oleks, et me saaksime palju kergemini hakata tegema inimkeelse kasutajaliidesega tarkvara. Et saad mingeid asju seletada ja kirjeldada ja arvutiga dialoogi pidada ning see kaadervärk suudab sulle vastata.

Mistahes põhjalikuma programmi kasutamine on praegu ju õudselt keeruline. See takistab arvuteid võimsalt kasutada, isegi paljud spetsialistid ei viitsi neid asju ära õppida.

Võtame näiteks andmebaasid, millele on läbi aegade püütud teha pooleldi inimkeelseid kasutajaliideseid. Näiteks SQL oli alguses mõeldud selleks, et oleks natuke nagu inimese moodi. Tegelikult on see ikkagi hirmkeeruline ja päringuid suudab koostada ainult karm spetsialist. Me oleksime võimelised seda suurte keelemudelite abil palju lihtsamaks muutma. See lootus on väga reaalne.

Mina mõtlen sellest väga tarbijakeskselt, ma näen oma elus lõpmatul hulgal kohti, kus inimese ja masina suhtlust saaks põhjalikult muuta, alates maja küttesüsteemist ja lõpetades perearsti või millega iganes.

Maja küttesüsteem ja perearstiasi on natuke huvitav küll, aga mitte nii väga. Mind huvitavad oluliselt rohkem suured tööstusprotsessid nagu asjade tootmine, kaubandus, finants, juhtimine. Et viia edasi nende automatiseerimist, et seal läheks vaja vähem inimesi.

Nii et paljukardetud AI kui valgekraede koondaja võib saada tõeks?

See on võibolla ainult alguses niimoodi. Tihtipeale muudab tehnoloogia töö efektiivsemaks. Pole nii, et AI hakkab ise tarkvara arendama ja inimesi pole sinna üldse enam vaja, vaid me pigem arvame vastupidi: arendajate efektiivsus tõuseb ja nende võime asju teha hakkab kasvama. Nad muutuvad hoopis tähtsamaks. Ka valgekraedega võib juhtuda samamoodi.

Alati on kaotajad ja võitjad, aga ma arvan, et siin on päris palju võitjaid, kelle võimekus hakkab kasvama.

Teiseks, kui me vaatame füüsilist tegevust nagu kasvõi ehitamine, siis see on nii megakeeruline ülesanne, et keelemudelid ei oska seal praegu kuidagi aidata. Hetkel pole siin läbimurde algeidki. Küll nad tulevad, aga ma ei oska ennustada, millal.

Riigikogu liige Andres Sutt ja TalTechi tarkvarateaduse instituudi professor Tanel Tammet Innovatsioonifestivalil 5. juunil 2024 | Foto: TalTech

Kas sa näed, et suured keelemudelid on üks keeruline asi ja maailmas saab neid olema käputäis või muutuvad need üldteadmiseks ja me võime teha neid siia Eestisse kasvõi mitu tükki?

Alguses paistis, et on jah kaks-kolm tükki ja teised keegi ei jõua teha, aga praegu mulle paistab, et nii ei ole. Keelemudelite arv on kiiresti kasvanud ja kasvamise tempo kogu aeg tõuseb. Asi läheb kogu aeg odavamaks ja lihtsamaks, mudeleid saab ehitada olemasolevate peale ja nii edasi.

Nad ei muutu nähtavas tulevikuks selliseks, et ma hakkan oma sülearvutis suuri keelemudeleid ehitama, aga väikseid võib luua juba täna. Neist pole küll eriti kasu, aga nad täitsa töötavad. Viis aastat tagasi tuli välja GPT2, mille kohta ütles OpenAI, et sedavõrd ohtlikku relva ei tohi inimestele kätte anda, nad saadavad sellega korda mingit hullu kurja. Näiteks on seda võimalik täitsa ise ehitada.

Kas te ehitate neid ka TalTechi laborites või eksamitööna?

Mõned kolleegid on küll selliseid asju katseliselt ehitanud, aga see pole põhitegevus, sest me ei jõua kuidagi valmistada suurt mudelit ja suur mudel on igal juhul palju parem. Ma ise tegelen põhiliselt uurimisega, kuidas neid saaks mõistlikumalt kasutada. Mitte et kus nad eksivad, vaid et kus annavad nad regulaarselt mõistlikke rakendatavaid tulemusi.

Kui palju andmeid on ühe mudeli tegemiseks vaja? Kas me võime ette kujutada, et valmistama näiteks Eesti kirjanduse peale, näiteks Tammsaare romaanide peale spetsialiseerunud suure keelemudeli?

Tammsaare ja kogu Eesti kirjanduse suure keelemudeli saab heas sülearvutis juba ise mõne päevaga valmis ehitada. Siis ta hakkabki produtseerima Eesti kirjanduse moodi teksti, nii naljakas kui see ka pole. Kasu on temast küll vähe, sest kasu tuleb praeguse GPT4 taseme juures ja sellel tasemel treenimiseks on vaja palju rohkem andmeid.

Samas pole vajalike andmete hulk astronoomiliselt suur ja asja ei pidurda mitte niivõrd andmete hulk, vaid eeskätt ikkagi treenimise rehkendustöö. See on koletu suur.

Kas me peaksime mõtlema Eestis selle peale, et kui me läheme näiteks Google’i või Meta või kellegi tehtud AI käest küsima, mis on Eesti, ja võibolla ta vastab meile, et Eesti on üks mõttetu väikeriik Venemaa külje all, siis meil peaks olema oma eestimeelne keelemudel? Selline, mis annaks vastuseid ja oskakski rääkida meile asjadest eestlase vaatepunktist? Nagu digitaalne eestlane.

Jumala õige. Mõni selline täitsa mõistlik Eesti keelemudel on muide juba olemas ja praegu ehitatakse neid suuremaks ja paremaks, see töö täitsa käib. Küsimus on selles, mis on pärast sellest kasu peale selle, et tegu on sellise huvitava asjaga. Seda küsimust tuleks veidi laiendada.

Suur probleem on see, et keelemudelid üldiselt ei tea suurt midagi peale selle, mille peal neid on treenitud ja kui sa tahaksid neid mõnes organisatsioonis kasutada, näiteks vastata kliendi küsimusele, siis ta ei tea ta seal organisatsioonis toimuvast midagi.

See on üldine küsimus, kuidas saada keelemudel mingi organisatsiooni infot kasutama. Praegu seisneb üks peamine tehnoloogia lihtsalt selles, et sa võtad suure portsu organisatsiooni dokumente, indekseerid need ära ja kui küsimus tuleb, siis otsid kõigepealt nendest välja tükid, mis paistavad olevat küsimusega relevantsed ja siis paned tükid keelemudeli promptile juurde lootuses, et ehk töötab.

Enamasti see töötab, aga niipea kui sa ütleksid, et ma tahan andmebaasist ka midagi pärida või et Eestis on X-tee ja küsime sealt, siis see enam nii kenasti ei läheks.

Võib kujutada ette huvitavat rakendust, et ma olen lihatööstuse juht ja toksin arvutisse küsimuse, et miks mu viimase kahe nädala müük on madalam kui mullu samal ajal.

Just. Selliste asjade juurde me tahakski tegelikult jõuda, aga kuidas seda teha, ei oska keegi väga täpselt öelda. Selle kallal tehakse praegu massiliselt tööd.

TalTechi tarkvarateaduse instituudi professor Tanel Tammet ja doktorant-nooremteadur Elli Valla TalTechi Innovatsioonifestivalil 5. juunil 2024 | Foto: TalTech

Mõnel maailma riigil on oma AI-strateegiad juba olemas, et proovida AI jaoks ette valmistuda. Tundub, et Eestis me seda väga palju ei tee. Kas me peaksime riiklikul tasemel praegu midagi tegema või on selleks liiga vara ja me ei oskakski midagi ette võtta?

Kindlasti oleks tark, kui inimeste hulk, kes oskab keelemudelitega midagi praktilist ette võtta ja neid uurida, oleks suurem. Rahvast pole vaja massiliselt harida, sest inimesed saavad ise ka aru, mis on põnev, nad lähevad ja katsetavad, aga spetsialistide hulka oleks küll väga mõistlik suurendada.

Nii et ülikoolis tuleks avada uus bakalaureusekava?

Pigem ma ütleksin, et olemasolevaid kavasid oleks mõttekas sättida niimoodi, et kompetents kasvaks. Ülikooli tuleks võtta inimesi, kes on nende asjadega juba tegelenud ja ega neid polegi väga palju kusagilt võtta. Tudengeid on ka vaja motiveerida, et nad teeksid keerulisi asju, sest loomu poolest kaldub tudeng lihtsate asjade poole, kes see ikka viitsib keerulisi asju ette võtta.

Me oleme täna ChatGPT 4.0 versioonis. Millise versiooni saab sinu arvates võtta südamerahuga tootvasse töösse nii, nagu me täna kasutame Excelit ?

Pole aimugi. Prognoosid algavad poolest aastast kuni selleni, et taolist asja ei tule mitte kunagi. Täiesti targad inimesed arvavad ühte ja arvavad teist ning kummalgi pole sellisteks oletusteks alust. Kõik pakkumised on tehtud kõhutunde pealt.

Mina arvan, et see värk tuleb, aga mitte poole aasta pärast, see tuleb üles-alla lainetustena, kuid pidevalt kasvades.

Suured keelemudelid enam lõpmatult palju ei arene, tõenäoliselt lisanduvad neile natuke teistsugused tehnoloogiad. Sellised asjad, mis saavad inimese jutust aru ja oskavad talle vastata midagi mõistlikku, kasvavad igal juhul. Ma olen optimist ja arvan, et midagi hirmsast ei juhtu ja seisma see asi ei jää.

Nii et sina Jaan Tallinna ja mitmete teiste inimeste maailmalõpumeeleolu ei jaga?

Ei jaga. Ma saan neist aru ka, riskid on kuigivõrd olemas, aga sõltub, kui suureks keegi mingit riski peab. Meil pole ka eriti võimalusi neid riske maandada. Nende ürituste mõju, et midagi pidurdada või reguleerida, on prognoosimatu. Need ei pruugi mitte midagi paremaks teha.

Targem on võtta vastu see, mis tulema peab?

Mingi piirini. Ühte riski saaksime maandada, kui me ise sellesse usume ja sellega tegeleme. Kogu see arvutivärk üldisemalt on üks suur risk.

On võimalik väga hästi automatiseerida suuri tööprotsesse, nii et see aitab kaasa tsentraliseerimisele. Saad teiste süsteemidega kaugelt sidet pidada ja nii edasi. Tänu sellele on olemas Amazon, Google, Bolt, Wise ja kõik sellised asjad.

Suurfirmad monopoliseerivad majandusest üha rohkem suuri tükke, nii et väikesed tegijad jäävadki väikeseks. See toob automaatselt kaasa suurema majandusliku ja sotsiaalse kihistumise, see hakkab kaasa riigivõimu tsentraliseerumisele ja demokraatia vähenemisele, sest kui majandus tsentraliseerub, teeb poliitika sama.

Sellised asjad on ajaloos viinud alati päris jõledate olukordadeni, mis lõppevad sõdade, revolutsioonide ja ei tea millega. Kasvab risk, et senine rahulik ühiskondlik elu ei jätku. See on päris suur risk.

Tehisintellekt aitab sellele kaasa, muutes tsentraliseerimist veelgi kergemaks ja paremaks. Me näeme ju praegugi, et AI on põhiliselt suurfirmade käes.

See on kogu ühiskonna mure ja siin on küll võimalik inimestel midagi ära teha, püüdes jälgida, et monopole väga ei soodustata ja et väikesed saaksid ka elada. See on päris keeruline, aga tehtav asi.

Siin vist AI-st palju abi ei ole, vaid see osa tuleb meil endal ära teha.

See tuleb täitsa ise ära teha jah. Üks levinud arvamus, mis ei pruugi tingimata õige olla, aga natuke siiski, on see, et katsed keelemudelite ja masinate asja pidurdada on eeskätt vesi nende veskile, kelle käes need asjad juba on, sest teistel oleks raskem konkureerida.

Tanel Tammet: AI tulekuga tekib palju võitjaid

Trialoogi uudiskiri

Loe lisaks