Praktiline AI Podcast: Tehisintellekt ja kõnesüntees eesti keeles

Hääleassistendid ja kõnesüntees muutuvad AI-lahendustes üha tähtsamaks. Tippimine tüütu, palju mugavam oleks lihtsalt rääkida. Räägime, kuidas tänased tehisintellekti häälemudelid juba töötavad, millised on nende tugevused ja piirangud. Kuidas kohandada AI-d loomulikuks suhtluseks eesti keeles. Vaatame, kuidas AI vastab kõnele ilma et peaks heli esmalt tekstiks muutma.

Vestle podcasti teemal AI-ga

Kliki siin ja küsi podcasti kohta küsimusi.

Katse AI Karmeniga eesti keeles

Saade algas hääleassistendi Karmeni demoga. See oli katse, kus AI kõnesüntees tegi saate sissejuhatuse. Karmen töötas ChatGPT 4o mudelil ja oli ühendatud läbi telefoni. See põhjustas viivitust ja mõningast katkendlikkust. Priit ja Henrik tõdesid, et täna on juba olemas paremaid, soravamaid häälemudeleid, aga need ei pruugi veel hästi eesti keelt toetada.

Miks hääleassistendid muutuvad oluliseks?

Priit tõi välja, et inimesed ei taha väikeste ekraanide peal tippida, häälega suhtlemine on loomulikum. Arvutid ja telefonid on klaviatuurile orienteeritud lihtsalt sellepärast, et varem polnud paremaid viise. Tänaseks on tehnoloogia arenenud sinnamaani, kus vestluspõhine kasutajaliides saab olla peamine.

Katsetused OpenAI Playgroundis

Priit kirjeldas, kuidas ta testis OpenAI API kaudu häälemudelit. Ta rääkis robotiga otse mikrofoni kaudu, kusjuures heli analüüsiti kohe ilma vahepealse tekstiks muutmiseta. Roboti algne reaktsioon oli liiga pikk ja monotoonne, aga pärast prompti muutmist, et vastused oleksid lühemad ja dialoogilised, muutus suhtlus loomulikumaks ja kiireks.

Robotite loogika ja parandusvõimalused

Henrik selgitas, et roboti monotoonsust ja liigset formaalsust saab promptidega korrigeerida. Näiteks võib anda käsu, et AI teeks mõtlikke pause, kasutaks vahehelisid nagu “noh” või “hmm” ja räägiks inimesele omasemalt. Ta lisas, et kasutab kodus Alexa’t juba kuus aastat ning lapsed oskavad seda loomulikult kasutada.

Kasutuskohad ettevõtluses ja teeninduses

Priit tõi näiteid, kus AI võiks asendada inimese: näiteks kliinikute kõned patsientidele, kes peavad kinnitama oma tulekut. See hoiaks kokku töötundide arvelt. Inkassos võiks AI võtta ühendust juba varakult, enne kui probleem suureks kasvab. Samuti võiks AI teha järelpärimisi enne maksetähtaega, et vältida vaidlusi.

Henrik lisas, et isegi kui osa inimesi ei soovi robotiga rääkida, siis saab AI info edasi anda päris inimesele. Enamik inimesi ei pahanda, kui robot helistab, eriti kui ta räägib normaalselt.

Kliendikõnede kvaliteedi analüüs

Arutati, et täna kuulatakse kõnekvaliteedi hindamisel ainult negatiivseid juhtumeid. Tegelikult oleks väärtuslik ka positiivseid kõnesid kuulata, et mõista, miks need töötasid. Sellest võib õppida rohkem kui vigade otsimisest.

Eesti keele toetus ja murdeprobleemid

Räägiti varasemast projektist, kus katalaani arendaja õpetas AI-d eesti keeles rääkima, robot sai aru, kuigi inimesed mitte. See näitab, et hääleassistente saab õpetada erinevate aktsentidega ja mudelite treenimine on võti. Eesti ja soome keel võivad inimesele tunduda täiesti erinevad, aga vektormaailmas on nad lähedased.

Muud praktilised kasutusvaldkonnad

Näiteks teenusepakkujad, kes saavad kõnesid automatiseerida. Või eakad inimesed, kelle jaoks on AI-ga häälsuhtlus palju kergem kui ekraani kasutamine. Sama kehtib puuetega inimeste kohta, näiteks pimedad, kes kasutavad tekstipõhiseid lahendusi, aga kellele häälega juhtimine võiks olla palju loomulikum ja kiirem.

Meelelahutus ja uudiste tarbimine

Hääleassistentidega saab mängida mänge, nagu Priidu lapsed teevad Alexa abil. Samuti võiks AI teha uudistest kokkuvõtteid ja lugeda neid kasutajale ette. Priit siiski tõdes, et tema eelistab lugeda, mitte kuulata, sest loetud info omandamine on tal kiirem.

Kogemused olemasolevate tööriistadega

Priit demonstreeris Google AI Studio vahendit, millega saab tasuta luua oma hääleassistendi ja panna see näiteks WordPressi tööle. Ta mainis ka OpenAI tasulist mudelit, kus 10 minuti jutuajamine maksis umbes 1 euro. Henrik katsetas Elevenlabsi, mis pakub häälekloonimist, aga Eesti keele tugi oli nõrk, tulemus tuli tugeva soome aktsendiga.

Saates mainitud tööriistad ja muud viited

Sarnaselt helifailide loomisele on võimalik tehisintellekti abil automatiseerida ka sotsiaalmeedia postituste ja visuaalide tootmist.

AI kõne hakkab üha rohkem igapäeva ellu jõudma

AI hääleassistendid sobivad ideaalselt kõikjale, kus on vaja lihtsaid, korduvaid, kiireid kõnesid. Näiteks eeltöö müügikõnedele või küsimustele vastamine ooteajal. Samuti soovitati kõigil katsetada olemasolevaid tööriistu, nii tasuta kui tasulisi, ning tuua AI hääled oma teenustesse. Samas tõdeti, et avalikus ruumis häälega telefoni kasutamine võib tunduda kohatu, aga teatud olukordades on see väga mugav.

podcast cover

Amperly AI Agentuur