Hääleassistendid ja kõnesüntees muutuvad AI-lahendustes üha tähtsamaks. Tippimine tüütu, palju mugavam oleks lihtsalt rääkida. Räägime, kuidas tänased tehisintellekti häälemudelid juba töötavad, millised on nende tugevused ja piirangud. Kuidas kohandada AI-d loomulikuks suhtluseks eesti keeles. Vaatame, kuidas AI vastab kõnele ilma et peaks heli esmalt tekstiks muutma.
Vestle podcasti teemal AI-ga
Kliki siin ja küsi podcasti kohta küsimusi.
Katse AI Karmeniga eesti keeles
Saade algas hääleassistendi Karmeni demoga. See oli katse, kus AI kõnesüntees tegi saate sissejuhatuse. Karmen töötas ChatGPT 4o mudelil ja oli ühendatud läbi telefoni. See põhjustas viivitust ja mõningast katkendlikkust. Priit ja Henrik tõdesid, et täna on juba olemas paremaid, soravamaid häälemudeleid, aga need ei pruugi veel hästi eesti keelt toetada.
Miks hääleassistendid muutuvad oluliseks?
Priit tõi välja, et inimesed ei taha väikeste ekraanide peal tippida, häälega suhtlemine on loomulikum. Arvutid ja telefonid on klaviatuurile orienteeritud lihtsalt sellepärast, et varem polnud paremaid viise. Tänaseks on tehnoloogia arenenud sinnamaani, kus vestluspõhine kasutajaliides saab olla peamine.
Katsetused OpenAI Playgroundis
Priit kirjeldas, kuidas ta testis OpenAI API kaudu häälemudelit. Ta rääkis robotiga otse mikrofoni kaudu, kusjuures heli analüüsiti kohe ilma vahepealse tekstiks muutmiseta. Roboti algne reaktsioon oli liiga pikk ja monotoonne, aga pärast prompti muutmist, et vastused oleksid lühemad ja dialoogilised, muutus suhtlus loomulikumaks ja kiireks.
Robotite loogika ja parandusvõimalused
Henrik selgitas, et roboti monotoonsust ja liigset formaalsust saab promptidega korrigeerida. Näiteks võib anda käsu, et AI teeks mõtlikke pause, kasutaks vahehelisid nagu “noh” või “hmm” ja räägiks inimesele omasemalt. Ta lisas, et kasutab kodus Alexa’t juba kuus aastat ning lapsed oskavad seda loomulikult kasutada.
Kasutuskohad ettevõtluses ja teeninduses
Priit tõi näiteid, kus AI võiks asendada inimese: näiteks kliinikute kõned patsientidele, kes peavad kinnitama oma tulekut. See hoiaks kokku töötundide arvelt. Inkassos võiks AI võtta ühendust juba varakult, enne kui probleem suureks kasvab. Samuti võiks AI teha järelpärimisi enne maksetähtaega, et vältida vaidlusi.
Henrik lisas, et isegi kui osa inimesi ei soovi robotiga rääkida, siis saab AI info edasi anda päris inimesele. Enamik inimesi ei pahanda, kui robot helistab, eriti kui ta räägib normaalselt.
Kliendikõnede kvaliteedi analüüs
Arutati, et täna kuulatakse kõnekvaliteedi hindamisel ainult negatiivseid juhtumeid. Tegelikult oleks väärtuslik ka positiivseid kõnesid kuulata, et mõista, miks need töötasid. Sellest võib õppida rohkem kui vigade otsimisest.
Eesti keele toetus ja murdeprobleemid
Räägiti varasemast projektist, kus katalaani arendaja õpetas AI-d eesti keeles rääkima, robot sai aru, kuigi inimesed mitte. See näitab, et hääleassistente saab õpetada erinevate aktsentidega ja mudelite treenimine on võti. Eesti ja soome keel võivad inimesele tunduda täiesti erinevad, aga vektormaailmas on nad lähedased.
Muud praktilised kasutusvaldkonnad
Näiteks teenusepakkujad, kes saavad kõnesid automatiseerida. Või eakad inimesed, kelle jaoks on AI-ga häälsuhtlus palju kergem kui ekraani kasutamine. Sama kehtib puuetega inimeste kohta, näiteks pimedad, kes kasutavad tekstipõhiseid lahendusi, aga kellele häälega juhtimine võiks olla palju loomulikum ja kiirem.
Meelelahutus ja uudiste tarbimine
Hääleassistentidega saab mängida mänge, nagu Priidu lapsed teevad Alexa abil. Samuti võiks AI teha uudistest kokkuvõtteid ja lugeda neid kasutajale ette. Priit siiski tõdes, et tema eelistab lugeda, mitte kuulata, sest loetud info omandamine on tal kiirem.
Kogemused olemasolevate tööriistadega
Priit demonstreeris Google AI Studio vahendit, millega saab tasuta luua oma hääleassistendi ja panna see näiteks WordPressi tööle. Ta mainis ka OpenAI tasulist mudelit, kus 10 minuti jutuajamine maksis umbes 1 euro. Henrik katsetas Elevenlabsi, mis pakub häälekloonimist, aga Eesti keele tugi oli nõrk, tulemus tuli tugeva soome aktsendiga.
Saates mainitud tööriistad ja muud viited
- Vapi.ai: Voice AI agents for developers
- Twilio: Build voice experiences that increase customer satisfaction and unlock ROI with data and AI.
- Survivorship bias lennukite alla tulistamisest
- Thinking, Fast and Slow, Daniel Kahneman
- Peegelneuronid
- Haridusprogramm TI-Hüpe 2025 raames saavad Eesti koolinoored ja õpetajad juurdepääsu maailma juhtivatele tehisintellekti õpirakendustele
- Claude voice mode
- Google AI Studio häälemudeli demokood
- OpenAI playground realtime vestlused
- Elevenlabs kõne klienditeeninduse agent
Sarnaselt helifailide loomisele on võimalik tehisintellekti abil automatiseerida ka sotsiaalmeedia postituste ja visuaalide tootmist.
AI kõne hakkab üha rohkem igapäeva ellu jõudma
AI hääleassistendid sobivad ideaalselt kõikjale, kus on vaja lihtsaid, korduvaid, kiireid kõnesid. Näiteks eeltöö müügikõnedele või küsimustele vastamine ooteajal. Samuti soovitati kõigil katsetada olemasolevaid tööriistu, nii tasuta kui tasulisi, ning tuua AI hääled oma teenustesse. Samas tõdeti, et avalikus ruumis häälega telefoni kasutamine võib tunduda kohatu, aga teatud olukordades on see väga mugav.


