Kirjutatud 7. novembril 2002.
Muudetud 14. november 2002. a.
Kirjutamise ajal on pros1.dll 25. oktoobri versioon. ks.udr on 28. oktoobri oma. Teised failid on valdavalt vanemad.

Eesti süntesaatori puudused

Panen siia kirja eesti süntesaatori vead. Need on jaotatud lähtuvalt kasutaja seisukohast . Võimalik, et programmi sisemise korralduse järgi tuleks neid kuidagi teisiti grupeerida või on näiteks mitmel puudusel tegelikult üks põhjus või näivalt sarnastel puudustel palju erinevaid põhjusi (tuleks see tekst jaotada rohkemateks tükkideks).

Need toodud puudused on täiesti minu isiklik arvamus. Kõne kvaliteedi hindamine on suuresti subjektiivne tegevus, kui seda teha vaid kõrvade abil ja ilma vastava teooriata.

Toodud puudused olen püüdnud reastada olulisuse järjekorras, kuid seda ainult üldjoontes. S.t. esimesena toodud asi on minu meelest olulisem kui eelviimasena toodud, kuid ei pruugi olla olulisem kui neljandana kirja pandud.

Üksikute sõnade hääldusvead olen toonud ära eraldi.

Puudused

  1. Teksti kaotsiminek

    Minu arvutis esineb küllaltki tihti, et eesti süntesaator jätab kas osa sõnast või lausa terve sõna ütlemata. Pärast sama tekstiosa "ülelugemist" on puuduv tekst täiesti olemas ja loetakse ette nagu eesti süntesaatorile kombeks.
    Olen sama viga märganud veel kahes arvutis. Kokku siis 3 arvutit, kus selline asi esineb. Igas neist on erinev helikaart ja erinev JAWS-i versioon.
    Süntesaatori katsetamiseajal kõige esimese (juunis saadud) 04b versiooniga, sellist teksti kaotsiminekut ei mäleta. Võimalik, et ei märganud lihtsalt.
    Kõigil hilisematel versioonidel on see nähtus esinenud. Ühel kasutajal oli kahtlus, et eriti sagedasti juhtub seda liitsõnadega. Ise ei oska seda arvamust ei kinnitada ega ümber lükata.
    Tean, et JAWS-l pidi olema probleeme mingite helikaartidega. Kas just kõigi nende kolmega?
    JAWS-i enda Eloquence katkestab kõne minu arvutis kuid ainult vahel ja väga lühikeseks ajaks, st. see on vähe või lausa raskesti märgatav.
  2. Tähtede kaotsiminek või nende muutumine välja öeldud tekstis halvasti märgatavaks.

    näiteks: kurb, kurg, jäeks,
    Selline asi raskendab tekstist arusaamist. Eriti kui on tegemist kohanimede, isikunimede või muu sellisega või terminite või teiste eesti keeles otseselt mitte esinevate sõnadega, kus iga üksikul tähel on väga tähtis koht. Ka toodud näidetega sarnased juhtumid häirivad oluliselt tekstist aru saamist.
    Aeglasemal lugemiskiirusel on see efekt vähem märgatav.
  3. Välte probleemid

    Küllaltki häiriv on sõnadeütlemine valedes väldetes. Osadel juhtudel on tegu sõna käände/pöörde määramisel tehtud veaga. näiteks kommi (omastav) kommi (osastav) Vahel on käände/pöörde/sõnavormi vale määramise põhjuseks vigane lausekonstruktsioon. Kas sellise juhtumiga annab midagi ette võtta, ei oska arvata.
    Tihti tundub olevat "r" täht kolmandas vältes pikem kui peaks.
    Näiteks: sarv, varjama
    ühesilbilised sõnad on nüüd peale pikka pingutamist sellises seisus, et tunduvad aeg-ajalt juba liiga lühikesed.
    Näiteks: ma, viis, te, on
    Liiga lühikesed ei näi nad kogu aeg, kuid tihti näivad nad sellised üksiku sõnana. Ka "on" lause lõpus tundub vahel liiga lühike.

    Mulle isiklikult tundub, et lause lõpus peaks hääldama mitmeid sõnu pikemalt kui lause keskel.


    Vältevigu esineb üksikute teiste sõnade juures veelgi, st. mingit süsteemi ei oska hetkel kirja panna.
  4. Välte jaotumine silbile

    Mulle näib, et eesti süntesaator ei jaota silbi rõhku häälikute vahel päris nii nagu eesti keeles on kombeks. Ma oletan, et sellest võib osaliselt põhjustatud olla ka probleemid "r" kolmandas vältes korral ja mõnel juhul tähe kaotsiminek, st. täht jääb lihtsalt ülerõhutatud tähe varju. Minu meelest tekitab sama asi veidi halva "ioon" lõpuliste tähtede ütlemise. Näiteks diskussioon. .
    Kui eesti sündis jaotatakse rõhk rohkemate tähtede vahel ära, siis võib muidugi tekkida mingeid teisi halbu kõrvalmõjusi. Näiteks, "r" tähe pikkust kolmandas vältes vähendati süntesaatori tegemise ajal.
  5. Võõrkeelsete või teiste eesti keeles mitte esinevate sõnade ütlemine

    Osaliselt on see puudus seotud tähtede kaotsi minekuga. Vahel tekitab probleeme mingist mitte eesti sõnast arusaamine kui eesti süntesaator otsustab seda lugeda tähthaaval.
    Näiteks: html silt
    </li>

    loetakse nii. Kuid näiteks <li> loetakse sõnana.

    Vahel oleks muidugi ka kasulikum, kui mõnda sõna öeldaks tähthaaval. Nii pole oluline, et eesti süntesaator ütleks iga hinna eest kõiki sõnu seostatud sõnana. Olulise probleemide ringi moodustavad programmeerimises vms kasutatavad sõnad.
    Selles olukorras oleks abiks, kui eesti süntesaator ütleks taolisi tundmatuid sõnu hästi hoolikalt. eesti keele reeglite puhul oleks see ehk piisav.

  6. Kahetäheline tundmatut liiki sõna, mille esimene täht on suur

    Näitena on selline sõna "Go" Antud sõna loeb eesti süntesaator hoopis eriliselt. Ta ütleb esimese suure tähe välja, selle näite korral ütleb "ge" ning liidab selle otsa pisikese pausiga järgneva tähe "o". Kokku tuleb siis umbes geo. Häälduselt sarnaneb see ilmselt liitsõnaga ge_o. (oletan nii).
    Vahel tundub sõnaalguse suurtäht muutvat sõna hääldust ka siis, kui sõna on pikem kui 2 sümbolit.
  7. Ingliskeelsete sõnade hääldamine

    Kuidas hääldada ingliskeelseid sõnu eesti süntesaatori poolt, seda peaks otsustama suurem grupp kasutajaid. Tegemist on suuresti eelistuste küsimusega.

    Mina arvan, et praegu kasutatakse seda võimalust natuke liiga julgelt. Minu sellist arvamust mõjutab kindlasti harjumus. Enne kasutatud süntesaatorid nii ei teinud. Selliste vaidlust tekitavate küsimuste puhul on alati kõige parem lahendus jätta otsuse tegemine iga kasutaja hooleks, kuid väga paindliku süsteemi tegemine on ilmselt küllaltki keerukas. Lisaks peaks süsteem olema kasutajale hõlbus kasutada, et ta üldse läheks midagi seal muutma. Kui valdavalt kasutataks eesti süntesaatorit tootja seadistusega, siis poleks suure töö tegemine paindlikuse suurendamiseks ilmselt väga mõtekas.

    Minu isiklik eelistus on muidugi paindlik süsteem

    Kui teha vähem paindlik süsteem, siis minu meelest võiks lähtuda sellest seisukohast, et hääldust muudetakse põhiliselt ainult nende sõnade puhul, mis esinevad eestikeelse teksti sees. Sõnade puhul, mis esinevad põhiliselt ainult arvuti töökeskkonnas jälgitaks , et neid loetaks korrektselt, kuid neid hääldatakse just nii nagu kirjutatakse.

    Näiteks uues eesti süntesaatori versioonis öeldakse "to" (TO) "tu". Selle täiustuse kõrvalmõjuna (oletan öeldakse sõna "toda" "tuuda".

    Võimalik, et põhjus on ka milleski muus.

    Kui on siiski võimalik, et üksikute sõnade häälduse muutmine võib muuta ka selle sõna hääldust mingi teise sõna sees, siis tuleks olla muutmistega ettevaatlikum. Sellele oletusele tuginebki suuresti minu arvamus, et praegu kasutatakse häälduse muutmist liiga julgelt.
    Teine põhjus, miks mulle praegune stiil väga ei meeldi on see, et hetkel kuuleb vahel taolisi asju:

    "tu you want tu save the changes you made tu ..."

    st. ingliskeel häälduse järgi ja kirjapildi järgi segamini. Suuresti maitse ja harjumuse asi muidugi.
    Argumendiks praeguse hääldusstiili vastu on ka see, et inimesed ei kuule kirjapilti ja hakkavad sõnu valesti kirjutama, kuid teisest küljest jälle praegu on mugavam teksti kuulata. See on ka oluline. sellele arutelule võib lisada kergesti uusi poolt- ja vastuargumente.

  8. Lühendid

    Lühenditega on üldjoontes sama seis kui ingliskeelsete sõnadega. Kellele meeldib nii, kellele na. Püüan ise mõne aja jooksul mõne lühendifaili juurde teha. Lihtsalt õige fail õigesse kohta kopida pole ehk väga raske töö. Siis saab mõni inimene endale sobilikuma hääldusviisi ja ehk selgust ka, milline peaks lühendite fail olema ja kas peaks üldse neid mitu olema.

    Minule isiklikult praegune fail küll ei meeldi. Lihtsalt ma kasutan seal määratletud lühendeid aeg-ajalt mingite teiste asjade lühendamiseks.

  9. Sõna "kas" liitlauses

    Kui liitlauses esineb sõna "kas", siis kasutatakse kohe kas-küsilause intonatsiooni.
  10. Hääletooni muutused

    Praegune Hääletoonimuutus tundub olevat vähem hakkiv ja väsitav kui esialgne, kuid monotoone. Eriti lause lõpp, kus hääl muutub veidi laulvaks. Praeguse häälduse juures on veidi raske ka eristada kas kaks üksteise järel tulevat ühesilbilist sõna on kirjutatud kokku või lahku.
    Näiteks:
    Ma ka.

    Ehk on see põhjustatud osaliselt ka sellest, et süntesaatori tegemise käigus vähendati algul ekstra ühesilbiliste sõnades põhitooni langust ja seejärel tehti seda kogu lausega ning kõigi sõnadega. (minu oletus)

    Minu meelest siiski võiks kõne olla pigem monotoone kui ilmekas ja raskesti kuulatav. Ühes raadioajakirjanduse õpikus oli ka diktoritele soovitus, et kui nad ei suuda/oska õigeid kohti rõhutada, siis lugegu parem monotoonselt. Siis jääb kuulajal võimalus ise mõtes rõhud sobivasse kohta asetada.

  11. Palatalisatsioon

    Palatalisatsiooniga on kaks rühma probleeme.
    esiteks topelt täishääliku järgi olevad palataliseeritud tähed.
    näiteks: juuli, tuulik
    teiseks topelt s.
    näiteks: massöör, ekspressbusse
    Selle viimase "ekspressbusse" korral annab liitsõna moodustamine mingi lisaefekti. Kumbki osasõna eraldi on tunduvalt parema hääldusega.
  12. Erandlik kirjavahemärkide kasutus

    Praegusel hetkel käsitleb eesti süntesaator kirjavahemärke sõltumata nende ümbrusest.
    Näiteks lauses: "., ,, !, ?, on kirjavahemärgid."
    ei öelda kirjavahemärke välja, kuigi peaks. Nende asemel on aga paus. Osaliselt on tegu küll JAWS-i tembuga, sest loe.exe-s öeldakse alguse osa "punkt, koma koma " välja. Kas selle vea parandamine eesti kõnesüntesaatoris annab JAWS-ga koos töötamisel ka mingi kuuldava tulemuse, seda ei oska öelda. Praeguste setingute juures otsustab JAWS kirjavahemärkide puhul kas neid üldse eesti kõnesüntesaatorisse saata. Kui ta otsustab, siis saadetakse nagu nii kirjavahemärgile vastav tekst ja mitte märk ise.
    Siiski peaks saama seda asja muuta.
  13. Erisümbolid

    Nii palju kui olen katsetanud, pole ma selgust saanud, mis süsteemi järgi ütleb eesti süntesaator ebaharilikke sümboleid. Näiteks ansi 0211, 0212, 0213 jne. Katsetasin neid tegelikult kuskil 0200 kuni 0240-ni.

    Minu meelest võiks ta parem öelda sümboli koodi kui et ta ütleb midagi suvalist. Siis ma vähemalt teaks, mis sümbol oli.
    No jah, see on ka kindlasti maitse küsimus. Kõige parem oleks muidugi, kui öeldaks just selle sümboli nimi või vastav häälik mis süntesaatorisse jõuab. Ja kui lisaks oleks asi sätitav kasutaja poolt, oleks veel parem. No näiteks, mida täpselt öelda ja kas selle või teise sümboli puhul üldse midagi öelda.
    Selle töö võib ka muidugi jätta süntesaatorile teksti ettevalmistava programmi hooleks. Pimedate puhul siis ekraanilugeja. Loodetavasti saavad nad oma tööga hästi hakkama.

  14. Kaja sõna lõpus

    Kui panna eesti keele kõnesüntesaator hästi aeglaselt rääkima, siis on kuulda nö kaja sõna lõpus. Sarnane nö kaja esineb ka sõna sees tähtede vahetamisel, õigem oleks vist öelda foneemide vahel.
    Suurema rääkimiskiiruse korral on seda ka hoolikal kuulamisel veidi märgata. Asja juures on huvitav see, et mitte iga sõna lõpus pole see kaja ühesugune. Näiteks "p" tähega lõppevate sõnade lõpus on see üsna väike. Kõige vähem on minu meelest seda "l"-ga lõppevate sõnade lõpus ja kõige rohkem "a"-ga lõppevate sõnade lõpus.
  15. "I"-täht

    "i"-tähe hääldus on minu meelest veidi liiga terav.
    näiteks: nii, kriips, siit
  16. Puuduv häälik

    Minu meelest võiks kaaluda häälikute hulka
    "Jane"
    tähe lisamist. Eesti süntesaatoris on praegu nagu nii tavaks järgida hääldust ning see häälik on tänapäeval reaalselt eesti keeles kasutuses.

    Aga jah, tegu on rohkem ilu ja täiuse veaga :) Kui otsida, siis leiaks kindlasti veel häälikuid, mida tuleks lisada. Näiteks murde sõnade jaoks.

  17. Ebatavaliselt mitmekordsed tähed

    Eesti keele kõnesüntesaator eristab minu meelest liiga halvasti seda kui mingis sõnas on tähtede kordsus suurem, kui eesti keele grammatikas tavaks.
    Näiteks: maakks, "Vaaaata, kes tuli!"
    Põhiliselt tuleb see probleem esile, kui otsida tekstist kirjavigu või on mõne sõna olulisust rõhutatud tähtede topeldamisega.
  18. Rooma numbrid, arvud üldse

    Omaette problemaatika on arvude ütlemine. Siin on minu meelest otsustav kasutajate harjumus ja kui õieti suudab süntesaator neid ära tunda.
    Mulle isiklikult meeldiks, kui rooma numbreid öeldaks numbritena juba siis, kui on kaks sobivat tähte kõrvuti. Tean ka, et esineb vastupidiseid seisukohti, et tuleks valdav osa sõnu öelda välja nii, nagu nad kirjutatakse. Seda ka ilmse rooma numbri puhul.
    Rooma numbrite arvuna ütlemisel on jälle raske vahet teha, kas tegu on araabia või rooma numbriga. Kontekst ei luba alati seda teha. Minu meelest võiks selle probleemi lahenduseks olla see, kui rooma numbrid oleks alati mingis käändes või et rooma numbreid käänataks, kuid araabia omi mitte.
    Selline lahendus võib muidugi kaasa tuua uusi probleeme.
  19. Rääkimise kiirus

    Praegu on mingi ebakõla JAWS-i setingute ja eesti süntesaatori kõne kiiruse vahel. JAWS-ga kaasa tulev süntesaator Eloquence on mul seatud kiirusele40 % ja eesti süntesaator kiirusele 93 %, kus juures pigem on Eloquence rääkimiskiirus suuremgi kui eesti süntesaatori oma.
    Kui aga sean loe.exe kiiruse maksimaalseks, siis sarnaneb see laiaslaastus Eloquence maksimaalse kiirusega, st. on minu jaoks liiga kiire. Loe.exe-s on mulle umbes paras kiirus 0.4. Praegune JAWS-ga kasutatav kiirus vastab umbes loe.exe kiirusele 0.5 Kui eksin, siis on tegu kiiruse alahindamisega, ehk JAWS-s kasutatav kiirus vastab umbes loe.exe kiirusele 0.4.
    Siiski arvan, et 0.5
  20. Teine hääl

    Eesti süntesaator võiks ju mitte poissmeheks jääda ja enda kõrvale ka Linda saada., st lisaks ka naise häälega rääkida.

Kokkuvõtteks

Minu meelest jagunevad praegused puudused järgmiselt:
  1. Sisendtekst ei vasta oodatavale ja selle töötlemisel tekivad vead. nö süntesaatori lollikindluse probleem.
  2. Süntesaatori sisemised vead. Näiteks sõnu on puudu sõnastikes, sõnu analüüsitakse valesti, vms
  3. Kõiki eesti keele kõnesünteesiks vajalikke uurimisi pole lõpetatud. Näiteks kõnetooni muutused, välte muutused vastavalt sõna kohale ja rollile lauses, vms.

Artur Räpp



< tagasi avalehele