RAZVOJ SINTETIZATORA GOVORA ZA HRVATSKO I SRPSKO GOVORNO PODRUČJE
Mario Perčinić i Vlado Delić
Savez slijepih Hrvatske, Zagreb, Hrvatska
email: alf@net4u.hr
Fakultet tehničkih nauka, Novi Sad, Srbija i Crna Gora.
SAŽETAK
Pojava govornih tehnologija, a posebno sintetizatora govora na osnovu teksta, od izuzetnog je značaja za osobe sa oštećenjem vida, ali ima i daleko širi značaj. U ovom radu data je retrospektiva pojave čitača ekrana i sintetizatora govora na osnovu teksta sa posebnim osvrtom na pojavu ovih softvera i tehnologija na srpskom i hrvatskom govornom području.
1. UVOD
Na južno-slovenskom govornom području, posebno u okviru bivše Jugoslavije, nalazi se preko 25.000 osoba sa oštećenjem vida. Za njih je pojava govornih tehno-logija na srpskom i hrvatskom jeziku od izuzetnog zna-čaja, jer im omogućuje da samostalno koriste računare i pomoću njih čitaju i pišu, pa i pismeno komuniciraju preko Interneta. Pomoću novih govornih tehnologija osobe sa oštećenjem vida mogu samostalnije da se informišu, ravnopravnije obrazuju, osposobe za mnoge nove poslove i lakše integrišu u društvene tokove života i rada.
U ovom radu prikazan je razvoj sintetizatora govora na osnovu teksta koji u kombinaciji sa čitačima ekrana omogućuju samostalni rad na računaru osobama sa oštećenjem vida. Posebno je opisano kako su se ove tehnologije pojavile na hrvatskom i srpskom govornom području.
2. RAZVOJ ČITAČA EKRANA I SINTETIZATORA GOVORA U SVETU
U drugoj polovici 80-ih godina započela je priča oko razvoja sintetizatora govora i softverskih paketa koji su u stručnoj tj. informatičkoj literaturi dobili naziv screen readers, ili čitači ekrana.
Čitač ekrana je softverski paket koji sve naredbe i vizualne elemente, pretvara u zvuk uz pomoć govorne jedinice ili Brajevo pismo uz pomoć Brajevog retka. Brajev redak je elektronski uređaj koji se spaja na neki od portova računala (serijski, paralalelni, danas sve više USB) koji uz pomoć čitača ekrana, sav text s ekrana pretvara u Brajevo pismo. Sva slova se ispisuju u jednom redu a svako slovo ima svoju ćeliju, tj. mjesto na kojem se slovo ispisuje. Kao i kod različitih vrsta hardverskih sintetizatora govora, postoje i različite vrste Brajevih redaka: s manje ili više ćelija, (18, 20, 26, 32, 40, 80), s boljom ili lošijom kvalitetom točkica, ili sa manje ili više dodatnih funkcija. Na primer, na gotovo svim Brajevim retcima, danas je normalno da se iznad retka u kojem se ispisuju slova nalaze dodatne tipke. Te tipke su korisne kada slijepa osoba npr. pretražuje Internet stranicu i kada dođe do linka. Tada će kursor titrati na početnom slovu linka, a uz pomoć dodatnih tipaka koje se nalaze iznad retka moguće je automatski kliknuti na link bez korištenja tastature.
Na samim počecima razvoja čitača ekrana i sinteti-zatora govora na osnovu teksta, govor se reproducirao preko skromnih zvučnika tadašnjih računala što je rezul-tiralo vrlo lošom i gotovo nerazumljivom kvalitetom izgovora. Zbog toga se započelo s proizvodnjom hardverskih govornih jedinica (hardverskih sintetizatora govora) koji su se spajali na serijski port računala i koji su govorili isključivo engleski. Kvaliteta izgovora je bila različita, od robotske koja je bila na granici razum-ljivosti, pa do gotovo ljudskog načina izgovora. Na žalost, svaki proizvod uključujući i njegovu kvalitetu ima i svoju cijenu. Prije 20-15 godina, za lošiju govornu jedinicu, (Accent, DoubleTalk, SmartTalk, SpeakOut itd.) korisnik je morao izdvojiti minimalno 500 dolara, dok je tada najbolja govorna jedinica (DECtalk Express) koja se i danas koristi, koštala 6000 dolara. Danas DECtalk USB košta 695 dolara, [2].
Paralelno s razvojem govornih jedinica, razvijali su se i čitači ekrana (tj. screen readeri). U početku su to bili programi za operativni sustav DOS, od kojih se naj-boljim pokazao program Vocal-Eyes kojeg je proizvela tvrtka GW Micro, a nekoliko godina kasnije tvrtka Henter Joyce napravila je Jaws for DOS screen reader.
Svi ovi softveri radili su vrlo dobro sa svim govor-nim jedinicama koje su mogle govoriti na engleskom jeziku, međutim, postojalo je sve više interesa od strane korisnika koji nisu izvorni engleski govornici, za proi-zvodnju ovakvih softversko-hardver-skih rješenja.
Tvrtka Dolphin Computer Access, početkom 90-ih plasirala je na tržište svoj čitač ekrana pod nazivom HAL, a paralelno s njim proizvedena je i hardverska go-vorna jedinica pod nazivom Apollo. HAL i Apollo su u zajedničkoj suradnji omogućili multi-jezično korištenje.
1993. u suradnji s Udrugom za unaprijeđivanje obra-zovanja slijepih i slabovidnih osoba iz Zagreba, tvrtka Dolphin Computer Access razvila je čip za izgovor hrvatskosrpskog jezika i tako su čitač ekrana HAL i govorna jedinica Apollo, mogli zadovoljiti velik dio slijepih korisnika s ex-YU područja.
1995. godine Apollo dobija mlađeg brata (Apollo2) s unaprijeđenim čipovima za izgovor uključujući i čip za hrvatskosrpski jezik, a pojavljuje se i sintetizator istog proizvođača pod nazivom Juno. Juno je, za razliku od Apollo sintetizatora, koji je podržavao do 7 jezičnih čipova, mogao podržavati 4 govorna čipa, i u sebi je imao ugrađen akumulator koji se mogao napuniti. Ovakvim rješenjem, slijepim osobama omogućeno je korištenje laptop-a na nekoliko sati u prostorima u kojima nije bilo električne energije.
Sredinom 1998. godine uz pomoć ljudi iz Centra za odgoj i obrazovanje "Vinko Bek", i tvrtke Blazie Engi-neering, slijepi korisnici računala dobili su još nekoliko proizvoda koji su podržavali rad na hrvatskom jeziku.
Tvrtka Blazie Engineering, kasnije otkupljena od Freedom Scientifica, proizvodila je elektronske bilje-žnice u nekoliko raznih hardverskih verzija. Bilježnica pod nazivom Braille&Speak je bila osnovna bilježnica koja je imala 2 MB interne flash memorije, govornu podršku, tekstualni editor, kalkulator, telefonski imenik itd. Braill Lite je bila elektronska bilježnica s kapaci-tetom od 4 MB interne memorije, i Brajevim retkom dostupnim u 2 varijante (18 i 40 ćelija).
Type&Speak i Type Lite su bile elektronske bilje-žnice veličine laptopa, koje su imale standardnu tasta-turu, koja je bila vrlo slična tastaturama na laptop raču-nalima, a Type Lite je imao 40-ćelijski Brajev redak.
Osim što su ovi uređaji služili kao elektronske bilje-žnice, bilo ih je moguće spojiti na računalo, te ih kori-stiti kao govornu jedinicu ili Brajev redak. Tako je kupnjom ovakvog uređaja korisnik mogao odjednom riješiti nekoliko stvari, umjesto da kupuje komponentu po komponentu i utroši puno više novca.
Kao sintetizator govora elektronske bilježnice Blazie Engineering koristile su Arctic sintetizatore govora, koji su bili jednostavno prilagodljivi za izgovor na druge jezike. Međutim pojavom novih modela ovakvih bilje-žnica, koje su u sebi dobile i Internet podršku (čitanje e-maila i Internet browser) njihov razvoj za hrvatsko govorno područje bio je zaustavljen, pošto se Arctic sintetizatori govora više nisu ugrađivali u iste.
Na žalost, još jedna loša strana ovih elektronskih bilježnica je nekompatibilnost sa operativnim sustavom Windows. Ako bi korisnik koristio bilježnicu, i njezin tekstualni editor, zapis bi bio zapisan u kodnoj stranici 437, koja nije bila prilagođena za hrvatsko tržište, te se takav zapis ne može čitati na današnjim računalima.
Smanjenje potražnje za hardverskim sintetizatorima govora, započinje u drugoj polovici 90-ih godina 20. stoljeća. Sveopćim razvojem informatičkih rješenja, ra-čunala, softvera, a prvenstveno igara koje su zahtijevale sve bolja multimedijalna rješenja, započelo se sa inten-zivnim razvojem sve boljih i moćnijih zvučnih kartica. Sve više zvukova se moglo čuti u prirodnim uvjetima, zbog toga što su zvučne kartice podržavale sve više opcija. Paralelno s razvojem zvučnih kartica, započinje i razvoj softverskih sintetizatora govora.
Prvi čitač ekrana koji je podržavao softversku sinte-zu na engleskom jeziku bio je Jaws for Windows 2.0 koji je radio sa Text Assist sintezom. Text Assist je dolazio u instalacijskom paketu sa zvučnom karticom Creative SB 16.
Budući da Creative nije pokazivao prevelik interes za Text Assist, njegova daljnja distribucija i razvoj su u međuvremenu zastali, a tvrtka Henter Joyce koja je proizvodila Jaws for Windows, započela je suradnju sa tvrtkom Scansoft i početkom 1998. Jaws for Windows 3.2 je dobio integriranu verziju Eloquence sintetizatora. Eloquence je u svojoj prvoj verziji podržavao engleski, njemački, talijanski, francuski te španjolski jezik, a u kasnijim verzijama dodano je još nekoliko varijanti španjolskog jezika, a od verzije 3.7 Jaws uz pomoć Eloquence-a podržava i finski.
Ono što je karakteristično za Eloquence sintetizator je njegova jako dobra kvaliteta glasa koja je potpuno sintetizirana i ne sastoji se od uzoraka snimki ljudskog glasa. Do danas Eloquence je po refleksivnosti ostala najbrža softverska sinteza govora. Na žalost za razvoj ovakve sinteze uloženo je i po nekoliko stotina tisuća dolara. Da bi se Eloquence preveo za hrvatsko-srpsko govorno područje bilo bi potrebno u startu uložiti 300.000 dolara, za što bi bila potrebna garancija vlade ili nekih drugih vodećih državnih ustanova. Zato je i objašnjivo zašto Eloquence podržava samo najveće svjetske jezike.
1999. pojavio se softverski paket TES (tekstualni editor za slijepe). TES-ova sinteza govora je funkcio-nirala na principu snimljenih slogova, koje bi računalo slagalo u riječi. Međutim, sam softver nije predstavljao sintetizator govora koji bi mogao surađivati sa čitačima ekrana, instalacija je obuhvaćala oko 600 MB prostora što je za hard-diskove od 8 GB bio poprilično velik prostor, a kvaliteta izgovora je bila vrlo loša. S obzirom da je govorna jedinica 1999. koštala 2500 DEM, TES je unatoč svojoj lošoj kvaliteti i visokoj cijeni 1000 DEM zabilježio rekordnu prodaju od 100 primjeraka tijekom prve godine njegove distribucije.
2.1. Razvoj sintetizatora govora za hrvatski jezik
Pod kraj 2000. nekoliko slijepih ljudi koji su se koristili računalom okupilo se na skupu studenata na kojem se raspravljalo o razvoju softverske govorne sin-teze za hrvatsko govorno područje. Također se uvidjelo da postoji popriličan broj korisnika računala koji se ne snalaze najbolje u korištenju standardnih čitača ekrana. Naime, da bi slijepa osoba kvalitetno iskorištavala mogućnosti koje joj neki od čitača ekrana omogućavaju, potrebno je da osoba upamti razne kombinacije tipaka, kako bi čitač ekrana izvršio određene funkcije.
Zbog toga je donešeno rješenje, da se pristupi izradi mini Linux distribucije za slijepe, koja će u sebi imati sintezu govora na hrvatskom jeziku te nekoliko najza-stupljenijih aplikacija koje slijepi korisnici računala koriste kao što su: kalkulator, tekstualni editor, email aplikacija, internet pretraživač, te pretraživač datoteka (file browser). Od početka 2001. uz pomoć vojnika koji su služili civilni vojni rok u Hrvatskom savezu slijepih, započet je rad na izradi GLS-a tj. Govornog Linuxa za slijepe, a u 9 mjesecu 2002. GLS je napokon i ugledao svjetlo dana. GLS za sintezu govora koristi MBROLA sintetizator govora koji se koristi bazom glasova sni-mljenom na Filozofskom fakultetu u Zagrebu.
U početku razvoja samog sintetizatora, govor je bio prilično monoton, zbog nikakve intonacije. Iako je sama kvaliteta bila prilično dobra zbog korištenja difonske baze, moglo ga se usporediti sa robotom koji je naučio ljudski jezik ali koji ne zna promijeniti intonaciju, nego sve govori u istom tonu. Da bi se intonacija popravila, pristupilo se izradi uzoraka rečenica koje bi bile izgovo-rene standardnim ljudskim govorom u kojima bi se koristio pravilan naglasak i intonacija. Iz takvih rečenica u MBROLA sintetizator je ugrađeno nekoliko algori-tama koji određuju kako će se sintetizator ponašati u određenim situacijama. Na primer, povišena intonacija kod upitne rečenice, ili spuštanje intonacije ako je reče-nica izjavna.
MBROLA sinteza govora je vrlo zastupljena u korištenju Linux operativnog sustava zbog njene lake adaptacije u sam sustav i pojedine čitače ekrana za Linux kao i zbog vrlo dobrih difonskih baza za pojedine jezike od kojih engleska, njemačka i francuska imaju vrlo dobre snimljene glasove te su vrlo ugodne za slušanje.
2003. godine tvrtka Indriki iz Zagreba koja je proi-zišla iz Udruge za unapređivanje obrazovanja slijepih i slabovidnih osoba, lokalizirala je češku verziju sinteti-zatora govora WinTalker Voice na hrvatski jezik. Sinteza je tada zvučala poprilično dobro, međutim najveći napredak dogodio se u ožujku 2004. kada je izašla potpuno nova verzija WinTalker Voice-a. U ovoj verziji snimljeni su potpuno novi glasovi hrvatskih spikera Zdenke Poc i Dubravka Sidora, a sam engine sintetizatora je unaprijeđen, tako da sinteza sada više ne stvara probleme sa radom na određenim računalima i operativnim sustavima poput Windows-a XP.
Još jedna od prednosti novog WinTalkera je prela-zak na SAPI5 engine rada, što je omogućilo bržu refleksivnost same sinteze, bolju kvalitetu samih glasova, te bolje iskorištavanje resursa samog računala.
Hrvatska verzija WinTalker Voice-a se danas inten-zivno koristi i trenutno je jedina softverska sinteza koja podržava rad sa svim dostupnim čitačima ekrana, zbog rada na SAPI sučelju.
Još jedna prednost korištenja i razvoja sintetizatora govora na SAPI tehnologiji je njihova relativno laka implementacija u Windows operativni sustav te povezivanje s čitačima ekrana. Na žalost Jaws for Windows koji trenutno ima najveću zastupljenost prodaje općenito, nema previše dobro razvijen driver za SAPI sintetizatore, što kod ostalih čitača ekrana nije slučaj.
2.2. Korištenje sintetizatora govora u mobilnoj telefoniji
Razvojem Symbian operativnog sustava 1998. godi-ne mobilna tehnologija počinje se razvijati u novim pravcima. Mobilni telefoni više ne služe samo za slanje SMS poruka i ostvarivanje poziva, nego se na njih počinje dodavati sve veći broj aplikacija. Ztog takvih tehničkih preobrazbi, tvrtka Nokia u svoje nove linije telefona koji su podržani pod Symbian operativnim sustavom uvela je termin pod nazivom Smart Phones (pametni telefoni). U takve telefone bilo je moguće instaliranje aplikacija koje su pisane za Symbian opera-tivni sustav, a budući da su Symbian telefoni počeli podržavati sve više radne memorije pisanje aplikacija je postalo sve složenije. Takvim razvojem događaja, bilo je pitanje vremena kada će nastati čitač ekrana za mobilni telefon.
2001. godine tvrtka Bugcom proizvela je prvi čitač ekrana pod nazivom Talks koji je radio za mobilni telefon Nokia 9210 Comunicator.
Talks čita sve funkcije telefona uključujući, menije, čitanje i pisanje SMS, MMS poruka, dostupnost mreže, trenutno stanje potrošenosti baterije, sređivanje imenika itd. Za sintetizator govora koristi se Eloquence sintetiza-torom koji je prilagođen Symbian operativnom sustavu.
Pod kraj 2002. razvojem serije 60, Nokia je počela proizvodnju jeftinijih telefona koji su također podržani pod Symbian platformom tako da je Talks danas dostu-pan i na jeftinijim modelima mobilnih telefona.
U Hrvatskoj je 2003. razvijen SMS čitač poruka za mobilne telefone. Aplikacija koristi MBROLA sintezu govora, a difonska baza je prilagođena za Symbian operativni sustav. SMS čitač funkcionira kao posebna aplikacija koja crpi informacije iz inboxa mobilnog telefona, te tako korisniku omogućava da pročita SMS poruku. Na poruku je moguće i odgovoriti ili je obrisati iz samog telefona.
U idućim mjesecima u planu je kompletan razvoj sintetizatora govora za hrvatsko govorno područje koji će raditi pod Symbian sustavom, te lokalizacija Talks čitača za mobilne telefone na hrvatski jezik.
2.3. Razvoj sintetizatora govora za srpski jezik
Prvi sintetizator govora za srpski jezik, kao har-dversku komponentu, razvili su pre desetak godina mr Bratimir Joksimović i inženjeri Ljubomir Stojanović i Slobodan Kuzmanović. To je bila kvalitetna difonska sinteza razvijana u vreme DOS operativnog sistema, koju i danas koristi nekoliko slepih ljudi u Srbiji, ali koja se nije dalje usavršavala i pratila razvoj tehnike i tehnologije. Na ETF u Beogradu, u okviru nekoliko magistarskih radova realizovane su prve čisto softverske sinteze govora. Jednu od njih, na bazi formantne sinteze realizovala je Jelena Lončarević, a drugu, difonsku sin-tezu realizovao je Siniša Ilić pod mentorstvom profesora Milana Savića.
Međutim, sve ove sinteze nisu mogle da obezbede visok kvalitet sintetizovanog govora i kao takve nisu našle širu primenu i ona se svela na uži krug slepih i slabovidih osoba u Srbiji. U međuvremenu, u krugo-vima slepih i slabovidih korisnika računara u Srbiji, najviše se raširila primena WinTalker Voice-a, ali, kao ni u Hrvatskoj, to nije poprimilo potrebne razmere.
Osnovni problem svih ovih difonskih sinteza je što su se one oslanjale na tadašnje mogućnosti računara i koristile su isključivo govorne uzorke dvoglasa pri pre-tvaranju teksta u govor. Pri tome niko nije ni pokušao da reši izuzetno složeno pitanje akcentovanja i intona-cije za bilo koji južno-slovenski jezik. To bi u značajnoj meri povećalo kvalitet sintetizovanog govora i on bi mogao da se iskoristi za mnoge nove korisničke servise i aplikacije. Pravilno intoniran i akcentovan govor može se daleko lakše razumeti, bolje pamtiti, duže i prijatnije koristiti.
Prvi sintetizator govora za južno-slovenske jezike koji uzima u obzir intonaciju i akcentovanje reči, razvi-jen je za srpski jezik na Katedri za telekomunikacije i obradu signala na Fakultetu tehničkih nauka u Novom Sadu, u okviru projekta AlfaNum i naziva se anReader. To je prva sinteza na ovim prostorima koja se ne ograni-čava samo na bazu dvoglasa nego je pripremljena i koristi se govorna baza sa 2,5 sata snimljenog govora, u kojoj su konzistentno obeležene granice i kvalitet svih fonema, tako da se sada govor sintetiše i od dvoglasa i od čitavih slogova, pa i celih reči - pronalazi se opti-malna sekvenca govornih odsečaka proizvoljne dužine i tako se postiže bolji kvalitet računarski generisanog govora. Poseban doprinos povećanju kvaliteta sintetizo-vanog govora daje akcenatsko-morfološki rečnik srp-skog jezika koji sadrži veliki broj reči (2,5 miliona) u svim svojim pojavnim oblicima (padeži, vremena...) i u kojem su označeni akcenti i još neke morfološko--sintaksičke kategorije koje omogućuju da se analizom teksta utvrde akcenti svih reči i tako formira optimalna intonacija pojedinih reči i cele rečenice. Ovaj akcenatski rečnik omogućuje da se pravilno čitaju i latinični teksto-vi bez dijakritičkih znakova na kakve nailazimo u email i SMS korespondenciji. Sa automatskim akcentovanjem i primenom daleko bogatije govorne baze postignut je značajan iskorak u kvalitetu sintetizovanog govora koji nije više interesantan samo za slepe i slabovide kori-snike raču-nara, nego i za mnoge komercijalne primene.
Za anReader je u toku 2004. godine napravljena podrška za SAPI5 tako da se on može koristiti sa svim SAPI kompatibilnim čitačima ekrana, pa i sa ovde najpopularnijim čitačem ekrana Jaws for Windows. Zahvaljujući tome slepi korisnici računara imaju na raspolaganju sve funkcionalnosti na koje su navikli koristeći Jaws, a dobijaju značajno kvalitetnije sinteti-zovan govor na osnovu teksta na srpskom jeziku.
Važna je činjenica da je put lokalizacije ove srpske sinteze na druge južno-slovenske jezike, sasvim izvestan i u narednim mese-cima će se pojavlivati verzije anReadera za hrvatsko i druga južno-slovenska govorna područja. Završen je neizvestan i dug put razvoja akcenatsko-morfološkog rečnika, velike govorne baze sa većim brojem govornih uzoraka za sve kontekste fonema, kao i moćnih algoritama pretrage koji prona-laze optimalnu sekvencu govornih uzoraka i uobličavaju je tehnikama digitalne obrade signala. AnReader je baziran na konceptu koji pruža mogućnost i za dalje usavršavanje i na tome se radi, a planirane su primene i za osobe sa patologijom govora i neme osobe umesto kojih će računar reći sve što oni napišu na srpskom, hrvatskom ili nekom drugom južno-sloven-skom jeziku.
Najzaslužniji za dosadašnji uspešan razvoj anRea-dera i pokretanje brojnih projekata na ex-YU prostorima jesu Fakultet tehničkih nauka u Novom Sadu i kompa-nija AlfaNum nazvana po projektu u okviru kojeg se na FTN već više od 10 godina sistematski i timski radi na razvoju govornih tehnologija za srpski i druge južno-slovenske jezike.
2.4. Kombinacija sintetizatora govora i čitača ekrana
Kada su HAL, Jaws for DOS ili Vocal-Eyes vršili svoje funkcije u DOS operativnom sustavu, slijepe oso-be su mogle birati koji čitač ekrana žele koristiti, ovisno o afinitetu ili području na kojem su se nalazile. Ukoliko su korisnici računala bili iz neke od europskih zemalja, tada je odabir obvezno padao na kombinaciju HAL + govorna jedinica Apollo ili Juno.
Međutim, pojavom Windows operativnog sustava, slijepim korisnicima se ispred njih postavio zid koji je nekoliko godina bio nepremostiv, jer nije postojalo rješenje kako napraviti neki Windows čitač ekrana. Srećom, tvrtka Henter Joyce koja je proizvodila čitač ekrana Jaws for DOS je krajem 1995. proizvela i Jaws for Windows 1.0 koji je radio pod Windows 3.1 i Windows 3.11 operativnim sustavima. Tadašnja verzija Jaws čitača je podržavala samo hardverske sintetizatore govora i bila je smještena na 4 floppy diska.
Sredinom 1996. tvrtka GW Micro, proizvođač čitača ekrana Vocal-Eyes, proizvela je također svojeg Win-dows nasljednika pod nazivom Window-Eyes.
Kao posljednji u nizu od najpoznatijih screen readera pojavio se HAL for Windows krajem 1996. HAL je u početku podržavao samo svoje govorne jedinice, što mu je odmah u startu smanjilo proboj na tržište, budući da su Jaws i Window-Eyes podržavali sve govorne jedinice tada dostupne na tržištu.
Od 1997. pa do danas, sama filozofija proizvodnje čitača ekrana je ostala ista, iako se sva tri navedena čitača svakodnevno dorađuju i podržavaju sve više aplikacija.
Za slijepog korisnika bilo bi najbolje da posjeduje barem Jaws i Window-Eyes, jer tada bi s računalom mogao napraviti što god hoće, što se ne može reći za pojedinačnu funkcionalnost pojedinih čitača ekrana. Na primer, Jaws se bolje ponaša u aplikacijama za izradu glazbe i audio produkcije kao što su Cakewalk, Sonar ili Sound Forge, dok Window-Eyes s druge strane radi u Safe modu.
3. ZAKLJUČAK
Računarska sinteza govora i pretvaranje teksta u govor omogućuju osobama sa oštećenjem vida da praktično ostvare mnoga od zakonom zagarantovanih ljudskih prava. Pojava kvalitetnih sinteza govora na osnovu teksta na južno-slovenskim jezicima omogućuje ostvarivanje ovih prava i osobama na prostorima bivše Jugoslavije, gde je takva mogućnost posebno važna zbog teškog ekonomskog položaja u kojem se mahom nalaze osobe sa oštećenjem vida.
Govorne tehnologije su izuzetno važne za društvo u celini i računarska sinteza govora uz automatsko prepoznavanje govora pruža niz mogućnosti kroz govornu komunikaciju čoveka i mašine.
U svetu, na velikim svetskim jezicima razvoj i pri-mena govornih tehnologija poprima sve veće razmere, a sada dolazimo u priliku da i ovde organizujemo niz korisnih projekata na bazi izgrađenih govornih tehno-logija koje se i dalje usavršavaju.
Na Internetu se sad već može pronaći obilje infor-macija o mnogim hardverskim i softverskim sintezama govora. Međutim, malo je onih koje kvalitetno čitaju tekstove na južno-slovenskim jezicima. Na adresi [6] može se neposredno testirati anReader.
LITERATURA
[1] http://www.freedomscientific.com
[2] http://www.gwmicro.com
[3] http://www.linux.hr
[4] http://www.ipsis.hr/gls
[5] http://www.savez-slijepih.hr/hr/pomagala/mobiteli.htm
[6] http://www.alfanum.co.yu
Preuzeto sa http://www.ftn.ns.ac.yu/dogs/dogs2004.htm

