PRIMENA GOVORNIH TEHNOLOGIJA

Vlado Delić
FTN, Trg D. Obradovića 6, Novi Sad
vdelic@uns.ns.ac.yu

KRATKI SADRŽAJ

U radu su opisane mogućnosti primene govornih tehnologija u ostvarivanju ljudskih prava osoba sa invaliditetom na srpskom govornom području. Opisani su interfejsi, resursi i aplikacije, razvijani za osobe sa invaliditetom, kao i niz projekata čiji je cilj širenje kruga korisnika govornih tehnologija kod osoba kojima one mogu u izvesnoj meri nadomestiti hendikep koji imaju.

1. UVOD

Govorne tehnologije dostižu nivo razvoja koji omogućuje veliki broj korisnih primena. Jedna od primena za koju se više ne postavlja pitanje da li je sazrela, jeste primena za pomoć osobama sa invali-ditetom. Međutim, malo je ovako malih govornih područja za koje su govorne tehnologije razvijene toliko da mogu konkretno, praktično i trajno da pomognu u ostvarivanju osnovnih ljudskih prava osoba sa invaliditetom.
Da bi govorne tehnologije bile široko primenjene za pomoć osobama sa invaliditetom, neophodno je da one budu dostupne na njihovom maternjem jeziku. Ovde je važno naglasiti zavisnost govornih tehnologija od jezika. Naime, na jednom govornom području nije moguće direktno primeniti govorne tehnologioje razvijane za neki drugi jezik. Ni lokalizacija nije jednostavna kao za druge tehnologije - praktično je za svaki jezik potrebno posebno razvijati govorne tehnologije. Daleko je lakše prilagođenje govornih tehnologija razvije-nih za srpski jezik na druge južno-slovenske jezike, nego što je to moguće sa drugih stranih jezika. Za niži kvalitet sintetizovanog govora dovoljna je srodna fonetika, a za viši kvalitet mora biti reč o izuzetno srodnim jezicima - i leksički i morfološki i sintaksno.


1.1. Složenost govornih tehnologija

Velike mogućnosti primene govornih tehnolo-gija decenijama motivišu istraživačke timove širom sveta da se uhvate u koštac sa jednim od najtežih multidisciplinarnih problema: kako računar naučiti da razume čovekov govor i da može da odgovara sintetizovanim govorom. Zašto su prepoznavanje i sinteza teški zadaci za računare? Pri sintezi govora na osnovu teksta zadatak je goli tekst pretvoriti u govor, pri čemu je neophodno rešiti niz problema. Prilikom pretvaranja svakog napisanog slova u glas postavlja se pitanje da li je to slovo u naglašenom ili nenaglašenom slogu, koja je vrsta akcenta u pitanju (u našem jeziku, koji spada u retku grupu tonskih jezika, ima ih 4), koliko traje izgovor toga glasa u datom kontekstu, kako se menja visina tona a kako jačina glasa u toku njegovog izgovora. Svi ovi (prozodijski) elementi moraju se generisati na nivou glasa, sloga, reči i rečenice. S druge strane, pri automatskom prepo-znavanju govora osnovni problem je u velikoj varijabilnosti govora: različiti govornici različito izgovaraju iste reči, u mikrofon ulaze i drugi, neželjeni zvukovi - raznovrsna ambijentalna buka, različiti su i mikrofoni, pa i karakteri-stike komunikacionog kanala kroz koji je govorni signal prenet do računara. Zbog svega toga govorne tehnologije predstavljaju teške multidiscipli-narne probleme u čijem rešavanju je potrebno objediniti i u računar implementirati znanja iz raznih oblasti: lingvistika, fonetika, akustika, digitalna obrada signala, matematika i programi-ranje.


1.2. Primene govornih tehnologija

U svetu se mnogo ulagalo u istraživanja i razvoj u oblasti govornih tehnologija i krenulo se sa prvim primenama kada tehnologija još nije sazrela, što je u izvesnoj meri bilo i kontraproduktivno. Zato je neophodno i veoma važno da se u ovoj fazi razvoja govornih tehnologija za srpski jezik dobro osmisle i pronađu prave primene. Jedna od njih svakako je i pomoć osobama sa invaliditetom jer, iako još uvek nesavršene, govorne tehnologije na ovom nivou razvoja su od izuzetnog značaja za veliki broj osoba sa invaliditetom. Najveća debata u oblasti ljudskih prava koja se u poslednje vreme vodi u sedištu UN tiče se osoba sa invaliditetom. Opšte prihvaćene norme tiču se ravnopravnosti u obrazovanju, pristupu informacijama, pa i obaveze u pogledu zapošljavanja osoba sa invaliditetom. Govorne tehnologije omogućuju da osobe sa invali-ditetom praktično ostvare ova i druga ljudska prava. Ove zakone svakako ćemo doneti na putu ka EU, a preko govornih tehnologija možemo da pružimo konkretan, praktičan i trajan doprinos ostvarivanju nekih od ljudskih prava osoba sa invaliditetom - od sada i na srpskom govornom području.
Primena govornih tehnologija interesantna je i za sve druge osobe koje govorom mogu komunicirati ne samo sa računarima, nego i sa uređajima u domaćinstvu, industriji, automobilima, igračkama. Mogu razgovarati i preko telefona sa računarom koji je povezan na Internet odakle preuzima informacije i usmeno ih saopštava pozivaocu.
Razvoj govornih tehnologija na srpskom jeziku važan je i za očuvanje jezika u govornoj formi jer ćemo u budućnosti sve češće imati potrebu da sa mašinama komuniciramo glasom, neposredno ili preko telefona, i jako je važno da to možemo da radimo na svom maternjem jeziku. Komunikacija sa velikim pozivnim centrima sve češće počinje razgovorom sa govornom mašinom, pojavljuju se govorni portali na Internetu, uređaji koji reaguju na govorne komande, pa sve do učenja srpskog jezika kao stranog i, čak, automatskog prevođenja govora sa srpskog na druge svetske jezike i obrnuto. Već sada postoji niz aplikacija koje nije bilo moguće realizovati bez govornih tehnologija na srpskom jeziku, kao što su čitanje e-mail i SMS poruka, automatizacija pozivnih centara i govornih portala itd.


2. PRIMENE GOVORNIH TEHNOLOGIJA ZA OSOBE SA INVALIDITETOM

Težak položaj osoba sa invaliditetom u dru-štvu iscrpljenom ekonomskim problemima i poli-tičkim previranjima, povećava značaj dostignuća u razvoju govornih tehnologija za govorno područje južno-slovenskih jezika, a posebno njihovih primena za pomoć osobama sa invaliditetom. Da bi se govorne tehnologije počele više koristiti u krugovima osoba sa invaliditetom neophodno je dosta poraditi na njihovoj edukaciji, organizovati ih i pokrenuti lanac obuke. Kako bi softverske komponente za pretvaranje teksta u govor i automatsko prepoznavanje govornih komandi bile dostupne širem krugu osoba sa invaliditetom, treba omogućiti da govorne tehnologije funkcio-nišu i na starijim računarima skromnijih perfor-mansi.


2.1. Interfejsi za osobe sa invaliditetom

Razlikuju se interfejsi govornih tehnologija za različite kategorije osoba sa invaliditetom i potrebno je izvesno vreme i dodatni napor da se računarsko generisanje govora, pretvaranje teksta u govor i automatsko prepoznavanje govora prilagode potrebama pojedinih kategorija osoba sa invali-ditetom. Tako, na primer, osobe sa oštećenjem vida koriste računare pomoću posebnih softvera, tzv. čitača ekrana, koji im daju zvučnu informaciju o svakoj raspoloživoj opciji i preduzetoj aktivnosti u okviru operativnog sistema. Softver za pretva-ranje teksta u govor na srpskom jeziku potrebno je povezati sa čitačima ekrana i odgovarajućim opera-tivnim sistemima.
Isti softver za računarsko generisanje govora i pretvaranje teksta u govor interesantan je i za neme osobe i osobe sa patologijom govora jer računar može da kaže sve što oni napišu. Za njih bi bilo najpogodnije taj softver ugraditi u male mobilne uređaje sa tastaturom, displejom i zvučnicima. S druge strane, automatsko prepoznavanje govornih komandi korisno je pre svega osobama koje ne mogu da koriste svoje ruke, a njih ima u mnogim invalidskim organizacijama: osobe sa distrofijom mišića, paraplegijom ili kvadriplegijom, osobe sa multiplom sklerozom, invalidi rada, ratni vojni invalidi i civilne žrtve rata. Svi oni mogu govornim komandama da upravljaju radom računara, ali i da preko njega komuniciraju sa drugim uređajima u svom okruženju. Govor koji je prepo-znao, računar može lako da ispiše na ekranu i tako ga učini dostupnim osobama sa oštećenjem sluha. Vizualizovan govor može pomoći deci sa ošteće-njem sluha da lakše nauče da govore.

 

Sl.1. Govorne tehnologije za osobe sa invaliditetom

Sl.1. Govorne tehnologije za osobe sa invaliditetom


 

2.2. Projekti za osobe sa invaliditetom

Prve primene govornih tehnologija na srpskom jeziku za pomoć osobama sa invaliditetom usmerne su na slepe i slabovide osobe. Softver razvijen za pretvaranje teksta u govor na srpskom jeziku (anReader) povezan je sa čitačima ekrana (ovde se najviše koristi Jaws) tako što je napravljena podrška za Microsoft SAPI (Speech API) i sada čitač ekrana Jaws u okviru Windows operativnog sistema koristi anReader kao svoju govornu komponentu, slika 2. Jaws omogućuje slepoj osobi da se kreće po računaru, podešava opcije i pokreće programe, a anReader omogućuje da im računar tečno i razumljivo naglas čita tekstove na srpskom jeziku, bilo da su to knjige, novinski članci, pisma ili bilo koji drugi tekst. Sada slepe osobe mogu da odu na Internet, na novinske sajtove, da im računar čita vesti i da se tako samostalno informišu. Imaju računar koji im datu knjigu može čitati kad god požele i koliko god treba puta dok je ne nauče - tako se slepi mogu ravnopravnije obrazovati. Pomoću računara oni mogu i da čitaju i da pišu, pa i da se dopisuju - koriste e-mail za komunikaciju, a polako se pojavljuju i SMS čitači za njih. Tako se slepim i slabovidim osobama omogućuje pisana komunikacija i danas postoje brojne e-mail liste na kojima se svakodnevno vodi živa diskusija među osobama sa oštećenjem vida. Primenom govornih tehnologija omogućuje se slepim i slabovidim osobama potpuno samostalan rad na računaru i tako dolaze u poziciju da se mogu obrazovati za mnoge poslove koje pre toga nisu mogli da rade. Govorne tehnologije im omogućuju da u izvesnoj meri prevaziđu svoj hendikep i lakše se integrišu u društvene tokove života i rada.

Sl.2. Platforma za rad slepih osoba na računaru pomoću govornih tehnologija

Sl.2. Platforma za rad slepih osoba na računaru pomoću govornih tehnologija


U uređenim i razvijenim državama rad multi-disciplinarnih timova na razvoju govornih tehno-logija je organizovan i finansiran od strane države koja tako obezbeđuje ovakve softvere za svoje slepe i slabovide građane. U našoj državi to još nije tako i pravo je čudo da imamo govorne tehno-logije razvijene na tom nivou da se već mogu sasvim konkretno i praktično primeniti za pomoć osobama sa oštećenjem vida. AlfaNum tim koji je sopstve-nim snagama i odricanjem izgradio kvalitean sintetizator govora na osnovu teksta na srpskom jeziku, nemajući podršku države u nastojanju da taj rezultat približi osobama sa invaliditetom, samostalno je prilagodio potrebama slepih kori-snika računara i inicirao niz projekata sa ciljem da se pokrene lanac obuke i proširi krug slepih i slabovidih korisnika računara pomoću novih govornih tehno-logija na srpskom jeziku. Cilj je obučiti ih za korišćenje novih govornih tehnolo-gija - da samostalno čitaju i pišu, da komunici-raju preko Interneta, koriste skenere i druge za njih korisne softvere. Ovaj projekat poznat je pod nazivom Vizija i on je već realizovan u Novom Sadu, Beogradu i Zrenjaninu, a uskoro će biti realizovan u 12 gradova Vojvodine, a potom i širom SCG, pa i bivše Jugoslavije.
Istraživanje Novosadskog udruženja studenata s hendikepom nedvosmisleno je pokazalo da je osnov-ni razlog što osobe sa ošte-ćenjem vida ne završa-vaju škole na nivou svojih intelektualnih poten-cijala to što nemaju litera-turu u pogodnom obliku. Brajevo pismo će uvek ostati pismo slepih osoba, njega treba negovati i vremenom obezbediti moder-ne Brajeve uređaje za što veći broj slepih osoba. Međutim, ovog momenta jeftinije, a za mnoge prime-ne brže i efikasnije sredstvo jesu softverski sin-tetizatori govora na osnovu teksta koji su sada dostupni i na srpskom jeziku.
AlfaNum tim je realizovao i "Računarski rečnik za slepe" - izdanje "Kompjuterskog priru-čnika za neupućene" (Mikro knjige) na kompakt disku sa integrisanim sintetizatorom govora koji im čita objašnjenje 2000 pojmova iz informatike. Ovaj projekat iniciralo je Udruženje umetnika i intelektualaca sa oštećenjem vida Srbije, a finansiralo Ministarstvo kulture i medija Repu-blike Srbije.
AlfaNum tim je krenuo i sa realizacijom govornog portala za slepe. To je sajt na Internetu kojem će moći pristupati i slepe osobe jer će ih tamo očekivati govorna mašina koja će im usmeno saopštavati tražene informacije. Za one osobe sa oštećenjem vida koje još uvek ne umeju da koriste Internet ili im on nije dostupan, većina infor-macija sa ovog govornog portala biće dostupna i preko telefonskog govornog portala. Ovaj projekat nazvan je Kontakt i on će biti tačka oslonca slepih i slabovidih korisnika računara, dostupan u svakom momentu u predstojećem procesu obuke i edukacije. Preko njega će se vremenom pružati razne usluge, na primer, savetovalište u kojem će uživo u najavljenim terminima gostovati defekto-lozi, psiholozi, sociolozi, pravnici i drugi stru-čnjaci. Uvodiće se interaktivni i zabavni sadržaji i sl. Biće tu, naravno, i mnogi linkovi na druge portale, kao i brojne informacije potrebne osoba-ma sa oštećenjem vida.
U školi za učenike oštećenog vida "Veljko Ramadanović" u Zemunu, realizuje se projekat izrade audio-biblioteke za slepe i slabovide. Deset računara biće povezano u mrežu, napraviće se baza podataka sa knjigama, lektirom i časopisima u elektronskom tekstualnom formatu, biće instali-ran softver za pretvaranje teksta u govor na srpskom jeziku i napravljen poseban softver za navigaciju po bazi podataka, tako da će učenik sa oštećenjem vida lako pronaći i slušati željenu lekciju. Nastavnici i administratori će biti obučeni da učeniku ili studentu mogu snimiti audio kompakt disk sa sintetizovanim govorom gde je mašina pročitala željene lekcije ili knjige. Kroz projekat biće izvršena odgovarajuća obuka nastavnika i administratora, kao i učenika i njihovih roditelja.
Slični projekti biće organizo-vani i za druge osobe sa invaliditetom iz raznih invalidskih organizacija.


3. ZAKLjUČAK

Značaj uključivanja osoba sa invaliditetom u društvene tokove života i rada izuzetno je veliki zbog činjenice da veoma veliki broj ljudi ima pro-blema sa vidom, sluhom, neki telesni nedostatak ili psihološki problem - po nekim procenama svaka deseta osoba. Govorne tehnologije su posebno interesantne jer na neki način mogu da pomognu većini osoba sa raznim vrstama invaliditeta. Nedostatak vida svakako spada u najteže kategorije invalidnosti i nije slučajno što je AlfaNum tim najpre usmerio svoje snage da sopstvena dostignuća u razvoju govornih tehnologija prilagodi i usmeri na pomoć osobama sa oštećenjem vida. Strategija je usmerena na izgradnju audio usluga (npr. audio biblioteka i narezivanje audio diskova) i govornih servisa (portala), kao i na obrazovanje kadrova i širenje kruga slepih i slabovidih korisnika računara - to je za njih gotovo jedina mogućnost da praktično ostvare prava na obrazovanje, informi-sanje, pa i zapošljavanje.
Značaj razvoja govornih tehnologija nije važan samo za osobe sa invaliditetom. On je važan za društvo u celini i dugoročno doprinosi očuvanju jezika u govornoj formi jer ćemo sve više imati potrebu da i sa mašinama komuniciramo govorom. Sada smo već u prilici da pomognemo hiljadama osoba sa invaliditetom na srpskom govornom području, što je još uvek privilegija malog broja jezika u svetu.

Tabela 1. Projekti za osobe sa oštećenjem vida

Tabela 1. Projekti za osobe sa oštećenjem vida

Preuzeto sa http://www.ftn.ns.ac.yu/dogs/dogs2004.htm

for download software click here visit mac software site softwareunlim.net visit site