Mozaik

Majkrosoft

Srpska tablet ćirilica

Za neku godinu biće moguće hvatati beleške na ćirilici i zatim prepustiti svom Tablet PC-ju da taj rukopis prepozna i konvertuje u željenu tekstualnu formu. Zahvaljujući beogradskom predstavništvu Majkrosofta, ta rukopisna ćirilica biće i prva ćirilica u svetskoj digitalnoj arhivi rukopisa

Dešava se retko, ali se eto ipak dešava da je Srbija u nekim tehnološkim stvarima prva na svetu. U okviru beogradskog predstavništva Majkrosofta počelo je prikupljanje uzoraka ćiriličnog i latiničnog rukopisa za potrebe korisnika Tablet PC računara, a uzorci srpske ćirilice biće zapravo i prvi ćirilični uzorci uopšte. Šta to zapravo znači? Ukratko, to znači da će za neku godinu (prognoziranje je nezahvalno, ali recimo da su u pitanju dve godine) biti moguće specijalnom olovkom hvatati beleške na ćirilici i prepustiti svom Tablet PC-ju da taj rukopis prepozna i konvertuje u word, notepad ili bilo koju drugu tekstualnu formu.

Tablet PC koji omogućava ovakvo prepoznavanje rukopisa jeste uređaj čija popularnost sve više raste: od novembra 2002. godine, od kada je na tržištu, do avgusta 2004. u svetu ih je prodato milion, čemu doprinosi i sve manja razlika u ceni u odnosu na obične notebook ili laptop računare. Naime, u odnosu na njih, Tablet PC staje nekih deset odsto više, a pritom predstavlja svojevrsnu evoluciju notebooka: može se koristiti kao klasičan računar s tastaturom, a jednostavnim okretanjem monitora "pretvara" se u prostor za beleške. Nakon unošenja beleški i "prepoznavanja" rukopisnog teksta korisnik može korigovati eventualne greške u "čitanju" i potom ga konvertovati u tekstualnu formu po izboru. Naravno, to ne podrazumeva specijalni softver za svaki poseban rukopis, već se na osnovu velikog broja uzoraka u bazi podataka prepoznaje rukopis bilo kog individualnog korisnika. Ovakav sistem za sada postoji na engleskom (u američkoj i britanskoj verziji), francuskom, nemačkom, španskom, italijanskom i nekoliko jezika istočne Azije, a srpska verzija biće prva koja će osim u latiničnoj, postojati i u ćiriličnoj varijanti.

Razvoj prepoznavanja rukopisa na engleskom jeziku traje već čitavih 15 godina, tako da je broj tih rukopisnih uzoraka i najveći – ukupno ih ima 20 miliona, dok je tri miliona uzoraka minimalan broj kojim eksperti moraju da raspolažu kako bi uopšte razvili ovaj sistem. Naravno, to ne znači da će u predstavništvo Majkrosofta u Beogradu morati da dođe tri miliona ljudi. Naime, prva olakšavajuća okolnost jeste da će za latiničnu verziju rukopisa na srpskom moći da se koristi već postojeća baza podataka za druge jezike – razlika između engleske i srpske latinice zapravo se svodi na samo nekoliko slova. Što se ćirilice tiče, procedura će biti nešto komplikovanija, ali će ona istovremeno pružiti solidnu bazu podataka za ćirilična pisma na čijem će se prepoznavanju tek raditi. S druge strane, broj od tri miliona uzoraka ne podrazumeva tri miliona individualnih rukopisa već tu količinu uzoraka: u taj broj ulaze uzorci štampanih slova, uzorci reči koje se često koriste, uzorci rečenica i uzorci specifičnih pisanih formi (brojevi telefona, elektronske adrese i sl.). Ukratko, u tek započetoj fazi razvoja prepoznavanja srpskog rukopisa, biće neophodno učešće 300 volontera (vidi okvir!). Ta prva faza, koja podrazumeva prikupljanje uzoraka štampanih slova i najčešće korišćenih reči, trebalo bi da potraje oko pet meseci. S tim u vezi, u Beogradu trenutno borave Bodin Drešević, američki stručnjak poreklom s naših prostora koji je u okviru Majkrosofta već godinama angažovan u Grupi za prepoznavanje rukopisa (kasnije prerasloj u Tablet PC grupu), kao i Thanh Hua, "veteranka Majkrosoftovog razvoja" zadužena za arhivu digitalnih rukopisa. Kao treći član ekipe, tu je i Silvana Hadžić iz beogradskog predstavništva te kompanije koja će projekat neposredno koordinisati.

Prognoze je, dakle, nezahvalno davati, ali u ovom slučaju (kako god da okrenemo) izvesno je da će prva kompjuterski prepoznata rukopisna ćirilica biti upravo srpska. Pa, kad bude da bude.

Rukopis za istoriju

Svi oni koji bi želeli da bazi podataka prilože svoj rukopis, mogu da se jave Majkrosoft centru u Beogradu, da potom učestvuju u prilično zanimljivoj i brzoj proceduri i da tako, ako ništa drugo, dobiju i simboličan poklon u vidu knjige ili nekog sličnog Majkrosoft materijala. Telefon je 011/330-5500, a radno vreme od 8.30 do 16.30.

Iz istog broja

Nova evropska avijacija

Čedo od 560 tona

Igor Salinger

Arhiva nedeljnika Vreme>

Pogledajte arhivu