STAznanost
Naravoslovje in tehnika

Partnerji projekta RSDO bodo predstavili nove rešitve s področja jezikovnih tehnologij

Ljubljana, 5. decembra - S sklepnim dogodkom se bo v sredo zaključil projekt Razvoj slovenščine v digitalnem okolju, namenjen razvoju jezikovnih tehnologij za slovenski jezik. Na dogodku bodo predstavili orodja, ki so jih razvili tekom projekta, med drugim strojni prevajalnik in razpoznavalnik govora za slovenščino. Ti bodo v naslednjih mesecih na voljo za testno uporabo.

Projekt Razvoj slovenščine v digitalnem okolju v vrednosti štiri milijone evrov, s katerim je Slovenija prepoznala pomen razvoja sodobnih jezikovnih tehnologij za slovenski jezik, se je začel maja 2020. Na zaključnem dogodku projekta, ki bo potekal v sredo, 7. decembra, v prostorih Slovenskega etnografskega muzeja (SEM) in virtualno na spletni platformi Zoom, želijo javnosti predstaviti ključna orodja, ki so jih tekom projekta razvili.

Predstavili bodo strojni prevajalnik za jezikovni par slovenščina-angleščina, razpoznavalnik govora za slovenščino, aplikacije s področja semantičnih tehnologij, kot je razpoznavanje pomenov besed in odgovarjanje na vprašanja, slovenski terminološki portal, nadgrajene jezikovne vire za podporo jezikovnim tehnologijam in številne druge projektne rezultate.

Vse omenjene aplikacije bodo v nadaljevanju na voljo za testno uporabo, raziskovalci pa se nadejajo čim več povratnih odzivov testnih uporabnikov, na podlagi katerih bodo do uradnega konca projekta, 23. februarja 2023, aplikacije nadgradili, je pojasnil vodja projekta Simon Krek s Centra za jezikovne vire in tehnologije Univerze v Ljubljani in Instituta Jožef Stefan.

Kot je pojasnil, bodo tehnologije in viri, razviti v projektu, prosto dostopne vsem in bodo uporabne tako za raziskovalce in splošno javnost kot tudi za javni sektor, kot so bolnišnice ali sodišča, ter predvsem za podjetja. "To pomeni, da lahko naše rešitve vzame kdorkoli in jih implementira v svoje produkte. Naj bo to avto, ki mora razumeti vaše ukaze, hladilnik ali katerikoli drug produkt, ki mora govoriti oziroma razumeti slovenski jezik."

Vsa programska koda in zbirke podatkov, ki bodo nastale med projektom, bodo javno dostopne pod odprtokodno licenco, vse aplikacije pa bodo na voljo tudi na javnem portalu RSDO, kjer jih bo vsakdo lahko preizkusil in uporabljal.

Projekt je po besedah Kreka zaznamovala pandemija koronavirusa, zaradi katere je bilo zbiranje gradiva za razpoznavalnik govora težavno. S tehnološkega vidika pa je bil največji izziv ekstremno hiter razvoj jezikovnih tehnologij na globalni ravni, zaradi česar je bilo treba "vseskozi spremljati novosti in se sproti prilagajati".

Slovenščina sicer po mnenju Kreka na področju jezikovnih tehnologij zaostaja. "Smo blizu jezikom, ki so z nami primerljivi po številu prebivalcev, kot so baltski jeziki, pa tudi slovaški jezik. Zaostajamo pa za češčino in skandinavskimi jeziki. Dela na tem področju je zato še precej," ocenjuje Krek.

Razlogi za ta razkorak so preprosti, meni - to je nezadostno financiranje in pomanjkanje strokovnjakov, ki se s temi področji ukvarjajo. "Že za projekt RSDO je bilo težko zbrati ljudi, ki se spoznajo na to področje, medtem ko imajo ostali jeziki že desetletja univerzitetne programe s tega področja. V Sloveniji vse do letošnjega leta, ko smo dobili program digitalna lingvistika, tega ni bilo."

"Potreben je usmerjen napor. In projekt RSDO je bil točno to - napor v tej smeri, ki bo prinesel veliko rezultatov, a je treba s tem nadaljevati tudi po koncu projekta. Z jeziki, ki imajo več virov, kot so nemščina, španščina, francoščina ali celo nizozemščina, so ne moremo primerjati. Smo precej zadaj in vprašaje je, če bomo lahko prišli do iste ravni. Pomembno pa je, da vsaj ne zaostajamo, ko oni napredujejo."

Konzorcij projekta vodi Univerza v Ljubljani, med partnerji projekta pa so Univerza v Mariboru, Univerza v Novi Gorici, ZRC SAZU, Institut Jožef Stefan, podjetja Alpineon, Amebis, Aikwit in Vitasis, Pošta Slovenije ter Slovenska tiskovna agencija, ki se v projekt umešča predvsem kot evalvator izdelkov in diseminator rezultatov projekta.

Projekt financira ministrstvo za kulturo Republike Slovenije in Evropski sklad za regionalni razvoj. Operacija se izvaja v okviru Operativnega programa za izvajanje evropske kohezijske politike v obdobju 2014-2020.