STAznanost
Humanistika in družboslovje

Prva aplikacija za oceno težavnosti besedila v slovenskem jeziku

Ljubljana, 23. oktobra - V okviru projekta Za kakovost slovenskih učbenikov je nastala prva aplikacija za oceno težavnosti besedil v slovenskem jeziku. Aplikacija je brezplačno dostopna javnosti, namenjena pa je predvsem učiteljem, urednikom, novinarjem in drugim uporabnikom, ki se pri svojem delu srečujejo z oblikovanjem besedil za različne ciljne skupine.

Pri razvoju aplikacije je sodelovala interdisciplinarna skupina strokovnjakov Fakultete za računalništvo in informatiko (FRI) ter Pedagoške fakultete Univerze v Ljubljani, Center za jezikovne vire in tehnologije Instituta Jožef Stefan ter Pedagoška fakulteta Univerze v Mariboru. Razvoj aplikacije je vodil Marko Robnik-Šikonja s FRI.

Aplikacija omogoča analizo besedil v dolžini do 5000 znakov, deluje pa na osnovi pogosto uporabljenih formul berljivosti, statistikah vnesenih besedil ter na v svetu povsem novem pristopu, ki temelji na zadnji generaciji metod umetne inteligence za razumevanje naravnega jezika. Večina formul za merjenje berljivosti je bila sicer zasnovana za besedila v angleškem jeziku, na katerih je umerjeno njihovo delovanje.

Razvijalci so uspešnost mer berljivosti slovenščini prilagodili z analizo otroških, splošnih ter tehničnih revij, časopisov in zapisnikov sej državnega zbora. Te skupine besedil imajo namreč različne ciljne skupine, zaradi česar uporabljajo različne stile pisanja, ki jih formule in kriteriji berljivosti zaznajo in ločijo.

Avtorji aplikacije so med drugim razvili tudi več povsem novih mer berljivosti, ki temeljijo na zadnji generaciji globokih nevronskih mrež. Prednost nekaterih od teh metod je, da ne potrebujejo ročno pripravljenih množic za njihovo umerjanje, temveč delujejo tudi v jezikih z manj jezikovnimi viri, zato jih je enostavno prilagajati za nove jezike.

Orodje za analizo berljivosti je sicer dostopno na strežniku Centra za jezikovne vire in tehnologije na naslovu https://orodja.cjvt.si/berljivost.