Grobelnik: Tehnologija masivnih podatkov ni nič drugega kot očala, ki nam pomagajo videti bolje
Ljubljana, 14. novembra - Izjemen razvoj informacijske družbe v zadnjih letih je omogočil prestop znanosti v novo paradigmo, kjer so osrednjega pomena masivni podatki oz. big data. Marko Grobelnik iz Laboratorija za umetno inteligenco na Institutu Jožef Stefan (IJS) je prepričan, da so podatki pravzaprav senzor za realnost. "Več podatkov imamo, bolje lahko opazujemo realnost. Nekoč se ni dalo meriti, zato se nam je nekaj le dozdevalo, sedaj pa se z meritvijo o tem prepričamo."
Nekoč je bila znanost modelsko naravnana, od leta 2000 dalje pa je izrazito odvisna od podatkov, pojasnjuje Grobelnik. To je močan preskok v paradigmi, ki ga po njegovem mnenju marsikdo še ni dojel. "Nekoč je profesor, znanstvenik naredil model, ki je moral biti čim bližje realnosti, sedaj pa model nastane iz samih podatkov. Na ta način ima vmesna oseba (strokovnjak), ki ima uvid v domensko znanje, zelo olajšano delo oz. postane veliko bolj učinkovit. V tej novi paradigmi je dandanes treba predvsem vedeti, kako podatke dobiti in jih uporabiti."
Masivni podatki, katerih ključne lastnosti so ogromna količina, hitrost in raznovrstnost, so pravzaprav podobni majhnim, standardnim podatkom, vendar zaradi večjega obsega zahtevajo drugačne metodološki pristop, orodja in arhitekturo informacijskih sistemov, s katerimi delamo. "Čemur smo nekoč rekli le podatki, danes, zaradi velikega obsega meritev, pravimo masivni podatki."
Kultura dela s podatki v Sloveniji po besedah Grobelnika sega že daleč nazaj. Zelo pomembni področji, ki pri svojem delu uporabljata masivne podatke, sta umetna inteligenca in statistika. Trenutno se v Sloveniji s področjem umetne inteligence ukvarja ekipa približno 150 ljudi, kar je za majhno državo, kot je Slovenija, velika številka, je prepričan Grobelnik, zato smo zelo konkurenčni.
Veliko gospodarskih, industrijskih sektorjev je s premikom paradigme v podatkovno kulturo veliko pridobilo, pravi Grobelnik. Zbiranje podatkov je za podjetja bistvenega pomena, vendar je pomembno, da jih znajo uporabiti. Na ta način lahko boljše reagirajo ter sprejemajo boljše odločitve.
"Ta znanja niso tako strašno nedosegljiva, je bolj stvar osebne odločitve," meni Grobelnik. Zadošča že znanje, ki ga dodiplomski študenti pridobijo v prvem in drugem letniku. "Nekdo, ki je mlad, vendar zelo hitro reagira, lahko prehiti vse, saj je hitrost reakcije izrazito pomembna."
Področje masivnih podatkov ponuja ogromno priložnosti, a jih je po besedah Grobelnika veliko še neizkoriščenih, kar je povezano tudi s pomanjkanjem strokovnjakov na tem področju. Študija svetovalne hiše McKinsey je celo pokazala, da bodo potrebe po analitičnih strokovnjakih v ZDA za 50 do 60 odstotkov presegale dejansko stanje do leta 2018. Kljub temu pa smo v Sloveniji po mnenju Grobelnika lahko kar zadovoljni, saj imamo tovrstne študije na več fakultetah. "Kdor bo znal delati z masivnimi podatki, bo lahko dobil službo povsod, ne le v Sloveniji."
Masivni podatki so bili tudi osrednja tema torkovega Statističnega dneva 2015, kjer so poudarili, da količina podatkov, ki jih ustvarimo v zadnjih letih, eksponentno narašča ter se meri v peta- in eksabajtih. Vir masivnih podatkov so recimo družbena omrežja, spletni iskalniki, nadzor prometa, zdravstvene evidence, mobilne naprave, kartične transakcije, vse bolj pomemben vir pa postaja tudi internet stvari. Po navedbah podjetja Forbes je bilo kar 90 odstotkov vseh podatkov na svetu ustvarjenih v zadnjih dveh letih, do leta 2020 pa naj bi ustvarili približno 40 zetabajtov podatkov.