STAznanost
Naravoslovje in tehnika

Pojmovnik ključnih pojmov v umetni inteligenci

Ljubljana, 30. decembra - V pojmovniku umetne inteligence razlagamo ključne pojme, področja in aplikacije, ki se v povezavi z umetno inteligenco pogosto pojavljajo v javnosti.

Umetna inteligenca

Umetna inteligenca (UI) predstavlja področje računalniške znanosti, ki se posveča razvoju sistemov, zmožnih izvajanja nalog, ki običajno zahtevajo človeško inteligenco. Koncept UI se je začel oblikovati v 50. letih 20. stoletja, ko so raziskovalci razvijali idejo, da bi računalniki lahko posnemali človeško inteligenco ter opravljali naloge, ki vključujejo razumevanje, učenje in odločanje. V nadaljevanju so se v 80. in 90. letih uveljavili postopki strojnega učenja, ki so omogočili računalnikom, da se učijo iz podatkov in izboljšujejo svoje zmogljivosti s časom.

V začetku 21. stoletja je prišlo do razcveta strojnega učenja, zlasti s poudarkom na globokem učenju in napredka na področjih, kot so prepoznavanje slik, obdelava naravnega jezika, avtonomna vožnja itd. Dinamični napredek razvoja UI se odraža v nedavnem pojavu naprednih jezikovnih modelov, kot je Chat GPT, ki so pokazali izjemno sposobnost generiranja naravnega jezika. To je privedlo do širše uporabe UI v raznolikih panogah in domenah. UI v zadnjih letih hitro napreduje, saj so na voljo velike količine podatkov, zmogljivi računalniški viri in inovativni algoritmi. Vendar pa vsi sistemi umetne inteligence niso enaki. Obstajata dva glavna pristopa k razvoju in uporabi UI: odprtokodni in zaprtokodni.

Ozka ali šibka UI

Ozka UI je posebna vrsta umetne inteligence, ki je ciljno usmerjena in načrtovana za izvajanje določenih nalog. Tako stroji izgledajo inteligentni, vendar delujejo pod nekaterimi omejitvami. Ne oponašajo človeške inteligence, pač pa zgolj simulirajo človeško obnašanje na osnovi določenih parametrov. Večina modelov temelji na ozki UI. V nasprotju s splošno UI, ki poskuša posnemati zapletene miselne procese, je ozka UI zasnovana tako, da uspešno opravi določeno nalogo brez človeške pomoči. Med priljubljene aplikacije ozke UI spadata na primer prevajanje jezikov in prepoznavanje slik.

Splošna UI

Splošna UI je umetna inteligenca, ki lahko uspešno izvede katero koli intelektualno dejavnost, ki jo lahko izvede človek. Splošna UI velja za močno UI, ki pa je v nasprotju s šibko ali ozko UI. Do sedaj še ni bilo razvitega pravega sistema splošne UI in ostaja stvar znanstvene fantastike. Teoretična zmogljivost teh sistemov bi bila nerazločljiva od človeške. Vendar pa bi široke intelektualne zmogljivosti splošne UI lahko celo presegle človeške zmogljivosti zaradi zmožnosti dostopa do ogromnih podatkovnih nizov in njihove obdelave z neverjetno hitrostjo.

Strojno učenje

Strojno učenje je področje UI, ki daje računalnikom sposobnost učenja in sprejemanja odločitev ali napovedi na podlagi podatkov, ki jih pred obdelavo pogosto strukturirajo človeški strokovnjaki. Cilj strojnega učenja je ustvariti algoritme in sisteme, ki se zelo enostavno prilagajajo novim situacijam. Strojno učenje se je začelo razvijati v drugi polovici 20. stoletja. Arthur Samuel, pionir na tem področju, je leta 1959 strojno učenje opredelil kot sposobnost učenja brez izrecnega programiranja. Pomembno je, ker podjetjem pomaga pri povečevanju obsega poslovanja, omogoča sprejemanje odločitev na podlagi podatkov in lahko bistveno izboljša družbene sektorje, kot so zdravstvo, finance, promet ali turizem.

Algoritmi UI

Algoritmi UI so navodila, ki strojem omogočajo analizo podatkov, izvajanje nalog in sprejemanje odločitev. Gre za podskupino strojnega učenja, ki računalnikom omogoča, da se učijo in delujejo samostojno. Vse naloge, ki jih UI opravlja, delujejo na podlagi določenih algoritmov. Od vklopa sistema do brskanja po internetu algoritmi UI sodelujejo z drugimi algoritmi strojnega učenja za izvedbo in dokončanje vsake naloge. Algoritmi UI in strojnega učenja omogočajo računalnikom napovedovanje vzorcev, ocenjevanje trendov, izračunavanje natančnosti in optimizacijo procesov.

Nevronske mreže

Nevronske mreže oz. umetne nevronske mreže so modeli strojnega učenja, ki delujejo po vzoru človeških možganov. Te umetne nevronske mreže posnemajo osnovne gradnike možganskih nevronov in so zmožne izluščiti zapletene vzorce iz podatkov. Razvoj nevronskih mrež sega v zgodnje obdobje računalništva. Osnovni model nevronske mreže z enim nevronom, imenovan perceptron je leta 1957 razvil Frank Rosenblatt, ki ga je bilo mogoče učiti za opravljanje preprostih nalog. Širšo prepoznavnost in uporabo so nevronske mreže dosegle v zadnjih desetletjih.

Ob koncu 20. stoletja so se pojavile nove funkcije in algoritmi, ki so lahko presegli omejitve prvih najpreprostejših nevronskih mrež. Takrat se je tudi pojavila ideja o globokem strojnem učenju večplastnih nevronskih mrež, ki so postale izjemno uspešne pri reševanju kompleksnih nalog, kot so prepoznavanje slik, naravnega jezika in igranje iger itd.

Globoko učenje

Globoko učenje je podvrsta strojnega učenja, ki uporablja nevronske mreže z več plastmi za oblikovanje kompleksnih vzorcev in hierarhij informacij. Ta pristop omogoča računalnikom, da se učijo iz velikih količin podatkov in izvajajo naloge, kot so prepoznavanje govora, prevajanje jezika in razumevanje naravnega jezika. Globoko učenje se od klasičnega strojnega učenja razlikuje po metodah, s katerimi se uči.

Algoritmi strojnega učenja za napovedovanje uporabljajo strukturirane, pogosto označene podatke, ki jih predčasno uredijo človeški strokovnjaki. Pri globokem učenju pa ni treba opraviti nekaterih predhodnih obdelav podatkov, ki so običajno povezane s strojnim učenjem. Ti algoritmi lahko sprejemajo in obdelujejo nestrukturirane podatke. Tehnologija globokega učenja je na primer v ozadju vsakdanjih izdelkov in storitev, kot so digitalni pomočniki, glasovno podprti televizijski daljinci in odkrivanje goljufij s kreditnimi karticami ter nastajajočih tehnologij, kot so samovozeči avtomobili.

Generativna UI

Generativna UI se nanaša na modele, ki lahko na podlagi podatkov, na katerih so bili usposobljeni, ustvarijo visokokakovostno besedilo, slike in drugo vsebino. Izraz generativna umetna inteligenca je postala priljubljena zaradi vse večje priljubljenosti programov generativne UI umetne inteligence, kot sta Chat GPT in DALL-E. Ta dva modela v nekaj sekundah ustvarita novo vsebino, vključno z računalniško kodo, eseji, elektronskimi sporočili, napisi v družabnih omrežjih, slikami, pesmimi, Excelovimi formulami in drugim.

Obdelava naravnega jezika

Obdelava naravnega jezika se nanaša na vejo računalništva, natančneje na vejo UI, ki se ukvarja s tem, da računalnikom omogoča razumevanje besedila in govorjenih besed na podoben način kot ljudem. Združuje računalniško jezikoslovje s statističnimi modeli, modeli strojnega učenja in globokega učenja. Te tehnologije skupaj omogočajo računalnikom, da obdelajo človeški jezik in razumejo njegov celoten pomen, skupaj z namenom govorca ali pisca in njegovim razpoloženjem.

Obdelava naravnega jezika poganja računalniške programe, ki prevajajo besedilo iz enega jezika v drugega, se odzivajo na govorne ukaze in hitro povzemajo velike količine besedila. Obdelava naravnega jezika je na primer prisotna v obliki glasovno upravljanih sistemov GPS, digitalnih pomočnikov, programske opreme za narekovanje govora v besedilo, klepetalnih robotov za pomoč strankam in drugih uporabniških pripomočkov.

Veliki jezikovni modeli (LLM)

Veliki jezikovni modeli (LLM) so napredni sistemi UI, zasnovani za obdelavo, razumevanje in ustvarjanje besedila, podobnega človeku. Temeljijo na postopkih globokega učenja in se usposabljajo na ogromnih zbirkah podatkov, ki običajno vsebujejo milijarde besed iz različnih virov, kot so spletna mesta, knjige in članki.

Nekateri priljubljeni modeli, kot je GPT-4 OpenAI, uporabljajo vrsto nevronske mreže, imenovane transformer, ki jim omogoča obvladovanje zapletenih jezikovnih nalog z izjemno strokovnostjo. Ti modeli lahko opravljajo široko paleto nalog, kot so odgovarjanje na vprašanja, povzemanje besedila, prevajanje jezikov, ustvarjanje vsebine in celo sodelovanje v interaktivnih pogovorih z uporabniki.

Prvi velik jezikovni model z imenom BERT so ustvarili Googlovi raziskovalci konec leta 2018. Razvoj jezikovnih modelov je od leta 2019 naprej skokovit. Leta 2020 se je pojavil GPT-3, ki se je konec leta 2022 zelo uspešno prilagodili v pogovorni model Chat GPT. V marcu 2023 se je pojavil model GPT-4, ki je še izboljšana verzija modela ChatGPT. Nekateri poznani veliki jezikovni modeli so še RoBERTa, BART, LaMDA itd.

Računalniški vid

Računalniški vid je področje umetne inteligence, ki računalnikom in sistemom omogoča, da iz digitalnih slik, videoposnetkov in drugih vizualnih vhodnih podatkov pridobijo pomembne informacije ter na podlagi teh informacij ukrepajo ali pripravijo priporočila. Če področje obdelave naravnega jezika omogoča računalnikom, da posnemajo človeške kognitivne sposobnosti in dajejo navidezni vtis inteligence, jim računalniški vid omogoča, da vidijo, opazujejo in sklepajo na podlagi vizualne informacije.

Računalniški vid deluje podobno kot človeški vid, le da je človek v prednosti. Človeški vid ima prednost, da se lahko skozi življenje uči, kako razlikovati predmete, kako daleč so, ali se premikajo in ali je na sliki kaj narobe. Računalniški vid usposablja stroje za izvajanje teh funkcij, vendar mora to narediti v veliko krajšem času s kamerami, podatki in algoritmi. Ker lahko sistem, ki je usposobljen za pregledovanje izdelkov ali opazovanje proizvodnih sredstev, analizira na tisoče izdelkov ali procesov v minuti in pri tem opazi neopazne napake ali težave, lahko hitro preseže človeške zmogljivosti. Računalniški vid se uporablja v različnih panogah, zlasti na področju razvijanja avtonomne vožnje.

Odprtokodni sistemi UI

Odprtokodna UI se nanaša na modele in programsko opremo UI, pri katerih je izvorna koda javno dostopna, zato jih lahko vsakdo spreminja, izboljšuje ali ponovno uporablja. Prednost teh sistemov je, da spodbujajo sodelovanje, inovacije in preglednost v skupnosti UI. Razvijalci odprtokodne UI se lahko z deljenjem svoje kode in podatkov učijo drug od drugega, nadgrajujejo obstoječe delo in rešujejo skupne težave.

Po drugi strani pa se odprtokodna UI sooča tudi z nekaterimi izzivi. Eden od njih je tveganje zlorabe ali zlorabe zmogljivih modelov UI s strani zlonamernih akterjev, kot so hekerji, kriminalci ali nasprotniki. Druga je težava pri zaščiti pravic intelektualne lastnine in konkurenčnih prednosti razvijalcev. Tretji razlog je morebitno pomanjkanje nadzora kakovosti in standardizacije v odprtokodnih projektih UI, kar lahko privede do napak.

Zaprtokodni sistemi UI

Zaprtokodsni sistemi UI se nanašajo na modele in programsko opremo UI, ki so pogosto lastniško zaščiteni in jih njihovi lastniki ali razvijalci ohranjajo v tajnosti. Svojim lastnikom ali razvijalcem lahko zagotavljajo večjo varnost, zasebnost in dobičkonosnost. Z upoštevanjem strogih protokolov in smernic lahko podjetja tako zagotovijo tudi večjo kakovost in zanesljivost svojih sistemov UI.

Tudi zaprtokodni sistemi imajo svoje slabosti. Ena od njih je pomanjkanje sodelovanja, inovacij in preglednosti v skupnosti zaprtokodne UI. S skrivanjem svoje kode lahko podjetja zamudijo dragocene povratne informacije, vpoglede ali izboljšave drugih strokovnjakov ali uporabnikov. Zaprtokodni sistemi uporabnikom tudi otežujejo razumevanje, preverjanje ali revizijo sistemov UI, ki jih uporabljajo, kar lahko zmanjša zaupanje, odgovornost in etične standarde. Med najuspešnejšimi zaprtokodnimi podjetji je na primer Amazon.

Upravljanje podatkov za UI

V okviru UI se upravljanje podatkov nanaša na sistematično upravljanje in urejanje podatkov, ki se uporabljajo pri razvoju in uvajanju sistemov UI. To vključuje nadzor nad zbiranjem, shranjevanjem, uporabo in souporabo podatkov, da se zagotovi njihova skladnost s posebnimi standardi in predpisi. Področje upravljanja podatkov za UI poudarja pomen ocene in zmanjševanja tveganj z zavedanjem, da ima uporaba podatkov v UI pomembne posledice za posameznike, družbo in gospodarstvo.

Za dobro upravljanje podatkov v UI je značilnih več ključnih načel. Prvi je pristop, ki temelji na tveganju, pri čemer morajo biti ukrepi za upravljanje podatkov sorazmerni z morebitnim vplivom dejavnosti UI na družbo in gospodarstvo. Drugi je instrumentalni vidik, kjer mora biti upravljanje podatkov za usposabljanje in testiranje za UI usmerjeno v zagotavljanje, da nabori podatkov vodijo k želenim funkcijam in zmogljivostim sistemov UI. Tretji pa je usklajenost z družbenimi normami, kjer morajo biti strategije upravljanja podatkov usklajene z družbenimi vrednotami in normami, zlasti ob upoštevanju širših učinkov UI.