Home / Informacije / TVRTKE NEMAJU RADNIKE, AIOA PA VRAĆAJU wwwW.EwW XTAW UMIROVLJENIKE

TVRTKE NEMAJU RADNIKE, AIOA PA VRAĆAJU wwwW.EwW XTAW UMIROVLJENIKE

Donedavno smo svjedočili trendu tjeranja u prijevremenu mirovinu, a sad je situacija posve suprotna. Poslodavci opet angažiraju penziće, najviše za deficitarne, a pogotovu za uskospecijalizirane stručne ‘multipraktik’ poslove.

Napredak tehnologije neće izbrisati i osiromašiti hrvatski jezik. Naprotiv, zahvaljujući Fakultetu elektrotehnike i računarstva u Zagrebu tajne koje sadržava riječ mogle bi biti odgonetnute, a prije nedokučive korelacije dokumentiranih događaja postati očite i usmjeriti nas na ispravan put u kriznim trenucima. Na zagrebačkom FER-u već deset godina postoji istraživačka grupa Laboratorij za analizu teksta i inženjerstvo znanja (TakeLab). U njemu se bave obradom informacija iz tekstnih izvora, a njihova istraživanja obuhvaćaju obradu prirodnog jezika, pretraživanja informacija i strojnog učenja, odnosno primjene tehnika umjetne inteligencije, s ciljem razvoja naprednih jezičkih tehnologija za semantičku analizu digitalnog sadržaja. Voditeljica laboratorija je prof. dr. sc. Bojana Dalbelo Bašić, a njezin zamjenik izv. prof. dr. sc. Jan Šnajder.

Naš je primarni fokus obrada prirodnog jezika i primjena metoda strojnog učenja za rješavanja tog problema u svrhu ekstrakcije znanja iz nestrukturiranih, tekstnih podataka i omogućavanja komunikacije između čovjeka i stroja prirodnim jezikom. Drugim riječima fokus je jezik, konkretno njegova manifestacija u tekstu. Naša je misija razviti modele i alate koji omogućavaju semantičku analizu velike količine tekstnih podataka – elaborira Šnajder. Primjerice, ako vas zanima neki događaj ili pojam koji se nalazi u velikoj zbirci dokumenata, morali biste dobro pogoditi ključne riječi da pronađete željeno. No kod semantičkog pretraživanja postoji model pomoću kojeg se može prebroditi jaz između onog što trebate i načina na koji je to prirodnim jezikom zapisano. Nadalje, ako imate veliku količinu tekstnih podataka i zanima vas koji su glavni protagonisti u dokumentima (kako su povezani ili u kojoj su tvrtki zaposleni) isto tako će vam trebati pomoć modela na kakvim Laboratorij radi. U pitanju je klasičan primjer ekstrakcije informacije gdje se iz teksta pokušava dobiti podatke iz kojih se zatim mogu donijeti zaključci i izvoditi hipoteze.

TakeLab iza sebe ima mnogo uspješnih završenih projekata, a među njima su i oni nastali u suradnji s industrijom. Riječ je o praktično orijentiranim projektima koji rješavaju konkretnu potrebu industrije za analitikom teksta (tipična situacija bila bi analiza sentimenta: preko komentara na društvenim mrežama saznati što ljudi misle o nekom proizvodu ili usluzi). Na jednom takvom projektu u njemu upravo rade. Projekt CATA CX (Kognitivno-afektivna tekstna analitika društvenih medija za analizu korisničkog iskustva) financira HAMAG-BICRO, a cilj mu je analiza iskustva i mišljenja korisnika telekomunikacijskih usluga u komentarima na Facebooku. Saznati što je pošlo po zlu iz tisuće komentara nije lak zadatak. Riječ je o kompleksnom, skupom i dugom procesu. No CATA CX bi taj proces trebao učiniti bezbolnim i lakim. Razvijen je model koji u konverzacijama korisnika s korisničkom službom na Facebooku analizira niz afektivnih i kognitivnih pokazatelja, kao što su sentiment, komunikacijske namjere, teme razgovora te čak deset različitih, ponekad vrlo suputnih emocija. Za pola godine prototip projekta trebao bi biti završen te zatim dalje usmjeren prema komercijalnoj uporabi.

Imali smo niz vrlo uspješnih suradnji s tvrtkama u Hrvatskoj i inozemstvu te aktivno surađujemo s tvrtkom Photomath, koja ulaže u naše doktorande. Velik trud ulažemo i u to da dovedemo u našu grupu izvrsne znanstvenike iz inozemstva. Na primjer, imamo poslijedoktorsku znanstvenicu iz Italije – kaže Šnajder.

Uz financiranje Vlade Flandrije i Ministarstva znanosti i sporta izradili su i tražili CADIAL za pravne dokumente Republike Hrvatske, koja je javno dostupna svim građanima naše zemlje. Pomoću nje korisnici mogu…

Kad govori o umjetnoj inteligenciji, Šnajder je oprezan pri prognozama. Vjeruje da u sljedećih desetak godina neće promijeniti svijet na način kako to Hollywood često predviđa. U bliskoj budućnosti možemo očekivati razvoj alata za pomoć pri teškom fizičkim poslovima, modele koji će se moći baviti boljim strojnim prevođenjem, osobne asistente. No za ostalo morat ćemo pričekati više od 10 sljedećih godina. Problemi umjetne inteligencije sežu duboko u područje kognitivne znanosti i filozofije – vjeruje profesor.

FER-ov Laboratorij za analizu teksta i inženjerstvo znanja (TakeLab) bavi se obradom informacija iz tekstnih izvora. Upravo provodi projekt CATA CX, u kojem se analizira mišljenje korisnika telekomunikacijskih usluga u komentarima na Facebooku, razvija platformu s pomoću koje istražuje što izvorni govornici hrvatskoga jezika misle o značenju pojedinih riječi i kako ih upotrebljavaju, a provodi i semantičku analizu događaja ekstrahiranih iz novinskih tekstova. Izradio je i tražilicu CADIAL, koja je javno dostupna svim građanima naše zemlje i s pomoću koje korisnici mogu semantički pretraživati hrvatske zakone koji bi bio znatno napredniji od postojećih – dodaje Šnajder.

Na Laboratoriju za analizu teksta i inženjerstva iznimno su predani radu sa studentima te trenutačno surađuju s tridesetak studenata preddiplomskog i diplomskog studija. Studenti su ove godine sudjelovali i na međunarodnom natjecanju u semantičkoj analizi teksta (SemEval). Jedan zadatak na kojemu su sudjelovali je detekcija humora na Twitteru, na kojemu su osvojili drugo mjesto. Do sada je u grupi na temama obrade prirodnog jezika i strojnog učenja diplomiralo više od 70 studenata.

Većina ljudskog znanja kodirana je u tekstu, u kojem se nalazi bogati izvor informacija koje se mogu pretvoriti u znanje i pomoći u odlučivanju u raznim domenama ljudske djelatnosti. Zato na FER-u provode vrlo zanimljiva istraživanja koja su u srži umjetne inteligencije.