Pretraži

E-kolegije
Nastavnike

Filtriraj


Akademska godina


Izbornik

Naziv kolegija
Analiza i pretraživanje teksta

Vrsta studija
Diplomski sveučilišni
ECTS bodova
4

Jezik kolegija
Hrvatski
Kolegij vidljiv
Da

Nositelji kolegija
Ime i prezime
Goran Glavaš
Jan Šnajder
Izvođači nastave
Ime i prezime
Mladen Karan
Opis kolegija
Većina ljudskog znanja pohranjena je u nestrukturiranom, tekstnom obliku. Zbog ogromne i rastuće količine digitalnih tekstnih podataka, sustavi za analizu i pretraživanje teksta postali su neizostavan dio suvremene informacijsko-komunikacijske infrastrukture. Takvi sustavi odgovaraju na raznolike informacijske potrebe korisnika te omogućavaju crpljenje informacija iz velikih količina nestrukturiranih podataka. Zbog složenosti i višeznačnosti prirodnog jezika, analiza teksta netrivijalan je zadatak, koji se oslanja na postupke obrade prirodnog jezika, računalne lingvistike i strojnog učenja. Ovaj predmet daje cjelovit pregled tradicionalnih i naprednih postupaka za analizu i pretraživanje teksta. U prvome dijelu obrađuju se modeli prikaza dokumenata te postupci za pretraživanje, klasifikaciju i grupiranje dokumenata. U drugome dijelu obrađuju se postupci crpljenja informacija i dubinske analize teksta s naglaskom na postupcima temeljenima na statističkoj obradi jezika i strojnom učenju.