semantic-web-search

Tim Berners-Lee je prvi put govorio o pojmu semantičkog weba na World Wide Web konferenciji 1994. godine. Imajući u vidu tehnički nivo znanja publike, njegova prezentacija je u najvećem delu sastojala od zbunjenog klimanja glavom, ali za slušaoce sa vizionarskim karakterom koncept nije zvučao daleko od stvarnosti.

Pojam semantički znači da mašina ili tačnije softver koji pokreće mašinu razumeju informacije na način na koji su namenjene. Da bi mašina shvatila značenje onoga što je čovek stavio u tekst to zahteva određenu količinu veštačke inteligencije.

Drugi pristup

Ako posmatramo ovo striktno sa stanovišta postizanja sposobnosti semantičke pretrage, umesto što pokušavamo naučiti računar da razmišlja kao čovek, mnogo lakše bi bilo naučiti ljude da predstave podatke u formatu koji mašina može da razume. To podrazumeva unošenje semantičkih oznaka kao što su  RDF, mikroformati, mikropodaci, schema.org strukturiani podaci.

Možda bi se iznenadili kad bi znali koliko su neki algoritmi servera za pretragu napredovali u mogućnostima i razmevanju sadržaja web stranica. Naravno još uvek ima prostora da se to unapredi, postignut je veliki napredak, ali nije toliko očigledan za obične posmatrače.

Budućnost semantičke pretrage

Koncept semantičke pretrage zasniva se na grafikonu koji sadrži povezane entitete i njihove odnose. Kako se predstavljanje znanja stalno unapređuje, sve više veza je na raspolaganju, sve više  entiteta se povezuju jedni sa drugima i uspostavljaju međusobne odnose, a pošto algoritmi mogu da uče, veze lakše mogu biti mapirane.

Pretrazivači će moći da kopaju sve dublje i dublje po grafu i pronađu informacije o entitetu. Na primer ako sada kucate neki termin za pretragu u Googlu dobićete hiljade rezultata sa dokumentima koji sadrže te ključne reči.

Međutim u budućnosti semantički  serveri za pretragu će moći da prevaziđu ovo ograničenje, da razumeju smisao vašega pitanja, da razumeju značenje tih hiljada dokumenata, a zatim da vam vrate tačno te rezultate koje ste vi tražili.

Postavite li na primer pitanje „Da li Petar Petrović dolazi iz velike porodice?“ pretraživač iz budućnosti treba da bude u stanju da analizira sve delove grafikona koji imaju veze sa Petrom Petrovićem i kvantifikuje broj ljudi koji su članovi njegove porodice.

Da bi pretraživač došao do takvih podataka oni moraju biti struktuirani, da bi algoritam mogao doći do željenih informacija. Ali pošto je većina podataka na Internetu danas nestrukutirana to predstavlja ograničenje.

Ali u 2025? Hajde da ispitamo tu mogućnost?

Ako su dovoljno struktuirani podaci dostupni, pretraživač bi mogao da poveže potrebne stvari i dođe do željenog odgovora.

Da li mislite je današnja tehnologija sposobna za takvo nešto? Naravno da jeste!

Da li mislite da su podaci nedostupni? Naravno da postoje i to u ogromnim količinama.

Problem je u tome što je veliki broj podataka trenutno nestruktuiran i da je broj slučajeva u kojima možemo dobiti odgovor na takava upit daleko od toga da bude održiv. Dakle, gde nas to vodi i šta je rešenje?

Na nama je da obezbedimo više struktuiranih podataka i da olakšamo posao serverima za pretragu. Srećom današnji algoritmi za pretragu se mogu pobrinuti da premoste te razlike koje treba da se unaprede, samo je pitanje koliko će dugo to trajati. Postoji relana mogućost da se semantičko pretraživanje omogući do 2025. godine, ako se desi još pre to bolje.

Jovan Ivezic

E-business and internet marketing specialist.