Google pretraga i padežiTražeći nešto po Internetu, primetio sam jednu krajnje zanimljivu stvar koju ranije nisam primećivao. Elem, obratite pažnju na donji screen shot:
Iako je moj upit glasio aleksandra velikog, Google je kao prvi rezultat izbacio Wikipedia unos 'Aleksandar Veliki' pri tom označavajući ove ključne reči podebljanim slovima, kao da je pretraživanje obavljeno po ključnim rečima 'aleksandar veliki' a ne 'aleksandra velikog'. Iz ovog se može izvući zaključak da Google, verovali ili ne, podržava padeže srpskog jezika!? Zarad malog poređenja, isti upit zadat na pretraživaču Yahoo! daje očekivane rezultate za jedan američki pretraživač, dok domaći Pogodak uredno pronalazi reči po padežima. Pogodak je inače uvek isticao upravo ovu osobinu svog lokalizovanog pretraživača kao prednost u poređenju sa Googleom. Groowe Toolbar u finalu za najbolju Firefox ekstenziju
Juče je objavljena i lista od 19 finalista od preko 200 pristiglih ekstenzija na kojoj se našao i Groowe Search Toolbar for Firefox. Za mene lično, ulazak u finale je veliki uspeh i praktično ispunjenje cilja mog učešća u takmičenju. Naime, iako ne bih imao ništa protiv da osvojim Apple iPod kao utešnu, ili ne daj bože Alienware Aurora 7500 sa slike kao prvu nagradu , upravo sam se nadao da će se Groowe pojaviti na nekoj ovakvoj listi učesnika, ili još bolje finalista, što će dovesti do povećanja broja downloada. Gledajući brojač download ovih dana, ova matematika se i ostvaruje. Sredinom februara je proglašenje pobednika, pa do tada... Držite mi palčeve. :) Neverovatne frazePre više od dve godine pomenuo sam fascinantan Amazonov servis "Search Inside" koji raspolaže ogromnom bazom skeniranih i OCR-ovanih knjiga iz ponude. A malopre primetih jednu jako interesantnu primenu baze u servisu "statistički malo verovatne fraze" (SIP - "Statistically Improbable Phrases"). O čemu se radi? Njihovi serveri "čitaju" sadržaj skeniranih knjiga i za svaku knjigu izdvajaju nekoliko fraza koje se često pojavljuju u toj, ali jako retko u ostalim knjigama na Amazonu. Vrlo je verovatno da su dotične fraze usko povezane sa samom radnjom knjige, te su SIP-ovi praktično mašinski izdvojene ključne reči. Moćna stvar! :) Novi Naslovi.net
Interno, ceo softver je većim delom prerađen i sada radi na mnogo višem nivou nego pre tako da je iz ažuriranje same baze totalno isključen ljudski udeo. Može da obradi i sajtove koji su pisani na ćirlici kao Politika, ažuriranje obavlja cron job periodično tako da su Naslovi.net uvek ažurni sa najnovijim vestima sa sajtova B92 i RTS. Podaci u bazi se skladište u UTF-8 kodnom rasporedu što je takođe razlika od starog sistema. Novi softver povukao je sa sobom i izmene samog sajta najviše zbog toga da bi dnevne vesti koje pristižu tokom dana bile istaknute u prvi plan kako bi posetioci uvek videli da su vesti na naslovima ažurne i kako bi ponovo došli. Kompletan dizajn urađen je u trendu CSS-a korišćenjem stilova i mase DIVova umesto tabela. Ne toliko zbog mode koliko zbog efikasnosti. Naime, IE div elemente renderuje odmah nakon učitavanja za razliku od tabela koje renderuje tek kada učita sadržaj cele tabele. Sa ovakvim dizajnom, korisnici sa sporijom vezom imaju osećaj da se strana brže učitava, odnosno odmah imaju uvid u deo strane koji je IE svukao sa neta. Naravno tu je i ušteda u samoj količini HTML koda i CSS datoteka koje browseri najčešće keširaju tako da i to utiče na brzinu. I dalje mi ovaj novi način dizajna ide pomalo na živce jer ne mogu da odradim neke stvari koje su se sa tabelama jednostavno rešavale, ali uz par Java skriptova sve dođe na svoje mesto. Stari naslovi jesu koristili tabele, ali da bih zaobišao ovaj problem tada nisam koristio klasičan način korišćenja jedne velike tabele u kojoj se ispisuje skoro cela strana sto je čest način rada, već više manjih tabela, tako da su i stari naslovi imali zavidnu brzinu učitavanja i prikazivanja stranica. Pored toga, par novih servisa kao što su vremenska prognoza, kursna lista i Google pretraga, pomeraju sajt malo više ka portalu i mestu odakle možete započeti svakodnevni surf. Sistem nije mali a programer je samo jedan (i to prezauzet) tako da se još dosta stvari radi. Vremenom je svašta na brzaka natrpano na njega pa sada neke stvari želim da malo bolje napišem. Želim malo da promenim način pretrage, generisanje RSS-a, korisnike ePress klipinga treba prebaciti na novi server itd. Kad sve to legne kako treba, onda ću se možda opet posvetiti kvalitetu servisa, boljem algoritam za pretragu koji bi u obzir uzimao padeže, boljem povezivanju vesti, kategorizaciji itd. Google na srpskomSvima je poznato da na stranici sa rezultatima pretrage Google uspešno koristi i srpski jezik. Prilagođavanje stranim jezicima sada je otišlo i korak dalje. Naime ukoliko odete na početnu stranu za Google AdWords servis, videćete da je kompletna strana urađena na srpskom jeziku (naravno ukoliko vam je srpski podešen kao jezik na vašem operativnom sistemu, ako nije izaberite srpski kao jezik u padajućem meniju u gornjem desnom uglu stranice.). Pored naslovne strane, prevedeno je još nekoliko bitnih stranica kao što su FAQ pitanja "Koliko AdWords košta i sl.". Doduše, kroz malo navigacije lako se izgubi podrška za srpski, pa na kraju iz support stranice možete da kliknete npr. na link "How much does AdWords cost?" koji vam otvara stranu na engleskom iako smo se već uverili da postoji i prevod na srpskom. Bilo kako bilo, za početak nije loše. MSN SearchMicrosoft je na adresi http://beta.search.msn.com konačno predstavio beta verziju svog novog search engina. Novi pretraživač rađen je od nule od strane Microsofta i trebalo bi da uskoro postane osnovni pretraživač koji će poduprti MSN potal. Krasi ga indeks od oko 5 miliona stranica kao i par opcija za što bolje pretraživanje i sortiranje pronađenih stranica. Iako će Google verovatno moći i dalje mirno da spava, poznato je da je Microsoft pravi maher u oduzimanju tržišta pa nam ostaje da vidimo kako će se razvijati borba dva giganta, naravno uz nezaobilazni Yahoo.
© 2003-2009. Mladen Jablanović
|
|||||
|
O sajtu Autori FAQ Linkovi KategorijeLičnoOpšte Pretraživači Razvoj Softver Veb Vidi sve Pretraga sajtaArhivapo datumupo kategoriji Powered by pMachine |
|||||