Publicat de Boog on 02:49

In ultimii ani domeniul search engineurile de web a fost dominat autoritar de un singur nume: Google. Nu exista nimeni care sa fi folosit internetul si sa nu fi folosit macar o data search-ul oferit de google.com.
Acest search este imbunatatit incontinuu (de cand a aparut acum 10 ani pana in prezent acesta a suferit imbunatatiri extraordinare). Aceste imbunatatiri au fost fundamentate de aproape 50 de ani de studii despre Information Retrieval (IR) si data mining. Putem spune acum ca acestea constituie insasi bazele tehnologiilor Google.
Nu voi vorbi insa in acest post despre cum se realizeaza cunoscutul PageRank, ci mai degraba despre cum incearca Google sa integreze semantica in query-urile sale.
Unul obstacolele pe care motoarele de cautare le intalnesc este insasi utilizatorul. Acesta de cele mai multe ori habar nu are ce cauta. Utilizatorul poate tasta gresit cuvintele de cautat, sau poate impune constrangeri de cautare care nu exista cu adevarat, etc... Un motor de cautare bun trebuie sa identifice aceste greseli. Putem spune ca motto-ul search engineurilor s-a schimbat de la : "caut ce ai scris" la "caut ce ai vrut".
Un prim pas pentru a realiza acest lucru este indexarea inteligenta si asocierea si altor keywords unei pagini decat cele prezente in cod. De exemplu, daca cautam websiteul sediului dintr-un oras al unei anumite companii putem tasta: "numele companiei" "oras" , chiar daca numele orasului nu apare in codul site-ului respectiv.
O alta inovatie adusa de Google : sistemul de sinonime contextuale si sistemul de corectii de scriere. A detecta greselile de scriere necesita o acuratete foarte mare, asta datorita multor cuvinte similare.De exemplu, daca cautam kofee annan, motorul stie ca de fapt il cautam pe Kofi Annan. Iar daca cautam kofee beans ne va afisa rezultate cu coffee beans.
Sinonimele pot parea ceva firesc pentru utilizatorul uman, insa pentru un limbaj automat detectarea acestora in cadrul unui context poate fi ceva extrem de complicat. Spre exemplu : Dr din Dr Jivago sau Miami Dr poate insemna Doctor sau Drive, Google trebuie sa le identifice corect pe amandoua.
De asemenea ar mai fi cautarile localizate: daca cautam restaurant in Romania vom primi alte rezultate decat daca ne-am afla in Tokio. De asemenea unele cuvinte inseamna altceva in unele zone (football in Europa returneaza rezultate despre fotbal/soccer, pe cand in America de Nord returneaza rezultate cu fotbal american).
Pana la urmatorul post, search well!

0 comentarii: