17 czerwca 2007
Google analizuje budowę wyrazów?
Zastanawiam się, czy Google dokonuje przy wyszukiwaniu analizy morfologicznej wyrazów, i to naszych polskich. Nie mogłem się doszukać w sieci informacji na ten temat.
I tak wpisując wyraz "białego" (dopełniacz liczby pojedynczej przymiotnika biały) już na pierwszej stronie wyników otrzymujemy wyróżnione formy biały oraz białym:

Wpisując zaś wyraz "białej" (dopełniacz liczby pojedynczej przymiotnika biała) już na pierwszej stronie wyników otrzymujemy wyróżnione formy białą oraz biała:

W wynikach wyszukiwania formy męskie i żeńskie nie mieszają się, więc chyba wyszukiwarka nie reaguje mechanicznie na początkową część wyrazu, np. biał- albo białe- , bo występują one w obu rodzajach.
Część stron, które zawierają poszukiwane słowo, np. białego, zawiera też inne formy, jak biały. Inne strony zawierają jednak tylko formę pokrewną, a nie ma na nich wcale słowa w postaci wpisanej do wyszukiwarki.
Gdy obejrzymy kopię strony w Google, to na żółto zostanie podświetlona tylko forma wpisana do wyszukiwarki. Przy oglądaniu kopii strony, która wcale nie zawiera wpisanej formy, można zobaczyć np. komunikat tego typu: "Znaleziono tyko w linkach do tej strony: białego". Być może więc wyszukiwarka nie analizuje morfologii wyrazów, tylko uwzględnia wpisaną formę w linkach. Gdyby również w linku byłaby tylko forma pokrewna, to może strona nie byłaby znaleziona. Z drugiej jednak strony w wynikach pogrubia również formy pokrewne, więc w jakiś sposób musi je identyfikować. Ciekawe, jak to faktycznie działa. NetSprint dokonuje analizy, więc może Google też.
3 komentarze

