do góry         o książce


2.6 Wyszukiwarki

Jeśli wiemy czego szukamy i jeszcze tego nie znaleźliśmy -- czas użyć wyszukiwarki!

Proces żmudnego przeszukiwania pojawiających się w Internecie stron wykonują za nas programy-roboty. Próbują dotrzeć do nowych stron i zebrać o każdej z nich reprezentatywne informacje, na podstawie słów kluczowych (rozdział 5.4) albo fragmentów tekstu. Informacje te zbierają w ogromnej bazie danych, udostępnianej przez Internet. Działalność taką prowadzi więcej niż jedna firma, stąd możliwość wyboru.

Wyszukiwarki różnią się między sobą przede wszystkim:

Liczba indeksowanych przez różne wyszukiwarki stron zmienia się, wraz z rozrostem Internetu, z tygodnia na tydzień. Niezmienny jest za to fakt, że im częściej uaktualniają one informacje o indeksowanych stronach, tym mniejsza szansa trafienia na nieprawidłowy odnośnik (,,błąd 404'', rys. 2.1).

Ocena wygody obsługi to już rzecz w dużej mierze subiektywna; większość wyszukiwarek oferuje na początek prosty ekran z polem do wpisania szukanych haseł i guzikiem ,,szukaj'', a dopiero np. kliknięcie zakładki ,,zaawansowane'' (rys. 2.8) odkrywa potęgę dostępnych mechanizmów. Na stronach wyszukiwarek dostępne są zwykle również obszerne objaśnienia i rady dotyczące wyszukiwania, których nie będziemy w tym miejscu powielać (oczywiście gorąco zachęcam do ich przeczytania u źródła -- będą na pewno aktualne).

Dostępne w połowie roku 2000 polskie wyszukiwarki to na przykład
szukaj.arena.pl i wyszukiwarka.onet.pl, indeksujące polską część Internetu. Poza tym większość wspomnianych w poprzednim rozdziale polskich portali oferuje przeszukiwanie swoich uporządkowanych katalogów, a czasami też dostęp do ogólniejszych wyszukiwarek.

Na świecie renomą cieszą się m.in. altavista.com, infoseek.com, google.com, northernlight.com, lycos.com, excite.com czy go.com. Największe z nich mają w swych bazach danych informacje o ponad pięciuset milionach stron WWW z całego świata i obsługują dziennie do pięćdziesięciu milionów zapytań.

Przeglądarka Netscape (od wersji 4.06) oferuje ciekawy mechanizm: jeśli w miejscu przeznaczonym na wpisanie adresu wpiszemy tekst nie przypominający adresu internetowego (URL), Netscape uruchomi serwis Internet Keywords, który spróbuje zgadnąć nasze intencje (oczywiście po angielsku), a jeśli tekst nie skojarzy się ze znanym serwisowi hasłem lub usługą, zostanie uruchomione klasyczne wyszukiwanie (zob. http://netscape.com). Wadą, podobnie jak w przypadku wszystkich ,,zagranicznych'' wyszukiwarek, może być wolniejsze w porównaniu z polskimi serwisami połączenie i brak możliwości zawężenia poszukiwań do obszaru Polski (w niektórych wyszukiwarkach można wybrać język szukanych stron).

Na koniec warto rozważyć możliwość korzystania z kilku wyszukiwarek naraz -- oferują ją lub multiwyszukiwarki. Wpisane przez nas hasło jest wysyłane jednocześnie do kilku ,,klasycznych'' wyszukiwarek, po czym uzyskane odpowiedzi są porządkowane i po usunięciu powtórzeń przedstawiane w postaci jednej listy. Pierwszą taką multiwyszukiwarką w Polsce jest www.emulti.pl (rys. 2.10). Amerykański pierwowzór tej idei to metacrawler.com.

Rysunek 2.8: wyszukiwarka.onet.pl

\includegraphics [width=\columnwidth]{figures/wyszukiwarka.onet.eps}

$\,$

Rysunek: wyszukiwarka.onet.pl z rys. 2.8 po kliknięciu odniesienia Zaawansowane
\includegraphics [width=\columnwidth]{figures/wyszukiwarka.onet_adv.eps}

$\,$

Rysunek 2.10: Multiwyszukiwarka www.emulti.pl
\includegraphics [width=\columnwidth]{figures/emulti.eps}


do góry o książce
Dalej: II. Jak to działa Do góry: 2. Skok w cyberprzestrzeń Wstecz: 2.5 Internetowe wrota