Napisali o nas

 

"Walka na wyszukiwarki" - BiznesNet.pl, 19 września 2001

Każdego dnia zadawane jest w polskim Internecie około 1 mln zapytań do wyszukiwarek. Stanowią one podporę oglądalności każdego portalu, nie wspominając o atrakcyjnym rynku reklamy stowarzyszonej z wynikami wyszukiwania. Z kolei producenci wyszukiwarek starają się sprzedawać je w modelu ASP. Prezentujemy rozmowę z Arturem Banachem, koordynatorem projektu NetSprint.pl w firmie XOR Internet.

BN: Ile wyszukiwarek działa obecnie na świecie?
AB: Systemów działających na całym świecie jest mniej niż 10. Do tego należy jednak doliczyć wszystkie wyszukiwarki indeksujące tylko zasoby jednego kraju. Oprócz nich istnieje w sieci bardzo dużo wyszukiwarek specjalistycznych, służących tylko znajdowaniu plików mp3, multimediów, czy nowych informacji jakie pokazały się w sieci. Należy wreszcie wspomnieć o multiwyszukiwarkach (np. polskie emulti.pl) przedstawiających zebrane wyniki z wielu innych systemów wyszukiwawczych. Tak więc z całą pewnością liczba wszystkich wyszukiwarek jest liczona w setkach.

BN: W jakim stopniu światowe wyszukiwarki indeksują polski Internet?
AB: Zasoby największych światowych wyszukiwarek liczą ponad miliard stron, jednak dużym problemem dla polskiego użytkownika jest to, że mały odsetek w tym zbiorze stanowią polskie strony. Na przykład indeks obecnie największej wyszukiwarki na świecie - amerykańskiego Google liczy zaledwie 2 miliony dokumentów zawierających polską treść. Dla porównania NetSprint już w tej chwili zgromadził 6 milionów dokumentów.

BN: Ile dokumentów jest obecnie dostępnych publicznie w całej światowej sieci?
AB: Szacuje się, że cała sieć WWW liczy już teraz od 2 do 4 miliardów dokumentów. Przy czym Polski Internet jest oceniany na 20-40 milionów stron. Bez przesady można stwierdzić, że w Sieci jest już praktycznie wszystko, co tylko możemy sobie wymarzyć. Ale Internet z całym swoim bogactwem zaczyna nam uciekać, ponieważ rośnie szybciej niż potrafimy go indeksować. Problemem stał się więc nie brak danej informacji, jej ale odnalezienie. Dlatego właśnie od precyzji i wydajności wyszukiwarek zależy, czy w gąszczu stron odnajdziemy przez nas poszukiwane. Można więc śmiało powiedzieć, że przyszłość należy do wyszukiwarek...

BN: Z jakich wyszukiwarek korzysta się w Polsce?

AB: Wyszukiwarki polskiego Internetu są dostępne dla użytkowników zarówno w portalach, jak i w serwisach wyszukiwawczych. Z Altavisty korzysta Gazeta.pl i Interia.pl, z Infoseeka Onet.pl, a wyszukiwarka Fast stosowana jest przez Wirtualną Polskę. Wyszukiwarka Netoskop jest dostępna na portalu Poland.com. Dodatkowo większość portali stosuje inne systemy wyszukiwawcze do przeszukiwania zasobów zagranicznych. Błyskawiczną popularność wśród Internautów na całym świecie zdobywają też "czyste" serwisy wyszukiwawcze. Można tu wymienić m.in. amerykańskie Google.com, czy Altavista.com

BN: Co było najtrudniejszym zadaniem podczas prac nad wyszukiwarką NetSprint?
AB: Użytkownicy wyszukiwarek oczekują najwyższej jakości już na pierwszej stronie wyników wyszukiwania. Z drugiej strony badania na całym świecie pokazują, że duża część użytkowników jest niezadowolona z dostarczanych im odpowiedzi. Dlatego największym wyzwaniem dla projektantów NetSprinta, było stworzenie mechanizmu prezentującego w wynikach dane nie tylko związane tematycznie z zapytaniem naszego użytkownika, ale też ogólnie uznane przez internautów za wartościowe.

BN: W jaki sposób firma poradziła sobie ze wspomnianym wyzwaniem?
AB: W serwisie netsprint.pl wartość strony określana jest poprzez badanie linków, które na nią wskazują w całych zasobach polskiego Internetu. Pierwsze pozycje w wynikach wyszukiwania zajmują więc strony z największą liczbą prowadzących do nich odniesień. Przy czym waga linków zależy od popularności serwisów, z których pochodzą. Zwiększa to znacznie szanse, że prezentowane przez nas wyniki dostarczą informacji poszukiwanych przez naszych użytkowników.

BN: Jaki wpływ na prace nad wyszukiwarką miała specyfika języka polskiego?
AB: Dla polskich Internautów oprócz trafności wyników równie ważne jest dostosowanie wyszukiwarki do zawiłości naszego języka. Prowadzone obecnie prace umożliwią nam już w najbliższym czasie zastosowanie słownika języka polskiego na etapie indeksowania dokumentów, co dodatkowo podniesie jakość prezentowanych wyników. Kompleksowe dostosowanie NetSprint.pl do specyfiki języka polskiego, możliwe będzie dzięki współpracy z firmą Neurosoft, twórcy narzędzia do analizy językowej, pioniera badań nad przetwarzaniem tekstów w językach naturalnych.

BN: W jaki sposób określa się wydajność wyszukiwarek?
AB: Wydajność wyszukiwarki zależy między innymi od ilości zbieranych przez system dokumentów oraz prędkości z jaką może następnie zostać z nich stworzony indeks. Kluczową wartością dla użytkowników jest też oczywiście czas odpowiedzi serwisu na zapytanie. Dla przykładu podam, że NetSprint zbiera z Sieci 21 000 dokumentów na godzinę, a w fazie tworzenia indeksu analizuje ich 250 000. Czas odpowiedzi serwisu jest poniżej 1 sekundy. Dzięki takim parametrom nasze rozwiązanie może być z powodzeniem stosowane zarówno do indeksowania całego Internetu, jak również do częstej aktualizacji zawartości poszczególnych witryn, czy sieci intranetowych.

BN: Jaka jest szybkość odpowiedzi wyszukiwarki na zapytania użytkownika?
AB: Dzięki rozproszonej architekturze, NetSprint odpowiada na zdecydowaną większość zapytań w czasie liczonym w setnych częściach sekundy, co czyni go najszybszą wyszukiwarką w polskiej Sieci. Dzięki zaawansowanym algorytmom wyszukiwania zastosowanym w serwisie, nawet użytkownicy korzystający z modemu uzyskują błyskawiczny dostęp do wyników. Szybkiemu ładowaniu stron służy uproszczony interfejs użytkownika oraz rezygnacja z banerów graficznych.

BN: Ile kosztowało opracowanie wyszukiwarki NetSprint. Jak długo trwały prace?
AB: Koszt przygotowania wyszukiwarki liczony jest w setkach tysięcy dolarów. Bardzo kosztowna jest platforma sprzętowa odpowiedniej klasy, która jest w stanie zindeksować ponad 10 milionów dokumentów oraz dostarczać natychmiastowe odpowiedzi użytkownikom. Obecnie zapewnia ją firma eCenter, partner technologiczny NetSprinta. Wyszukiwarka od dwóch lat jest rozwijana przez grupę 10 informatyków pracujących w naszej firmie.

BN: Na czym polega specyfika modelu ASP, zastosowanego przy sprzedaży NetSprinta?
AB: Zdecydowana większość systemów wyszukiwawczych jest dostępna tylko jako oprogramowanie, na które mogą sobie pozwolić tylko najwięksi. Natomiast dzięki dzierżawie NetSprinta nie trzeba myśleć o stałym indeksowaniu Internetu na swoich serwerach, czy utrzymywaniu łącz zapewniających obsługę ich użytkowników. My przesyłamy gotowe wyniki naszym klientom w XML, dzięki czemu mogą je w pełni wkomponować w wygląd stron swojego serwisu. Dzięki temu zyskują bardzo cenną powierzchnie reklamową oraz zwiększają funkcjonalność swojej witryny. Podobny model stosuje amerykańska wyszukiwarka Google.com. Połowa jej przychodów pochodzi z udostępniania wyszukiwarki innym serwisom w modelu ASP.

BN: Gdzie w polskiej sieci została wykorzystana wyszukiwarka NetSprint?
AB: Naszym pierwszym klientem był portal Hoga.pl, który wykupił licencję w 2000 r. Od kilku tygodni, dzięki porozumieniu z firmą eCenter, oferujemy dzierżawę NetSprinta, co umożliwia dostosowanie ceny naszej usługi do dowolnej wielkości serwisu. Z takiego rozwiązania wciąż, mimo swoich trudności, korzysta Arena.pl. Jesteśmy już także dostępni w kilku wortalach oraz gazetach on-line. Na bazie systemu powstał też serwis wyszukiwawczy netsprint.pl .

BN: Według jakich modeli biznesowych działają wyszukiwarki?

AB: Mimo recesji panującej w branży IT, wyszukiwarki stają się rentownym interesem. Liderzy rynku w USA GoTo.com oraz Google informują o osiągnięciu zysków netto. Głównym źródłem dochodów GoTo.com jest sprzedaż miejsca w wynikach wyszukiwania w serwisie (paid placement). Google czerpie przychody w połowie z reklamy oraz z udostępniania swojej wyszukiwarki innym serwisom w modelu ASP. Znamienne jest to, że Google, mimo że nie sprzedaje miejsc w wynikach wyszukiwania czerpie połowę swoich przychodów z reklamy, opierając ja na banerach tekstowych, które charakteryzują się zaskakująco wysokim CTR. 

Strona Główna | Toolbar | Dlaczego NetSprint? | Reklamuj siê u nas | NetSprint na Twojej stronie | Wszystko o NetSprint

© 2000-2004 NetSprint.pl