Traffic Index to nowatorski algorytm
wyszukiwawczy pozwalający ocenić obiektywną wartość serwisów internetowych.
Dzięki temu rozwiązaniu wyszukiwarka dostarcza Użytkownikom wartościowe wyniki
oraz walczy z nieuczciwym pozycjonowaniem. Wszystko to dzięki zmniejszeniu
znaczenia analizy linków na rzecz badania ruchu na stronie.
Traffic Index oparty jest bowiem na obiektywnej i nie zmanipulowanej ocenie
przez Internautów praktycznie wszystkich polskich serwisów internetowych, zawartej
w badaniu Megapanel PBI/Gemius. W ten sposób Traffic Index jako
pierwszy na świecie uwzględnia w tak dużym stopniu analizę ruchu na poszczególnych
serwisach.
Tym samym Użytkownicy Internetu pomagają ocenić NetSprintowi wartość stron, dzięki
czemu wyszukiwarka NetSprint lepiej realizuje swoje podstawowe zadanie, czyli
nie tylko wyświetla stron związane z treścią zapytania Użytkownika, ale przede
wszystkim te będących obiektywnie wartościowym źródłem informacji.
Co ważne badanie Megapanel PBI/Gemius oparte jest na obiektywnej próbie a jego
wyniki są praktycznie nie możliwe do zniekształcenia. Miesięczna cykliczność badań
sprawia, że NetSprint posiada wciąż uaktualnianą wiedzę na temat
szybko zmieniającego się i rozwijającego polskiego Internetu.
Od swego powstania w 2000 r. wyszukiwarka NetSprint,
podobnie zresztą jak inne wyszukiwarki, oceniała wartość poszczególnych stron
między innymi poprzez badanie liczby linków prowadzących do danego serwisu. Badano
ile odnośników prowadzi do danej strony www, jak również czy pochodzą one
z wartościowych serwisów. Dzięki temu na pierwszej stronie wynikowej znajdowały
się te strony, które miały jednocześnie dużo linków prowadzących do siebie z popularnych
stron (co świadczyło o ich wysokiej wartości obiektywnej) oraz zawierały
treści bezpośrednio związane z zapytaniem Użytkownika (dzięki zaawansowanej
analizie językowej).
Przez długi czas mechanizm badania linków dobrze spełniał swoje zadanie. Jednak
wraz z popularyzacją wiedzy na temat znaczenia linkowania dokumentów coraz częściej
okazywało się, że webmasterzy nie zawsze polecają wartościowe dokumenty, w efekcie
słuszny w swoim założeniu mechanizm działał coraz słabiej.
Dodatkowo, wraz z eksplozją Internetu, powstawało coraz więcej serwisów, których nikt
nie linkował. Oznaczało to, że duża część stron – w tym często wartościowych
- pozostawała na marginesie Internetu.
Z czasem zespół NetSprint dodawał do algorytmu nowe kryteria, np. miejsce pochodzenia
linku, wartość serwisu w opinii internautów i redaktorów katalogów, tematykę serwisu
z jakiego pochodzi link itd. W wyniku tych działań ranking badania wartości stron
stawał się coraz bardziej złożony. Zespół informatyków NetSprinta cały czas
szukał alternatywy, czegoś, co pozwalałoby jednoznacznie określić wartość danego
serwisu, a nie byłoby obciążone wadami badania linków.
Dodatkowo sytuacja stała się jeszcze bardziej skomplikowana, gdy chcąc wyjść naprzeciw
potrzebom użytkowników podjęły decyzję, że NetSprint będzie indeksował najwięcej
wartościowych polskich stron. Wielokrotne zwiększenie liczby przeszukiwanych dokumentów
wymagało posiadania bezbłędnego i niepodlegającego manipulacjom algorytmu. Obrazowo
rzecz ujmując z 60 lub 100 mln dokumentów dużo trudniej jest wybrać 20 najlepszych
wyników niż z 22 mln jakie wcześniej przeszukiwała wyszukiwarka.
Szansa na uzyskanie idealnego rozwiązania pojawiła się pod koniec 2004, gdy zakończyły
się prace nad unikalnym w skali światowej Badaniem Megapanel PBI/Gemius, umożliwiającym
porównywanie popularności praktycznie wszystkich polskich witryn i aplikacji internetowych.
Obserwacja i zgromadzone dane z zachowań kilkudziesięciu tysięcy Internautów biorących
udział w badaniu pozwalają na precyzyjne określenie wartości poszczególnych serwisów.
Dzięki współpracy z Gemiusem NetSprint wzbogacił swoją wiedzę na temat
polskiego Internetu – a dokładniej kilkuset tysięcy domen, które zostały
kiedykolwiek odwiedzone przez panelistów biorących udział w badaniu. Tym samym
Użytkownicy Internetu pomagają ocenić NetSprintowi wartość stron a nowotworzony
algorytm oparł się na obiektywnej i nie zmanipulowanej ocenie Internautów.
Algorytm Traffic Index bierze pod uwagę wiele czynników
świadczących o obiektywnej wartości danej strony:
- popularność serwisu czyli liczbę jego użytkowników, oglądalność i lojalność
użytkowników
- analizę linków - liczbę linków z serwisów zewnętrznych i wartość serwisów
z których serwis jest "linkowany"
- charakter serwisu
- czas istnienia serwisu w Sieci.
Powiązanie tych informacji z zaawansowaną analizą językową zawartością danej
strony, czyli występowaniem wyszukiwanej frazy w widocznej dla użytkownika części
strony oraz występowaniem wyszukiwanej frazy w linkach prowadzących do serwisu
pozwala na uzyskanie unikalnych, najbardziej wartościowych dla użytkownika wyników
wyszukiwania.

Kliknij, aby powiększyć
Najbardziej na wprowadzeniu Traffic Index skorzystają
Użytkownicy. Dzięki uwzględnieniu w algorytmie wiedzy na temat ruchu na poszczególnych
serwisach w wynikach wyszukiwania:
- wyżej prezentowane będą serwisy zawierające wartościowe dla Użytkowników
treści
- witryny o wysokim wskaźniku Traffic Index będą częściej odwiedzane przez
spidera NetSprinta. Dzięki temu w wyszukiwarce przeszukiwane będą aktualne
treści pochodzące z tych serwisów
- w dużym stopniu eliminowane są strony bezwartościowe, nie
odwiedzane przez Internautów. Dzięki temu w wynikach rzadko znajdą się strony
tworzone jedynie w celu ich wysokiego pozycjonowania w wyszukiwarkach (spam).
Aby podkreślić znaczenie Traffic Index Zespół NetSprint stworzył zupełnie
nową wersję serwisu netsprint.pl. Internauci, korzystający z tej wyszukiwarki,
mogą zapoznać się z pozycją najpopularniejszych domen bezpośrednio w wynikach
wyszukiwania (tzw. „Popularna strona”). Dokumenty zebrane w ciągu ostatnich 72h
dodatkowo oznaczone ikoną aktualna strona.
I to, co prawdopodobnie najważniejsze. Mogą przeszukiwać ponad 60.000.000, a wkrótce
dużo więcej polskich stron. Z pomocą Traffic Index powinni łatwo wyszukać te najbardziej
wartościowe.
Chcesz wiedzieć więcej?
Pobierz dokument PDF z pełnymi informacjami
na temat Traffic Index