Derde generatie zoekmachines (Zoekmachine)

De derde generatie zoekmachines kijkt naar de populariteit van bestanden en geeft ze mede op basis daarvan een ranking. De periode van de derde generatie begint grofweg rond 1998 met de lancering van Google en Teoma.

In de eerste en tweede generatie zoekmachines werd enkel gekeken naar de inhoud van de metatags, de titels en de content van een pagina. Naar de populariteit werd niet gekeken. Dat leidde er toe dat ilse bijvoorbeeld de site van "de Telegraaf" handmatig op nummer 1 moest zetten op het trefwoord "Telegraaf" omdat er anders een leverancier van Telegraafmachines op nummer een stond in plaats van de populaire krant.

Kortom, er was een nieuw algoritme nodig dat dit probleem wist te omzeilen. Net zoals bij de uitvinding van de fiets en de boekdrukkunst waren er diverse partijen die tegelijkertijd met oplossingen kwamen. De meest populaire en succesvolle werd Google met de introductie van Link popularity en het Pagerank Algoritme. Google was echter vrijwel gelijktijdig met RankDex die het Hyperlink Vector Voting algoritme introduceerde.

Bekende voorbeelden van populariteitsmetingen:


Google Pagerank
Google Pagerank is het bekendste algoritme van de derde generatie zoekmachines. Pagerank wordt bepaald op basis van link populariteit

Hyperlink Vector Voting
Hyperlink Vector Voting is de naam van het algoritme van de zoekmachine RankDex. Het algoritme lijkt sterk op het Pagerank algoritme waar Google bekend mee is geworden en werd ongeveer gelijkertijd met het Pagerank algoritme ontwikkeld.

Visit Rank
Bij visit rank wordt gekeken naar het aantal visits dat een site heeft. Hoe meer bezoekers, hoe hoger de ranking. Visit Rank werd ongeveer een half jaar voor Google Pagerank gelanceerd door Teoma. Het algoritme van Google bleek beter.

Traffic Rank
Traffic Rank is een variant op visit rank en is ontwikkeld door Alexa. Door te kijken naar welke sites gebruikers van de Alexa toolbar bezoeken, en hoeveel pagina's ze bekijken op die site, wordt er berekend welke sites de hoogste traffic rank heeft.

Blogrank
Bij Blogrank wordt gekeken naar het aantal verwijzingen van weblogs naar een pagina. Hoe meer citaties, hoe hoger de rank.

Click Rank
Click Rank is gebasseerd op het aantal clicks. Er kan gekeken worden naar totale aantallen clicks, maar bijvoorbeeld ook naar het aantal clicks in een dag. Dat laatste wordt bijvoorbeeld bij automatische nieuwssites zoals Google news veel gedaan.

Trustrank
Bij trustrank wordt gekeken naar welke sites naar andere sites linken en of deze linkende sites betrouwbaar zijn. In feite is dit een variant op het pagerank algoritme met dat verschil dat betrouwbaarheid een belangrijke rol speelt.


Voorbeelden van derde generatie zoekmachines


Het meest bekende voorbeeld is de zoekmachine Google. Andere voorbeelden zijn Teoma, Hotbot, Rankdex en Alexa.

Uiteindelijk zijn tussen 1998 en 2001 vrijwel alle grote zoekmachines overgegaan tot de derde generatie. In hoofdlijnen is deze technologie nog steeds de basis van de huidige zoekmachines. De grootste ontwikkeling is sinds 2003 met name geweest in het toevoegen van spamfilters.

De volgende generatie, de vierde generatie zoekmachines gaat weer een flinke stap verder en kijkt naar het zogenaamde semantische web, ofwel probeert de betekenis van een zoekopdracht te analyseren. Deze fase is nog maar in de beginfase.

Gerelateerde woorden

Thema & categorieën