Jeroen.com | weblog | woordenboek | zoeken | contact
Google Weblog    
 

13 Mei '05 - + 1 - 3 Waarom vinden.nl ernstige zoekmachine spam is en een penalty hoort te krijgen - zoekmachine vervuilt Google met 300.000 pagina's


Eigenlijk is dit meer een column vandaag. Een mening in het geschreven woord. Ik, en niet alleen ik, erger me de laatste tijd werkelijk kapot aan vinden.nl Ik ben een professionele zoeker met een abonnement op zoeken met Google die een hoge mate van verslaving benadert. Ik ben ook nog eens een liefhebber die houdt van mooie algoritmes en resultaten die goed in elkaar steken.



En dat laatste is niet echt meer het geval doordat een enkele partij dusdanig de resultaten vervuilt dat je ze op ieder totaal irrelevant trefwoord tegen komt. Sterker nog, Vinden.nl heeft met meer dan 300.000 woorden Google vervuild...




Is vinden.nl zoekmachine spam?

Normaal als ik schrijf over zoekmachine spam dan kom ik met mooie analyses over cloaking, linkfarms, javascript cloaking, misleidende redirects en al wat schoons. Dit zul je zo niet aantreffen op vinden.nl Heel strikt genomen zou je kunnen redeneren dat ze geen spam *technieken* gebruiken, maar in mijn opinie is er wel degelijk sprake van zoekmachine spam.


Wat is dan zoekmachine spam?

Een heel erg formele definitie zou kunnen zijn:
    "Alles wat je aan een site aanpast wat je niet zou hebben gedaan wanneer zoekmachines niet zouden hebben bestaan."

Deze definitie is natuurlijk erg strikt en niet geheel realistisch. Het beter leesbaar maken van een site voor de zoekmachines is in principe ook een stuk usability waar niets mee mis is. Je creeert een andere ingang om informatie toegankelijk te maken. Ook het vindbaar maken van bedrijven op merknamen en productnamen is helemaal niets mee mis. Thumb of rule is dat je eigen unieke content hebt over de woorden waarop je optimaliseert.


Wat doet vinden.nl dan?

Vinden.nl is in essentie een zoekmachine. Meer specifiek is het een metazoekmachine die gebruik maakt van diverse andere zoekmachines. Het allerbelangrijkste kenmerk van de zoekmachine is dat ze zelf in principe geen eigen content heeft.

Vinden.nl heeft een truc gebruikt om de resultatenpagina's zo op te bouwen dat de zoekmachines het zijn gaan zien als unieke content. Verder hebben ze een linkstructuur gemaakt die van iedere zoekopdracht een link maakt en de pagina's zo toevoegt aan Google.

Op deze manier hebben ze inmiddels 325.000 pagina's in Google geplaatst. Overigens was dit enkele weken geleden nog "maar" 180.000 pagina's. Het aantal neemt dus in hoog tempo toe.



Als we een willekeurige andere zoekmachine bekijken (laten we google.nl dan maar nemen ;-) ) dan zien we dat die slechts 395 pagina's in google heeft.


Een zoekmachine die ethisch te werk gaat weet dat het niet de bedoeling is dat resultaten pagina's in de resultaten van andere zoekmachines komen. Een zoekmachine die weet dat dit gebeurt en het bewust versterkt door een bepaalde linkstructuur te kiezen is naar mijn mening sterk in overtreding en doorbreekt de ethische regels. In het geval van vinden.nl gebeurt dit bewust en op grote schaal met als doel bezoekers te lokken.


Aparte site structuur voor de zoekmachines

De site van vinden.nl kent een tweetal structuren. De eerste is er voor de normale gebruiker. Wie binnenkomt op vinden.nl en bijvoorbeeld zoekt naar een transportfiets krijgt een volgende pagina geserveerd:

http://zoek.vinden.nl/?refer=&query=transportfiets&x=0&y=0&where=web

Wie echter zoekt in Google naar een Gazelle Kruisframe (ik hem soms vreemde hobbies) komt ook een pagina over transportfietsen tegen, echter met een geheel ander url:

Bron: http://www.vinden.nl/z/transportfiets.html

Conclusie: vinden.nl hanteert een aparte site structuur die speciaal is aangemaakt voor de zoekmachines.



Metatags in speciale resultaten pagina's

Opvallend is dat de pagina's die in Google staan metatags bevatten. Metatags pas je alleen toe als je bewust gevonden wilt worden op een bepaald woord. Op Google, ilse en MSN zul je in de resultaten pagina's geen keyword metatags vinden eenvoudigweg omdat ze niet gevonden willen worden.

Een voorbeeld van een stuk code:

<html>
<head>
<title>transportfiets - vinden</title>
<META NAME="keywords" CONTENT="transportfiets">
<script>

Bron: http://www.vinden.nl/z/transportfiets.html

Wie op de normale manier op vinden.nl zoekt zal echter geen metatags aantreffen:

http://zoek.vinden.nl/?refer=&query=transportfiets&x=0&y=0&where=web

Deze normale pagina's bevatten geen keywords metatags en zijn naar alle waarschijnlijkheid niet zo gemaakt met het doel in de zoekmachines komen.


Inbreuk merkenrecht

Daarnaast maakt Vinden.nl op allerlei wijzen misbruik van de merknamen van diverse bedrijven. Wie verder zoekt komt vinden.nl tegen op een enorme verscheidenheid aan merknamen.

> www.google.nl/search?q=ohra+lenen
> www.google.nl/search?q=kpn+abonnement
> www.google.nl/search?q=transit+ford
> www.google.nl/search?q=olivetti
> www.google.nl/search?q=cartier



De factor "mate van gebruik van type spam technieken" versus "mate van storendheid"

Bij zoekmachine spam kun je altijd een formule los laten op hoe ernstig de zoekmachine spam is om te bepalen hoe groot de kans op een penalty is en of een penalty terecht is.

    De mate van vervuiling * de vorm van spam = hoe groot de kans op een afstraffing is.


Stel dat er ooit iets heel erg vreemds gebeurt en ik zou een site over "kantklossen" cloaken. Dan zou dat - behalve opzienbarend- me direct een penalty op kunnen leveren, maar omdat niemand zich stoort aan het trefwoord kantklossen is de kans in theorie klein dat ik tegen de lamp loop. Ben ik iets meer zichtbaar met cloaking dat zal me dat vrijwel direct een penalty opleveren. Gebruik je echter "nette" (wat een discussie op zichzelf waard is) technieken maar doe je dat zonder relevante pagina's dan kan je op een gegeven moment ook over de lijn heen gaan. In mijn mening is vinden.nl heel erg zwaar over die lijn heen gegeaan.



Meer links:

> vinden.nl




19 Googley reacties!:

Amen Jeroen!

Wilbert Philippo (link) - 13 Mei '05 - 12:20

Hoi Jeroen,

Leuk om te zien dat je ook een artikel over de optimalisatietechniek van Vinden geplaatst hebt en daar een hele andere benadering voor kiest. Dat er meerdere mensen tegelijk bezig zijn met dit onderwerp lijkt me ook wel een bewijs dat het leeft en dat veel mensen zich hieraan ergeren.

Je punt met de meta-keywords is inderdaad interessant. Ik kon verder ook geen verschil vinden tussen de ‘gewone’ zoekresultaatpagina en de versie in de ‘map’ ‘z’. Toch is het vreemd, want naar mijn weten negeren alle belangrijke zoekmachines de meta-keywords.

Remi van Beekum (link) - 13 Mei '05 - 13:20

Hey Remi, Ik had er de laatste tijd al met diverse mensen over gesproken en wilde nog een paar mensen er over spreken voordat ik het artikel zou plaatsen maar omdat het op marketingfacts door jou ook geplaatst werd was het tijd om het artikel eindelijk van de plank te halen. Toen ik het schreef stonden er nog maar 188.000 pagina’s van vinden.nl in Google ; ) Meestal besteed ik wel een dagje voorwerk voor zo’n artikel plaats omdat ik onder andere bewijsmateriaal (screenshots, html codes, cloaking checks etc) verzamel voordat ik een artikel publiceer. Van Vinden.nl had ik al een aardig dossier…

Inderdaad leuk dat we beiden een andere twist er aan gaven. Mijn belangrijkste punt is dat vinden.nl de ethische scheidslijn overtreedt door bewust andere zoekmachines te vervuilen met resultatenpagina’s zonder eigen content te hebben. Dat vind ik het grote verschil tussen vinden.nl en 1stekeuze.nl en daarom vind ik vinden.nl een zeer zware vorm van spam, zeker gezien het aantal van ruim 325.000 pagina’s.

De metatags zijn een opvallend punt die aantonen dat het om een bewuste actie van vinden.nl gaat. Feitelijk maakt van de top 10 zoekers alleen ilse.nl nog gebruik van de keywords metatag, dus echt zinvol is hij niet. En als ik dan zoek op “dood metatags” in Google kom ik … Punt nl WEER tegen… Zucht…Enfin, ik ben benieuwd of de twee artikelen van ons tot publiciteit en een penalty van vinden.nl leiden. Ik hoop dat Google er werk van gaat maken.

Jeroen van de Wiel (link) - 13 Mei '05 - 15:27

Ik zou het zo definieren:

Zoekmachinespam: Het opzetten/aanpassen van een site op een manier die je niet zou hebben gebruikt wanneer zoekmachines niet zouden hebben bestaan en wat geen toegevoegde waarde biedt voor de gebruiker van de zoekmachine.

Tinus () (link) - 13 Mei '05 - 15:43

Jeroen, je hebt 101% gelijk! Qua techniek trouwens ook leerzaam…

BasW (link) - 13 Mei '05 - 21:20

@Jeroen,

Op marketingfacts.nl schrijven ze ook over de vermeende spam technieken van 1stekeuze.nl en over ontheweb.nu…

1stekeuze.nl gebruikt toch dezelfde techniek!?

Gerben (link) - 14 Mei '05 - 22:46

Als ik iets zoek, wil ik meteen resultaten en dus niet weer een zoekmachine. Dus weg met vinden.nl

Farshad Bashir () (link) - 15 Mei '05 - 11:23

Marktplaza.nl kan er anders ook behoorlijk wat van. Ze hebben talloze domeinnamen zoals http://www.renault-te-koop.nl,, http://www.mercedes-te-koop.nl,, http://www.autoradio-te-koop.nl geregistreerd en plaatsen daarop pagina’s speciaal voor de zoekmachines. ook weer met een hoop keywords en links wat grote hoeveelheden pagina’s oplevert..
Vanaf de sitemap op Marktplaza.nl (http://www.marktplaza.nl/sitemap/motor/m..) linkt hij naar de domeinnamen http://www.*-te-koop.nl..

Onno () - 16 Mei '05 - 12:50

Marktplaza is trouwens wel lekker op gang.. Ook advertentiezoeker.nl is van hun. Zoek in Google eens op “site:www.advertentiezoeker.nl”, dan zie je dat ze op een soortgelijke manier spammen als Vinden.nl met die site. Net als met hun domain veilingzoeker.nl trouwens. Ohja, “marktplaza inurl:te-koop.nl” toont een lijst van domains die ze tot nu toe hebben geregistreerd. Ze hebben er zin in! :)

Onno () - 16 Mei '05 - 12:59

Volgens mij moet je het zo formuleren:
Als zoekmachines “gewoon” op inhoud zochten, dan was er nooit zoiets geweest als “ZM-Spam”.
Zodra de “keywords” in beeld kwamen ging het mis. Met de “links to you” is het nog verder uit de klauwen gelopen.
Ik heb een site (in ruste…;) maar “ooit” 300 hits gemiddeld per dag!), die geheel niet geindexeerd is in Google. Ik ken diverse interessante sites die weinig populair zijn – omdat het te ingewikkeld is wat er aan informatie geboden wordt – die niet (meer) bij Google te vinden zijn.

“Don’t blame the webmaster, blame the search engine technology!”

Google heeft baat bij “popi jopi” content, want dat maakt ze populair en de aandelen weer meer waard dan ooit te voren. Dit gaat miljarden opleveren aan de “o zo ethische en content bewuste, creatieve eigenaren!!!”.

Niks etisch aan de hele zoekmachine business, dus waar gaat dit over?
Als je je account verliest (als web designer) omdat je opdrachtgever te weinig Google resultaten ziet, dan piep je wel anders, ja toch?

Dick () (link) - 25 Mei '05 - 00:32

Het is toch eigenlijk ook erg dat zelfs zoekmachines bezig zijn met zoekmachinespam ten opzichte van andere zoekmachines, waar houdt dit op?

Erwin () (link) - 25 Mei '05 - 10:49

Belachelijk, ook van marknet!
Waar kun je dit soort zaken melden?

anton () (link) - 08 Juli '05 - 14:05

Ik heb vinden.nl direct aangeschreven wanneer ik zijn SPAM werk had gezien, en hij heeft me daarvoor opgebeld.
Je houdt het niet voor mogelijk welke onzin hij uitkraamde, Naar eigen zeggen had hij heel goede banden met google. Meer nog, verteld hij aan telefoon; Ik kan je op één dag uit google gooien, één telefoontje naar google en het is gebeurd. Ik had eigenlijk wel compassie met die man… ))):-

Enfin, ik heb nog nooit zo’n groot spammer aan ‘t werk gezien op internet.
Diegene die de meeste duppe van zijn, zijn diegen die in google staan zelf.
Met de meeste teksten stond vinden.nl beter in google dan van waar de bron kwam ;)
Dit is niet echt leuk… jouw content (title & beschrijving wat in google tevoorschijn komt) wordt gebruikt door vinden.nl en bij klikken heb je heel andere resultaat ;)

Maar ik zie dat ze nu allemaal wegzijn. of is dat niet zo??
Da’s anders goed nieuws. Hoe google soms spam weghoudt is me een raadsel, maar ze doen het toch maar.

Thx,
Filip

filip () - 15 Juli '05 - 02:38

Op een gegeven moment beloofde hij een tool te ontwerpen om mijn pagina’s van zijn vinden.nl te vrijwaren.
Met andere woorden hij wist wel met wat hij bezig was… Anders zou hij dit niet voorstellen.

Filip

filip () (link) - 15 Juli '05 - 02:44

‘k was deze week nog eens iet aant doen voor informatica en ik kwam op deze site terecht, heel interessant wel dus een goede zet in de ogen van vinden.nl vele andere zoekmachines gebruiken ook deze “truc”

TJ

TJ - 26 September '05 - 17:08

het is al laat

en hoe is het met jou

kim () - 19 December '05 - 20:46

Ik begrijp niet waarom er hier moord en brand wordt geschreeuwd om Vinden.nl.

Jullie zitten toch ook dagelijks op het internet? Er zijn zo vele manieren en sites/ncihes die deze manier op 1 of andere manier gebruiken.

Niks mis mee.

Waar wel iets mis mee is, het algoritme van Google.
Vinden.nl is een symptoom van iets dat fout loopt bij Google.
Niemand praat hier over Google als schuldige terwijl zij de enige zijn waar het probleem ontstaat.
Enne, Google heeft niet te beslissen wat wel en niet mag op het internet he.
Het enige wat zij zouden mogen doen is pagina’s spideren en op die basis een ranking maken.
Potdorie, de laatste tijd beslist Google gewoon hoe het er aan toe gaat op internet, denk maar aan het idiote nofollow.

Nog eens voor alle duidelijkheid :
Het is Google’s algoritme dat hier in de fout gaat.

Voor de rest helemaal eens met Dick :
âDonât blame the webmaster, blame the search engine technology!â

En een terechte opmerking van hem dat google alsmaar meer een populariteits zoekmachine is en alsmaar minder een kwaliteits zoekmachine.
En het wordt alsmaar erger als je het mij vraagt.

Pascal Beyens (link) - 30 April '08 - 23:57

En laat me daar nog het 1 en ander aan toevoegen.

Google veroorzaakt zelf een boel spam.
Ik denk daarbij aan de Adsense tips die ze op regelmatige basis versturen en waarin ze adviseren om de Adsense blokken te plaatsen in de content stukken.
Dat is SPAM! Je krijgt potdorie alsmaar vaker een site te zien met ads waarop je moet scrollen om echte inhoud te zien.

En dan bv de dmoz clonen waaronder de Google cloon er van.
De Wikipedia clonen en ga zo maar door.

Vinden.nl heeft dan tenminste nog unieke pagina’s waar je toch wel daadwerkelijk iets op kan vinden.

Pascal Beyens () (link) - 01 Mei '08 - 00:02

Hmmm, ik geloof niet dat vinden.nl vandaag de dag nog zulke technieken toepast. site:http://www.vinden.nl

Jort (link) - 22 Juli '10 - 17:53


DISABLED BECAUSE OF COMMENT SPAM submit3 . php#message" id="form">
Naam:  
Persoonlijke info onthouden?

Email:
URL:
Reactie:Emoticons / Textile


Kleine lettertjes: Alle HTML-tags behalve <b> en <i> zullen uit je reactie worden verwijderd. Je maakt links door gewoon een URL of email-adres in te typen.
--> -->