Google Cache (Google)

Google maakt van iedere ontdekte pagina een screenshot en plaatst die in een cache. Deze wordt getoond op het moment dat de originele pagina niet beschikbaar is. Als je op die cache link klikt dan krijgt men de webpagina te zien zoals die er uitzag toen deze door Google werd geindexeerd. Via Google's cache kan men een indruk krijgen of de pagina past bij de zoekactie.

Niet alle pagina's worden in de cache geplaatst. Wanneer sites niet in de index geplaatst zijn of wanneer webmasters hebben gevraagd de inhoud niet op te slaan dan is de cache niet beschikbaar.


Google Cache uitsluiten

Wanneer je wilt voorkomen dat mensen de Google Cache functie kunnen gebruiken dan dient men de volgende noarchive metatag toe te voegen:

<meta name="robots" content="noarchive"> 


Let op: met deze metatag sluit je alle archieven uit, dus ook die van archive.org. Wanneer je alleen de Googlebot wilt uitsluiten kan dat met de volgende metatag:

<meta name="googlebot" content="noarchive">


Wanneer deze wordt gevonden dan zal de cache functie voor de pagina uitgezet worden.


Zoeken naar pagina's in Google Cache


Er is een speciale zoekfunctie om te zoeken naar een pagina die in de cache staat. Dit doe je door ze "zoekoperator" "Cache:" te plaatsen voor een url. Voorbeeld:

cache:nu.nl 

(let op: zonder spaties!)


Wanneer je deze zoekopdracht plaatst zie je welke pagina Google voorgeschoteld kreeg tijdens de laatste keer dat de Googlebot langs kwam.

Rechtzaken rond Google Cache

In het verleden zijn er diverse rechtzaken geweest rond de Google Cache zoekfunctie. Google zou volgens de klagers inbreuk maken op de copyrights van de gecachde site door deze op te slaan. Zo had Blakeswritings.com Google aangeklaagd.

Uiteindelijk werden de klagers in het ongelijk gesteld aangezien computers het recht hebben om gedurende een beperkte tijd een locale kopie van een pagina op te slaan. Dit zou zo ook gelden voor Google Cache.

De uitslag, ten voordele van Google, luidde op hoofdpunten als volgt:

  • Serving a webpage from the Google Cache does not constitute direct infringement, because it results from automated, non-volitional activity by Google servers (Field did not allege infringement on the basis of the making of the initial copy by the Googlebot);
  • Field's conduct (failure to set a "no archive" metatag; posting "allow all" robot.txt header) indicated that he impliedly licensed search engines to archive his web page;
  • The Google Cache is a fair use; and
  • The Google Cache qualifies for the DMCA's 512(b) caching "safe harbor" for online service providers.

Bron: EFF.org

De uitslag in deze rechtzaak was zeer belangrijk voor onder andere de zoekmachines, Archive.org, Google Image search, Google Book Search en het gebruik van RSS.

Gerelateerde woorden

Meer over Google Cache (externe links)

Thema & categorieën