Rechercher et naviguer dans le cache de Google (pages et sites)

Pour le meilleur ou pour le pire, le Web est constamment enregistré et archivé (par Google et d’autres). Qu’on aime ou qu’on n’aime pas cette pratique (droit à l’oubli…), il faut reconnaître que, parfois, elle s’avère particulièrement utile. Surtout, par exemple, lorsqu’on tente de repêcher une information à laquelle on ne peut normalement plus accéder… On embarque alors joyeusement dans le cache d’Internet, et on part à la recherche de notre précieuse donnée, sauvegardée quelque part dans les prodigieuses banques de mémoire des Géants du Net.

Grrrr ! Mais où a bien pu passer cette page ? Je suis pourtant sûr qu'elle était encore là hier...

Sommaire

  1. De l’utilité du cache
  2. Google, grand archiviste du Web
    1. Mais où est (encore) passé mon « En cache » Google ?
    2. L’accès au Cache de Google d’une page Web en une ligne de commande
  3. Les archives Google oui, mais pas que : Web Cache View Plus
  4. En route pour les archives de l’Internet
    1. Google Cache Link Protector (pour Chrome)
    2. Google Cache Browser (pour Firefox)

De l’utilité du cache [Sommaire]

Question légitime s’il en est : À quoi cela peut-il bien servir de voir la version en cache d’un site ou d’une page Web ? Tout simplement parce que vous savez qu’une certaine information, dont vous avez besoin aujourd’hui, maintenant, était disponible il y a un certains temps à une adresse Web précise, que vous revenez à cet endroit précis la récupérer et… qu’elle n’y est plus ! Pour pouvoir remettre le main dessus, une seule solution s’offre alors à vous : arpenter les archives du Web.

Qu’est-ce qui peut rendre une page Web indisponible, un site inaccessible à la consultation ?

  • une panne mécanique du serveur sur lequel est stocké le site, un problème électrique, une indisponibilité temporaire pour cause de mise à jour, le hack ou la destruction du site
  • l’abandon du site par son webmaster, cela arrive souvent avec les sites de particuliers
  • la modification du contenu afin de corriger une étourderie, de masquer une boulette, de mettre à jour une donnée, d’apporter une précision
  • la suppression de l’information, suite par exemple à la demande pressante des avocats d’une personnalité ou d’une compagnie, suite à la sommation ou à l’intervention directe d’un gouvernement liberticide
  • la restriction d’accès, une information auparavant publique soumise dorénavant à une connexion avec identification (demande de login et de mot de passe)

La conservation d’une version cache d’une page Web, voire d’un site dans son ensemble, n’est jamais éternelle. Mais, tant qu’elle reste effective, l’existence des ces versions permet de contourner la censure, de remettre au vu et au su de tous une information que certains voudraient voir disparaître. Elle permet même de contourner, parfois, des protections mineures, comme de consulter les pages d’un forum normalement accessibles qu’à des visiteurs identifiés…

Les paroles s’envolent, les écrits restent dit l’adage. Internet n’échappe pas à la règle, profitez-en !

Lorsque vous utilisez un lien « En cache », vous n’allez plus être dirigé vers la page actuellement en ligne du site, vers sa dernière version, mais vers une copie fonctionnelle (parfois abrégée, allégée) que Google a enregistré lors de sa dernière sauvegarde dudit site (oui, cela peut paraître dingue mais Google enregistre régulièrement quasiment tout le Web).

Vous y retrouverez toutes les informations principales de la page d’origine, avec le plus souvent les pubs en moins mais toujours les images et les vidéos, et parfois quelques défauts dans l’affichage, la mise en page. Et vous aurez surtout à nouveau accès à la plupart des données que contenait cette page, et c’est tout ce qui importe.

Google, grand archiviste du Web [Sommaire]

Google n’oublie rien d’Internet. Google est probablement le plus grand archiviste du Web. Pour que nous puissons profiter de ce travail colossal, il met à notre disposition différents outils et commandes nous permettant de consulter et de naviguer à travers ses archives.

Mais où est (encore) passé mon « En cache » Google ? [Sommaire]

Non, rassurez-vous, l’accès par simple clic au cache d’une page Internet n’a pas disparu des résultats de recherche de Google Search. Si vous ne le distinguez plus c’est juste que, fin avril 2013, Google en a encore changé la présentation.

Après le toujours visible, bleu, bien large et cliquable « En cache » :

Un résultat de recherche de Google à l'époque où les termes En cache étaient présents

Après le masqué par défaut, gris et étroit « double chevron droit » (guillemets vers la droite) déclenché au survol d’un résultat :

Un résultat de recherche de Google à l'époque où les termes En cache se dévoilaient au survol des doubles chevrons droits

Voici venir la toute petite flèche cliquable verte :

Développer le menu déroulant d'accès au cache de Google en cliquant sur la patite flèche verte

Google voudrait nous pousser à oublier l’existence de ces fonctionnalités qu’il ne s’y prendrait pas autrement…

Pour accéder à la version en cache d’une page, il faut donc maintenant cliquer, dans la zone de résultats qui nous intéresse, sur la petite flèche verte pointant vers le bas. Apparaît alors un menu déroulant nous proposant, si disponibles :

  • de voir la page ciblée dans sa version cache (cliquer sur « En cache »)
  • d’accéder à des contenus similaires à la page ciblée (cliquer sur « Pages similaires »)
  • de partager la page ciblée sur notre profil Google+ (cliquer sur « Partager »)

L’accès au Cache de Google d’une page Web en une ligne de commande [Sommaire]

La commande fonctionne entre autres avec Firefox, Chrome, Opera, Internet Explorer… Si vous souhaitez accéder à une page dans sa version cache sans avoir à passer par une requête sur le moteur de recherche de Google (Google Search), la syntaxe de la commande à saisir dans la barre d’adresse de votre navigateur est plutôt simple :

webcache.googleusercontent.com/search?q=cache:adresse-de-la-page-cible

En d’autres termes, vous n’avez qu’à placer (par un rapide copier-coller) webcache.googleusercontent.com/search?q=cache: devant l’adresse d’une page pour pouvoir accéder à sa version en cache (adresse-de-la-page-cible). Un exemple sera peut-être plus parlant :

Page en ligne, dernière version :
ai13.fr/classement-de-popularite-des-navigateurs-internet-janvier-fevrier-2013/
Page en cache, version précédente archivée :
webcache.googleusercontent.com/search?q=cache:ai13.fr/classement-de-popularite-des-navigateurs-internet-janvier-fevrier-2013/

Remarque : sous Chrome exclusivement, la commande est même aujourd’hui fortement allégée, et un simple « cache: » devant l’adresse de la page suffit.

cache:ai13.fr/classement-de-popularite-des-navigateurs-internet-janvier-fevrier-2013/

Ces liens mis en exemple sont tout à fait fonctionnels, n’hésitez pas à les copier/coller dans votre barre d’adresse pour voir les résultats.

Les archives Google oui, mais pas que : Web Cache View Plus [Sommaire]

Bien qu’elles soient, à mon avis, les plus importantes au monde, les archives de Google ne sont pas les seules. D’autres groupes tentent de conserver la mémoire du Web, selon les ressources dont ils disposent, selon les objectifs qu’ils se fixent. Il y a par exemple l’Internet Archive et sa Wayback Machine spécialisée dans l’archivage de films, de concerts, d’enregistrements audios et de textes d’auteurs.

Web Cache View Plus est une extension pour Firefox, disponible sous Windows, Linux et Mac. Une fois installée, elle s’utilise à partir du clic droit de la souris. Sur le fond d’une page Web déjà ouverte ou sur un lien à ouvrir > Web Cache View et trois nouveaux onglets vont alors s’ouvrir.

Le premier contiendra l’archive (le cache) version Internet Archive, le second vous fera accéder à la page normale mais au travers du réseau de distribution de contenu libre Coral (pratique pour contourner des restrictions par IP, le troisième vous délivrera la version Web Analytics (Google Cache) de la page Web sans mise en page aucune – et dans les trois cas bien évidemment cela se fera seulement si elles sont présentent en cache, sinon vous aurez droit à une célèbre « 404 page not found ».

Installer Web Cache View Plus pour Firefox sous Windows, Linux et Mac.

En route pour les archives de l’Internet [Sommaire]

Reste un dernier problème : quand vous cliquez (clic gauche) sur un lien depuis la version cache d’une page, votre navigateur quitte les archives et vous dirige invariablement vers la version en ligne de la nouvelle page. Cela peut ne pas être gênant, par exemple lorsque c’est juste le cache de la page sur laquelle vous étiez qui vous intéressait. Mais si c’est tout un site qui n’est plus aujourd’hui accessible, à chaque clic ce sera directement une « Erreur 404 » (cette page n’existe plus), et vous devrez à chaque fois ré-entrer le bout de code vous ramenant vers les archives. Vite fastidieux.

Pas de panique. Comme on peut toujours s’y attendre avec Internet, des développeurs ont trouvé diverses parades à ce petit inconvénient de navigation, et ont mis leurs modules à disposition de tout le monde.

La solution réservée exclusivement aux utilisateurs des navigateurs Google (Chrome et Chromium), Google Cache Link Protector est certifiée par Google et permet de ne naviguer que parmi les pages d’archives. En effet, dès l’instant où vous entrez sur une page web à partir d’un lien « En cache », elle va se charger elle-même de remplacer tous les liens sur lesquels vous allez cliquer sur cette page par les liens correspondants dans les archives Google. Le phénomène est entièrement transparent côté utilisateur, l’extension se charge de tout sans jamais rien vous demander.

Télécharger et installer Chrome, Télécharger et installer Chromium, Installer Google Cache Link Protector.

Google Cache Browser (pour Firefox) [Sommaire]

La solution orientée utilisateurs de Firefox. C’est un userscript, c’est-à-dire qu’il nécessite l’installation préalable de Greasemonkey et son activation pour pouvoir fonctionner. Pour le reste, c’est du pareil au même que la solution Google maison, à savoir remplacement transparent côté utilisateur de toutes les pages visitées par leur version en cache, si celle-ci existe. Lorsque ce n’est pas le cas et qu’un lien vous retourne un « 404 page not found », petit plus sympathique : il vous ajoute un lien direct pour retourner sur vos pas.

Télécharger et installer Firefox, Ajouter Greasemonkey à Firefox, l’extension aux plus de 2 millions d’utilisateurs, Installer Google Cache Browser.

Maxime Mullet • l’Arpenteur de l’Infosphère

22 réponses à “Rechercher et naviguer dans le cache de Google (pages et sites)

  1. Liana

    Bonjour,
    Merci beaucoup pour ces explications qui me rendent vraiment service! En effet, je suis confrontée à un problème suite à une location de vacances que j’ai faite sur un site: le loueur a changé la description du logement pendant mon séjour pour que je ne puisse pas faire de réclamation. J’ai pu avoir la preuve que l’annonce avait été modifiée au moins sur un point. Par contre je n’ai pas réussi à remonter assez loin pour vérifier les autres modifications : la page en cache datait du 4 avril et j’aurais besoin de la page initiale datant de fin mars. Est-il possible d’obtenir une page en cache en fonction de la date à laquelle elle a été consultée? Merci encore pour votre aide !

    1. Maxime Mullet Auteur de l’article

      Tant que les pages sont en cache quelque part, avec les images, tous les moyens évoqués dans l’article ci-dessus. Une fois qu’elles auront disparu des caches… c’est de hack qu’on parlera, plus la même chose.

  2. JB Allemand

    Bonjour !

    Le cache de Google correspond apparemment au dernier passage des robots sur la page. Est-il possible de remonter un peu avant, pour retrouver d’anciennes versions du cache correspondant à d’anciens passages des robots ?

    Merci pour votre réponse !

    1. ingrid

      Pour tenter de retrouver d’anciennes versions du cache il faut aller sur l’Internet Archive, cité et en lien dans l’article.

  3. Chevalier M

    Il y a quelques temps en arrière, quand on utilisait En Cache, les mots tapés dans la recherche étaient surlignés en couleur, c’était très pratique pour aller directement à ce que l’on voulait !
    Pourquoi ne peut on plus avoir cet outil ?

    1. Maxime Mullet Auteur de l’article

      C’est une fonctionnalité qui existe toujours, sous différentes formes, et qui est aujourd’hui étendue au-delà du cache.

      Firefox, Opera, Chrome, Internet Explorer, sur la page où on cherche le mot :

      1. Ouvrir la recherche (simplement Ctrl + F, ou Édition > Rechercher sous FFx, Page > Rechercher dans la page sous Opera…)
      2. Taper le mot (ou la suite de mots) recherché(s) dans la barre qui s’est ouverte
      3. Sélectionner « Tout surligner » dans cette barre pour Firefox, chez les autres c’est automatique

      Si vous recherchez plusieurs mots, qui peuvent se suivre ou pas, dans un ordre ou un autre, là il faut un module en plus. Pour Firefox vous avez « SearchWP » (Module SearchWP).

  4. Woolyss

    Merci. Article très intéressant ! Cependant, il faut noter que toutes les pages d’un site ne sont pas forcément mises en cache. Le webmaster peut ne pas autoriser la mise en cache.

    1. Maxime Mullet Auteur de l’article

      Merci ! C’est tout à fait exact, comme on peut empêcher l’indexation d’un site pour pas qu’il n’apparaisse dans les résultats de recherche, on peut bloquer sa mise en cache :

      meta http-equiv="googlebot" content="noarchive"
      meta name="robots" content="noarchive"

      La première ciblera Google seulement, la seconde en théorie devrait cibler tous les archivistes.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *