Google ne semble pas suivre les liens présents dans nos mails

Lors d’un précédent article sur l’indexation intempestive, je publiais quelques interogations : des contenus que je ne souhaitais pas indexer se trouvaient bien visibles dans les pages de résultats de Google. Je me demandais d’ Google avait pu détecter et crawler mes pages et mes contenus. Négligence ? Peut être (probablement même). Mais je souhaitais en avoir plus.

Suite à cet épisode, j’ai souhaité réaliser quelques tests moi même sur des façons de proposer à Google des contenus à indexer.

Cette expérience a pour but de mieux comprendre comment fonctionne l’indexation Google, à avoir l’avis de la communauté SEO quant à la préparation de ce test, mais aussi et surtout avoir des retours complémentaires sur le sujet.

Elaboration et mise en place.

Le test réalisé consiste à piéger Google pour savoir s’il suit les liens qui sont échangés par mails envoyés depuis des adresses gmail.

J’ai mis en ligne une page, totalement nouvelle, inconnue de Google jusqu’à lors, avec un contenu tapant sur un mot clé complètement improbable. Il était impossible que Google tombe par hasard sur cette page.

Dans le <head> de cette page, j’ai insisté sur le fait que je souhaitais indexer cette page en placant un beau <meta name= »robots » content= »index, follow » />.
- « Google, tu la vois ma demande d’indexation si tu passes par ici ? c’est tentant hein ? »

Sur ma page, j’ai installé un petit script PHP qui m’indique quand quelque chose se passe, via des logs de passages :

<?php
file_put_contents('logs.txt',str_repeat("-",20)."\n".var_export($_SERVER,true)."\n".var_export($_GET,true)."\n".var_export($_GET,true)."\n".var_export($_COOKIE,true)."\n".str_repeat("-",20)."\n",FILE_APPEND);
?>

Avec ça… je ne pense rien rater.

Enfin, avec un complice, nous nous sommes échangés des mails en y insérant la composante de mon nouveau mot clé, en y placant bien le lien vers ma page dans le corps de message.

Résultats de l’expérience

Quelques semaines plus tard, et après avoir regardé journalièrement les logs de passages. J’ai bien recencé un passage de mon complice dans mes logs, mais à part ça… rien à signaler. Aucun passage de Google (ou d’un autre robot) ne s’est manifesté. De plus, ma page n’est pas indexée, et mon mot clé est inconnu des serps.

Tout semble à croire que Google n’a pas interprété par son algo ce que nous avions échangé par mail lors de l’expérience : le lien ne semble pas, ne SEMBLE pas, avoir été suivi.

Réflexion sur l’expérience

Il est possible que j’ai oublié quelque chose dans ma préparation. Que mon installation ne soit pas correcte, et que mes logs n’aient pas fonctionné comme je le souhaitais… Aussi, les ingénieurs de chez Google ne sont pas des lapins de 3 semaines et ne sont peut être pas laissés berner…

Pour revenir sur mon précédent article, je ne sais toujours pas par où ma version de preprod s’est faite indexée ;)

Expérience à venir

Pas rassasié, d’autres expériences du même genre sont en cours : Google suit il les liens envoyés depuis le Gmail Messenger ? Aller sur une preprod depuis Google Chrome suffit-il à ce que l’algo souhaite y jeter un oeil, puis l’indexer ? Plus sioux encore : appeler une Google Font (avec <link href=’http://fonts.googleapis.com/css?family=Cantora+One’ rel=’stylesheet’ type=’text/css’>) depuis une version de préprod agit-il comme un appel du pied pour que Google vienne nous rendre visite ? A suivre donc !

N’hésitez pas à m’indiquer si vous avez réalisé ce genre d’expérience, où même si l’expérience conté ici comporte une erreur dans sa conception. Merci !

 

Mise à jour : Un article d’un confrère essaye d’en savoir plus sur ce que fait Google sur nos mails ça se passe ici

A propos de François Deléglise

Attiré par le multimédia depuis de nombreuses années, j'ai découvert le référencement lors d'un stage de fin d'études en IUT GEii (Lyon, 2008), je suis passionné par le SEO depuis cette date. Je suis diplômé en développement Web (licence MIW de Gap, 2010) et en gestion de projet (Master2 Ingémédia, Toulon, 2012).

Depuis la fin de mes études, je travaille avec l'équipe de Wanadev (Lyon) en tant que chef de projet, développeur symfony2 et référenceur.

3 thoughts on “Google ne semble pas suivre les liens présents dans nos mails

  1. nicolas says:

    Intéressant, mais à priori, sans réfléchir plus que ça, je vois deux premières limites à votre test :

    – On peut difficilement tirer une conclusion sur un seul test. Il faudrait multiplier l’expérience. Plus on a de tests, plus l’hypothèse que tu veux démontrer devient crédible.

    – Tu dis que ton complice est passé sur la page en question. Du coup, je dirais pas que le test est faussé mais si celui-ci était logué à son compte google, on peut supposer que google puisse exploiter son historique de navigation pour découvrir ton url test. Bref, cela aurait pu amener une indexation complètement indépendante du fait du lien présent dans le mail.

    Sinon, je ne pense pas que Google exploite le contenu des mails … c’est un point de vue dicté par le bon sens car je ne pense pas que cela soit légal d’exploiter le contenu d’une correspondance privée.

    ++

    Nico

    • Ah ! merci Nico pour ce retour, c’est typiquement le genre de commentaire que j’attends.

      Tu as raison, ce test ne prouve pas catégoriquement que Google ne suit pas les liens dans nos mails. En revanche, s’il avait été concluant, il aurait servi à prouver qu’il le fait. Nous aurons tenté ;) !

      Bien sur, ce test amène une réflexion et même plus : une attente de confirmation sur d’autres tests, de plus grande envergure, et plus précis aussi.

      Merci encore,
      François.

  2. J’ai fait un test similaire il y a quelques mois. Il ne portait que sur le passage de l’ancre d’un lien envoyé et reçu sur une adresse GMail. Comme toi j’ai constaté que Google ne tiens pas en compte du lien présent dans le mail !

    J’attends ta publication sur l’utilisation d’une Google Font :)

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre lang="" line="" escaped="" cssfile="">