La morale et le référencement

Pourquoi ce billet

Il y a quelques jours, j’ai croisé la route d’une très bonne opportunité. Une circonstance qui me semble être une veine pour un référenceur. Cette opportunité, c’était une porte grande ouverte à de bons résultats quasi assurés. Cette opportunité, elle relevait d’une méthode de réféncement noir. Je ne m’y suis pas jeté dessus, la faute à une question d’éthique, de morale : profiter de cette aubaine me dérangeait.

Suite à cet épisode, j’ai souhaité revenir sur cette question, et même l’étendre plus largement à la place de morale et de l’éthique au sein du référencement, le noir plus précisemment.

Ce billet, c’est une façon de disserter ouvertement, mais aussi de rassembler différents avis sur ce sujet qui me semble très intéressant.

Continue reading

Associer une photo à un résultat de recherche Google

J’ai essayé il y a peu  l’expérience, par curiosité, d’associer une de mes photos à mon blog dans l’affichage des résultats de Google. Voici la méthode à suivre pour arriver facilement à un résultat de ce type :

Tout d’abord, discutons des avantages que peuvent avoir une image présente sur le coté de votre blog dans les recherches.

Premièrement, c’est l’effet visuel, celui qui attire le regard. Au même titre qu’un référenceur rechercherait à viser les requêtes clés dans ses métas (title, description, url) afin de mettre en gras (entre autres) ces mots clés dans les SERP (pour l’anglais « search engine results page »), l’idée d’avoir avoir photo présente comme dans l’exemple est, selon moi un point fort pour consolider cet effet flash.

Ensuite, Google se dirige de plus en plus vers une gratification des sites transparents. Les sites dits propres, qui respectent ses consignes, se verront de plus en plus bénéficier d’un bon ranking. Afficher clairement à qui appartient un blog / site est pour Google un gage légitime de transparence et de sincérité. Nul doute qu’avec les démarches effectuées pour afficher une photo dans le résultat de recherche google, le placement d’un site/blog sera favorablement ré-évalué. Aussi, cette démarche de transparence est valable pour instaurer une confiance entre l’internaute et le site visé.

Les démarches

Pour obtenir un résultat associé à une photo, vous devez absolument (ou en tout cas au moment où j’écris ce billet) vous munir d’un compte google+. Google+, outil qui risque, selon moi, de devoir être utilisé bien plus souvent à l’avenir dans les démarches SEO. La firme américaine aurait tout intérêt à promouvoir l’activité sur son site dans les moteurs de recherche.

Dans votre profil, il existe un champ « également auteur de :« . C’est ici qu’existe la première entrée, primordiale, pour indiquer à Google un lien entre vous, et votre site/blog.

L’étape suivante consiste à faire le chemin inverse ! Comme pour valider le fait que c’est bien vous qui avez réaliser le site ajouté dans le champ « également auteur de :« , vous devez insérer sur votre site un lien vers votre page Google+.

Dans mon cas :

<a href="https://plus.google.com/115876301207724849311?rel=author">Google+</a>

Pensez à changer l’id du lien par le votre ! L’attribut rel=author en fin d’url de destination indique que vous êtes donc bien l’auteur et que vous souhaitez être identifié comme tel.

Une chose marrante, curieuse, meme si…

C’est un confrère de l’agence axe-net qui indique sur son très chouette blog que Google ne publie pas n’importe quoi comme photo ! Il indique dans un article sur le même sujet, mais en détaillant plus que moi, que Google arrive à détecter s’il s’agit bien d’un visage. En effet, google souhaite une photo de l’auteur, et rien d’autre !

Les résultats

Environ 3 jours après avoir effectué les requêtes, j’ai constaté que j’avais ma photo de publiée aux cotés des résultats liés à ce blog. La réponse de Google est donc très rapide ! Cependant, la photo ne s’affiche pas (encore?) sur tous les résultats sortant dans les résultats.

Et si…

Et si nous pouvions duper Google ? Si j’avais mis dans mon profil Google +, dans le champs « également auteur de :« , l’adresse d’un site hypothétique concurrent d’une part. Et d’autre part pris soin de poster sur sa home (via un message forum, ou un quelconque moyen d’avoir un backlink), un lien vers mon google+ avec le rel=author ? Aurait-il affiché quand même ma photo aux cotés des résultats de hypothétique concurrent ? Nous entrons ici dans le domaine du négativ SEO (même si c’est light, on en conviendra ;)), cependant, je me pose la question…

Et vous ? Ca marche ? En combien de temps ? Des effets notables ?

Indexation indésirable sur les moteurs de recherche

Lors du développement d’un projet, il est utile de prévoir une version développement, ou de pré-prod. Cette version permet d’une part d’avoir une version dite de « répétition générale », mais aussi de pouvoir faire une présentation des prochaines mises à jour à une personne tierce (comme un commanditaire par exemple). Par habitude, je mets cette version accessible sur l’adresse dev.mon-site.com avant de la rendre accessible sur l’adresse principale www.mon-site.com. Récemment, en utilisant comme d’habitude une version de dev, je me suis rendu compte que mon URL dev.mon-site.com était d’ores et déjà indéxée par Google.

Constat et analyses

Aujourd’hui, la plupart des internautes recherchent un site en tapant son URL dans le moteur de recherche google, et pas dans la barre d’adresse. C’est en observant un ami tentant de rejoindre la version de dev que j’ai remarqué justement, qu’en entrant l’expression/url mon-site.com sur Google, il lui était proposé ma version dev.mon-site.com. Ce n’est pas une catastrophe en soit, mais ça pourrait le devenir si certaines rectifications ne sont réalisées. Explications.

Tout d’abord, si le site à lancer vise à faire un ‘buzz’ ou un quelconque effet de lancement : permettre à certains internautes d’accéder à la version non-finale présente en dev ferait perdre une grande partie de l’effet d’annonce en dévoilant une partie du futur produit.

Deuxième gros désavantage : au point de vue référencement SEO. En effet, chaque référenceur sait que pour conserver un maximum de pertinence aux yeux des moteurs, un contenu (donc une page) doit être accessible par une et une seule adresse. 2 URLs pour un même contenu est donc pénalisant. Or, dans notre cas, il existe une page dev.mon-site.com/page-a et dans un futur proche (lors de la sortie officiel du site) une du type mon-site.com/page-a. Ces deux pages possèdent/posséderont exactement le même contenu, mais accessibles depuis 2 URL différentes.

La solution

Pour les débutants en SEO, la solution est simple : indiquer aux robots indexeurs de ne pas indexer la version de dev avec la connue balise méta suivante :

<meta name="robots" content="noindex,nofollow">

Le « noindex » indique aux robots d’une part de ne pas indexer les pages qui contiennent cette balise méta, et le nofollow de ne pas suivre les liens présents sur cette page.

Dans certains cas, il est suffisant d’indiquer seulement la requete « noindex » sur la page d’index, puisque tous les liens partent depuis cette page. En revanche, si des liens de cette page index pointent vers des sites externes, il peut y avoir des fuites. L’exemple simple serait qu’un webmaster remarque dans ses statistiques des visites en provenance de dev.mon-site.com/.

Mais… d’où ?

Google indexe les pages dans ses bases de données en naviguant sur l’Internet au fil des liens qu’il croise. Chaque fois qu’il croise une URL qu’il ne connait pas, il s’empresse de l’enregistrer et de faire sa tambouille habituelle.Dans le cas rencontré, il s’agit d’une version de dev, dont l’URL n’a été indiquée nulle-part, et encore moins mis à la disposition de l’Internet via des liens. Mais alors comment cette URL dev.mon-site.com a t-elle été rencontrée par les robots indexeurs ?

Suppositions

Une imprudence, un lien diffusé sur un réseau social ? peut être, mais peu probable. Une autre hypothèse, effrayante (mais pas pour autant si farfelue) : Google lirait nos échanges de mails entre développeurs et aurait croisé cette URL durant un envoi de messages ? Peut être, mais pas sur qu’il se servirait à foison. Sur la page accessible de mon-site.com est présent un splash screen, ou une page de présentation du futur service est dévoilée. Après vérification, aucun lien ne pointent vers dev.mon-site.com.

On m’a toujours dit : « si tu veux voir ce que google voit, ouvre ton site avec Lynx ». Après vérification, aucun lien ou relation entre dev.mon-site.com et mon-site.com était possible… sauf que : sur cette page de teasing était présent une image, image elle même hébergée sur dev.mon-site.com/image. Serait-ce par ce trou de souris que les robots auraient découvert l’url rendant à la version de dev ? Après tout, google indexe bien les images, bien qu’invisible aux yeux de Lynx…

Rectifications faites, j’aimerai désormais l’avis de mes collègues et pairs développeurs/référenceurs sur cette question, par où est-ce que mon url de dev a pu se faire connaître des robots google ?