• 40 hours
  • Easy

Free online content available in this course.

Paperback available in this course

You can get support and mentoring from a private teacher via videoconference on this course.

Got it!

Last updated on 11/19/18

Communiquez avec Googlebot !

Log in or subscribe for free to enjoy all this course has to offer!

Googlebot ne dort jamais. Il travaille tous les jours à récupérer des informations sur votre site pour permettre son indexation. S'il est vrai que c'est un véritable acharné du travail, il est aussi vrai qu'il aime qu'on lui donne des indications sur ce qu'il doit faire sur votre site, par exemple lui dire quelle page indexer, et quelle page ne pas indexer. Ou encore quel lien suivre, et quel lien ne pas suivre... Vous n'aimeriez pas par exemple que vos pages d'administration soient visibles sur Google.

Pour communiquer avec Googlebot et lui donner ces infos, il va falloir passer par le contenu de la section <head> de votre page web. Il n'y aura pas 36 solutions, nous allons devoir passer par les balises <meta />. Oui ! Ces balises qui étaient totalement indispensables pour référencer son site dans les années 1990 sont toujours là !

Aidez Googlebot à générer le résultat de recherche

Il existe des tonnes d'éléments intéressants dans votre code source HTML. L'un d'eux est un peu à part, et doit être exploité par Google : c'est la balise <title>. Elle doit être totalement unique au sein de votre page web.

Google génère ses résultats à partir des pages web

<title> : une balise capitale

La balise <title> a une importance primordiale parce qu'elle va servir à Google à générer le résultat de votre site (voir la figure suivante).

La SERP de Google est mise en page grâce à la balise <title>
La SERP de Google est mise en page grâce à la balise <title>

Nous pouvons voir assez facilement que chacun des résultats sur cette page est présenté selon un même pattern. En effet, chaque fois on trouve un titre avec un lien qui est fait vers une page web. On aura également l'URL de cette page juste en dessous dans une police verte, et en troisième position, nous avons une courte description de la page en question. Je pense que je vous ai mis la puce à l'oreille sur l'utilité de cette balise <title>... le contenu de cette balise va être réutilisé par Google pour générer ses résultats, et en particulier la première ligne : le lien.

Ainsi, si cette balise n'est pas bien travaillée, non seulement Google ne placera pas bien la page dans ses résultats mais en plus, pour les quelques personnes qui la verront, elle ne sera pas attractive et personne ne cliquera dessus.

Le Site du Zéro pour exemple

Pour continuer à expliquer ce qu'est la balise <title>, nous allons prendre l'exemple de celle de la page d'accueil du Site du Zéro. Placez-vous donc sur la page d'accueil du Site du Zéro et utilisez Ctrl + U. Vous y verrez le <title>.

<!--Doctype et ouverture du <head> -->
<title>
       Le Site du Zéro, site communautaire de tutoriels gratuits pour débutants : programmation, création de sites web, Linux...
</title>
<!--fin du <head> puis <body>... -->

Le contenu de ce qui se trouve dans <title> est réutilisé par Google pour former le lien qui mènera vers votre page. Vous pouvez comparer le code source ci-dessus, avec le visuel de la page de résultats pour vous en rendre compte. Vous devez maintenant comprendre que la balise <title> est d'une importance vraiment capitale dans votre référencement. Il faudra travailler vraiment vos <title>.

Choisir un bon titre

Vous ne pouvez pas indiquer n'importe quoi comme <title> pour votre page web. Celui-ci doit être riche en mots-clés ; mots-clés que l'internaute tapera dans la barre de recherche de Google afin de trouver votre page web. Votre <title> doit être en adéquation avec votre article. N'essayez pas d'être originaux dans votre titre, tentez simplement de désigner votre article par une expression de quelques mots, c'est généralement très bien. Par ailleurs, tentez de ne pas dépasser les 60 caractères. Dans un <title> on est direct et précis.

Pour le moment, tentez d'imaginer ce qu'un utilisateur pourrait taper comme mots-clés dans la barre de recherche pour trouver votre page web, et essayez de construire votre <title> en conséquence. J'avoue que ce n'est pas très propre, mais pour le moment ça ira.

Les meta description et keywords ne sont pas encore morts !

Dans les années 1990, le moteur de recherche qui dominait les débats, Altavista, fondait son succès sur un algorithme d'indexation des pages qui se basait sur les balises <meta /> et leur contenu dans la zone <head> de chaque page web. Si Google a totalement bouleversé ce système, il s'appuie encore aujourd'hui sur certaines balises <meta /> pour obtenir le plus rapidement possible des informations sur notre site. Si Google a passé sous silence ces balises, il y en a encore deux qui sont très utilisées.

Deux balises <meta /> qui survivent aux années

Votre contenu, votre centre d'intérêt

Que l'on soit bien clair là-dessus : pour Google votre contenu est vraiment le point central de votre site. Ainsi, c'est sur ce plan-là que vous aurez le plus de points à gagner au niveau de votre référencement. Cependant, si Google ne se focalise presque plus du tout sur les balises <meta />, il en prend encore quelques-unes en compte. Et par "quelques-unes" j'entends vraiment deux ou trois balises, pas plus. :-°

À l'époque d'Altavista, on avait une vingtaine de balises <meta /> qui servaient à elles seules à bien référencer son site. À l'époque de Google, on n'en a plus que deux majeures, à savoir les balises meta keywords et meta description. Commençons par la balise <meta name="description" /> qui est la plus intéressante. :)

META description

Décrivez votre contenu !

La balise <meta name="description" /> a, elle aussi, son petit rôle à jouer dans l'indexation de votre page web. Vous l'aviez peut-être remarqué, le contenu de cette balise va également s'afficher dans les résultats de recherche sur Google, juste en dessous de l'URL du site web, en troisième position, comme vous pouvez le voir sur la figure suivante.

La balise meta description est utilisée dans le résultat de recherche sur Google
La balise meta description est utilisée dans le résultat de recherche sur Google

Cette balise est là pour que vous puissiez décrire plus facilement votre contenu au Googlebot afin que celui-ci indexe mieux votre page web. Comme d'habitude, il faut que cette description soit riche en mots-clés, tout en étant attractive pour le visiteur pour vous démarquer des autres pages. Cette description obéit également à quelques codes. S'il est généralement conseillé de ne pas dépasser les 60 caractères pour son <title>, pour la description, la limite est à 200 caractères. À vous d'être précis !

Comment je la place cette description, moi ?

Elle se place exactement comme la balise <title>, dans la balise <head>. Ouvrez simplement une balise <meta /> avec les attributs name="description" et content="votre description" comme ceci :

<meta name="description" content="C'est la description de ma page !" />

Vous pouvez par exemple placer cette ligne juste en dessous de votre balise <title>. Celle-ci peut vous faire gagner des points au niveau du référencement, et elle est également là pour jouer un rôle d'accroche pour l'internaute qui regardera les résultats de recherche Google.

META keywords

Les mots-clés de votre page !

C'est LA balise qui a été la plus grande perdante de ces dix dernières années. À l'époque d'Altavista, elle était aussi importante que votre contenu peut l'être aujourd'hui. Les gens qui s'occupaient du référencement de leur site se contentaient généralement de bourrer le contenu de cette balise de mots-clés, cela suffisait à s'assurer une bonne place dans les moteurs de recherche. Aujourd'hui, c'est une balise dont l'importance a été terriblement diminuée, à tel point qu'elle ne sert aujourd'hui pratiquement à... rien.

Ce n'est pas très juste de dire ça, mais il faut bien comprendre que Google ne se focalise pratiquement plus du tout dessus. L'intégrer à vos pages peut être une bonne chose si vous le souhaitez et c'est même recommandé. En revanche, cela n'influera quasiment pas sur votre référencement. Pour la placer, c'est exactement comme pour la balise meta description.

<meta name="keywords" content="mots-clés" />

À l'intérieur, vous avez simplement à indiquer des mots-clés, en les séparant par une virgule.
Le Site du Zéro utilise encore la balise meta keywords. Vous pouvez prendre exemple sur lui afin de construire la vôtre. Voici la balise meta keywords de la page d'accueil du Site du Zéro.

<meta name="keywords" content="Cours, tutoriel, didacticiel, informatique, programmation, c, c++, php, ..." />

Encore une fois, si vous souhaitez placer de bons keywords dans cette balise <meta />, il faudra attendre encore quelques chapitres.

Voilà comment vont s'articuler vos balises <meta /> ainsi que votre balise <title> afin de permettre au Googlebot d'analyser votre site un peu plus facilement, et de vous assurer quelques points supplémentaires pour votre site au niveau du référencement.

Question utilité ?

Ces balises ne servent pas ou peu
  • Meta description : la balise meta description est encore relativement intéressante puisque son contenu apparaît dans la page de résultats de Google. Vous devriez y renseigner quelques mots-clés et tenter d'avoir une belle accroche pour votre visiteur. Néanmoins, lorsqu'elle n'est pas utilisée, Google est capable d'identifier d'autres éléments de votre page ;

  • Meta keywords : l'époque Altavista est terminée, mes amis ! Cette balise ne sert à rien, mais il peut être quand même intéressant de la renseigner. À vous de voir... mais on ne vous tiendra jamais rigueur de la non-utilisation de cette balise.

Interdire l'indexation d'une page avec le meta robots !

Nous savons donc maintenant que nous pouvons utiliser certaines balises afin de décrire un peu notre contenu au Googlebot. Cependant, parfois vous aimeriez que Googlebot n'indexe carrément pas certaines pages de votre site... et là, c'est difficile étant donné que vous ne savez pas du tout comment vous y prendre pour lui dire cela.

Image utilisateur

Un nouveau meta : Robots

Gérer l'indexation d'une page

Le meta robots est un meta auquel Googlebot, ainsi qu'un très grand nombre de robots d'indexation (pour ne pas dire tous) vont se référer afin d'adopter un certain comportement vis-à-vis de votre site. Vous avez la possibilité de dire simplement aux robots, dont Googlebot, de ne rien indexer de votre page grâce à ce meta. C'est très simple, le meta robots se forme de la manière suivante, à l'intérieur de votre balise <head>.

<meta name="robots" content="Instruction1, Instruction2" />

Voilà par exemple le type d'instruction que l'on va pouvoir utiliser dans le meta robots.

<meta name="robots" content="index, follow" />

Index, follow signifie que l'on va pouvoir autoriser Google à indexer notre contenu ET à suivre les liens présents sur la page.

Ainsi, avec cette configuration, Googlebot va, dans un premier temps, récupérer les informations sur votre site dans le but de l'indexer et va, en plus de cela, suivre les liens <a href="page.html"></a> présents sur votre page. Il va ensuite vérifier dans cette nouvelle page s'il peut l'indexer ou non. Pour info, to follow signifie "suivre" dans la langue de Shakespeare. Nous, ce que l'on veut, ce n'est pas ça. On veut que le Googlebot n'indexe pas notre page, et ne suive pas les liens présents sur celle-ci. Pour cela, on va très simplement lui indiquer l'information noindex, nofollow.

<meta name="robots" content="noindex,nofollow" />

C'était simple, non ? En voyant cela, Googlebot va simplement se dire ceci :

Citation : Pensées d'un Googlebot...

"Ah ! J'ai un noindex dans la balise meta robots. Bon, j'indexe pas la page, mais au cas où il y aurait un lien vers une autre page ici, je vais quand même jeter un coup d’œil.

...

Ah voilà un lien ! Je vais voir ce que je trouve de l'autre côté... ah bah non ! Il y a aussi un nofollow à côté du noindex dans le meta robots... Bon bah, j'ai rien à faire ici moi du coup, a+ !"

C'est ce qu'il faut retenir.
Vous pouvez également faire d'autres combinaisons, par exemple mettre une noindex, follow. Dans ce cas, Googlebot n'indexera pas votre contenu, mais ira quand même visiter les pages qui sont "linkées", histoire de voir s'il y trouve des contenus à indexer. :)

Gérer le suivi des liens au cas par cas

Définir le suivi d'un lien directement dans la balise <a>

Admettons que dans votre page vous ayez plusieurs liens. Vous souhaitez que Googlebot en suive certains, mais pas d'autres. Pour cela, c'est simple, on a bien le follow/nofollow mais celui-ci se place dans le <head> et, quelle que soit la valeur que vous choisissez, il va s'appliquer à tous les liens présents sur la page. L'idéal serait donc d'arriver à placer un follow/nofollow sur le lien lui-même. Devinez quoi ? C'est possible.

Cela se fait très facilement grâce à l'attribut rel="" :

<a href="une-page.html" rel="follow" />Une page<a> <!-- Googlebot va suivre ce lien ! -->
<a href="autre-page.html" rel="nofollow" />Une autre page<a> <!-- Il ne suivra pas celui-ci !-->

C'est facile, non ? Admettons que vous ayez un lien qui mène à vos pages d'administration sur votre site. Vous souhaiteriez que ce lien ne soit pas suivi par Googlebot. Faites simplement :

<a href="admin.html" rel="nofollow">Admin</a>

De plus, dans admin.html, il faudra bien que vous pensiez à marquer la page en noindex (au moins) dans le meta robots.

Interdire l'indexation d'un site avec le robots.txt !

Vous savez interdire ou autoriser l'accès de certaines pages, mais à moins d'utiliser un système automatique pour afficher le même meta robots sur toutes vos pages vous allez avoir du mal à gérer ça pour plusieurs pages, pour un répertoire ou même tout votre site Je vous propose une solution à cela : le robots.txt.

Gérez les accès des robots avec robots.txt

Un fichier à créer sur votre site

Les robots, à leur arrivée dans votre site, vont regarder si un fichier appelé "robots.txt" est présent à la racine de votre site. Ce fichier va servir à fournir des informations sur votre site pour les robots dans le Googlebot. Le robots.txt est un fichier .txt tout bête que vous pouvez créer sur votre ordinateur très simplement à l'aide du bloc-note.

Image utilisateur

Voyez par exemple le robots.txt du Site du Zéro, ou encore celui de Google. Un robots.txt vous servira généralement à interdire ou à autoriser l'indexation de certaines pages de votre site à certains robots ou à tous.

Écrire son robots.txt

Généralement, on commence son robots.txt en indiquant le User-agent qui est visé. Le User-agent est un nom qui va vous permettre d'identifier un robot par rapport à un autre. Par exemple, voici le User-agent de Googlebot.

Citation : User-agent de Googlebot

Googlebot/2.1 (+http://www.google.com/bot.html)

Ainsi, pour commencer à écrire votre robots.txt, vous allez devoir renseigner dans un premier temps le User-agent.

User-agent : Googlebot/2.1 (+http://www.google.com/bot.html)

Toutes les instructions qui vont suivre vont concerner le Googlebot et pas les autres robots. On peut également décider de viser tous les robots avec le signe *.

User-agent : *

Là, ce sont tous les robots qui seront touchés. Ensuite, vous pouvez utiliser les instructions Allow : et Disallow :, en les faisant suivre du lien du fichier ou répertoire afin d'autoriser ou non son indexation.

User-agent : *
Allow : /index.php
Disallow : /admin

Dans ce robots.txt j'autorise tous les bots à indexer la page index.php, mais j'interdis aussi à tous les robots d'indexer le répertoire /admin. On va considérer dans cet exemple que /admin contient tout le système d'administration du site. Le conseil que je vous donne est d'utiliser toujours le * pour viser tous les robots. En effet, si vous ciblez seulement le Googlebot en lui interdisant d'indexer votre répertoire /admin, cette interdiction ne touchera pas, par exemple, les robots de Yahoo!. Faites bien attention à cela.

On peut de cette manière autoriser ou interdire facilement l'indexation de n'importe quel contenu sur son site. Si aucune instruction n'est définie dans le robots.txt pour une page appelée, par exemple test.html, le Googlebot va se référer à ce qui se trouve dans la balise meta robots. Et si cette balise n'existe pas, il l'indexera. Dites-vous toujours que si vous ne spécifiez rien, Google indexe par défaut.

Vous pourrez trouver une liste exhaustive des User-agents sur le site web très bien construit User-Agents.org. :)

Bonne pratique

Renseigner un robots.txt dans tous les cas

Les robots chercheront toujours à obtenir le fichier robots.txt qui se trouve à la racine de votre site web. Une bonne pratique consiste donc à toujours fournir ce fichier même si vous décidez de n'inclure aucune règle d'indexation particulière à l'intérieur. Vous devrez donc créer le fichier robots.txt et y placer le contenu suivant.

User-agent : *
Disallow :

Vous remarquez que rien n'est placé derrière la directive Disallow. En effet, on fait simplement le choix ici de ne rien interdire. Les robots vont ensuite gérer les pages web de votre site au cas par cas, selon ce que vous avez renseigné dans votre balise <meta name="robots" /> !

  • Utilisez la balise <meta /> robots pour interdire l'indexation de certains contenus.

  • La balise <title> et la balise <meta />description ne sont à négliger sous aucun prétexte.

  • La balise <meta /> keywords ne présente plus grand intérêt aujourd'hui.

  • Ces données doivent être chargées de mots-clés. Vous apprendrez à les construire correctement plus tard.

  • Le fichier robots.txt se veut être l'équivalent de la balise <meta /> robots, mais à l'échelle du site entier.

  • Le fichier robots.txt se place à la racine de votre site, et nulle part ailleurs.

Example of certificate of achievement
Example of certificate of achievement