• 40 heures
  • Facile

Ce cours est visible gratuitement en ligne.

Ce cours existe en livre papier.

Vous pouvez être accompagné et mentoré par un professeur particulier par visioconférence sur ce cours.

J'ai tout compris !

Mis à jour le 19/11/2018

Les pièges à éviter et les bonnes habitudes à prendre

Connectez-vous ou inscrivez-vous gratuitement pour bénéficier de toutes les fonctionnalités de ce cours !

Les techniques de référencement sont multiples et vous savez déjà que vous allez devoir batailler sur plusieurs fronts. Il y a cependant plusieurs choses qu'il ne faut surtout pas faire dans votre référencement. Nous allons tout de suite voir les mauvaises pratiques et plus largement les pièges à éviter, mais aussi les bonnes habitudes à prendre.

Nous parlerons aussi dans ce chapitre des sites web fonctionnant grâce à Flash, une technologie signée Adobe et largement différente de HTML. Les sites en Flash se référencent différemment des sites en HTML, il serait donc dommage de ne pas en parler.

Les mauvaises pratiques

Le « duplicate content »

Image utilisateur
D'un site à l'autre !

Google met un point d'honneur à valoriser les contenus qui présentent de l'intérêt sur le web. Mais je ne vous apprends rien en vous disant qu'il est fréquent de voir des sites web qui copient le contenu d'autres sites. Google considère ce comportement comme particulièrement malveillant et cherche à tout prix à combattre le plagiat. Ainsi, si le moteur de recherche repère un contenu plagié d'un site à l'autre, il n'hésite pas à pénaliser très lourdement le site qui a commis le plagiat. Cela implique que Google doit pouvoir :

  • identifier des contenus identiques sur le web ;

  • déterminer quel est le site original, et quel est le site qui plagie ;

  • pénaliser (lourdement) le site au contenu plagié.

Vous devez néanmoins savoir que Google a vraiment du mal à repérer les contenus plagiés. Il utilise un système assez basique qui se base sur les blocs dans les pages web. Si des blocs importants en termes de volume sont strictement identiques, alors Google peut y voir un contenu plagié et considérer ce comportement comme malveillant.

Le contenu dupliqué sur un même site

Cette idée est aussi valable sur votre propre site. Lorsque vos pages proposent des contenus identiques, Google peut considérer cela comme du doublon et vous pénaliser. Il faut néanmoins nuancer cette règle : certains systèmes de forums prêts à l'emploi proposent une version « desktop » ainsi qu'une version mobile indépendante. Certains webmasters ont peur d'utiliser ces forums, de peur que Google n'y voie un contenu dupliqué. Dans ce cas-là ne vous inquiétez pas, car Google ne considère pas ce comportement comme malveillant. Si l'on fait abstraction de ces cas spéciaux, veillez quand même à ne jamais proposer de contenus dupliqués sur votre site, c'est généralement très mauvais pour le référencement d'un site web.

Éviter d'être pénalisé : le rel="canonical"

Malgré tout, il se peut que vous n'ayez pas le choix et que votre site propose des pages aux contenus identiques. Il existe alors un moyen de ne pas encaisser de pénalité de la part de Google. Il suffit de dire au Googlebot que telle ou telle page est votre version favorite, et que vous aimeriez que Google considère celle-ci plutôt que l'autre.

Nous identifions donc :

  • une page A considérée comme page principale que Googlebot doit traiter en priorité ;

  • une page B au contenu identique à la page A, nous souhaitons que Googlebot ne se focalise pas dessus.

Pour indiquer au Googlebot de ne pas se focaliser sur la page B, il suffit d'ajouter une balise dans la section<head>de votre page web.

<!DOCTYPE html>
<!-- Code de la page B -->
<html>
<head>
    <meta charset="utf-8" />
    <link rel="canonical" href="a.html" />
    <title>Je suis la page B !</title>
</head>
</html>

À la ligne 6, nous utilisons la balise<link rel="canonical" />. Cette balise sert à indiquer à Googlebot qu'il s'agit d'une page mineure. Dans l'attribut href de cette balise, nous indiquons le lien de la page favorite que Googlebot devra considérer en priorité. Selon Matt Cutts, même si cette méthode est relativement propre, vous perdrez quand même un peu de Google Juice au passage. C'est pourquoi l'idéal est de ne jamais avoir de contenu dupliqué.

C'est tout ce que vous deviez savoir sur les duplicate content, et sinon, n'oubliez pas que rien n'est plus efficace qu'un bon<meta name="robots" content="noindex" />. :p

Votre contenu est votre force

Interdisez l'indexation des pages pauvres en contenu

Le duplicate content n'est pas la seule erreur à ne pas faire en SEO. Si Google aime énormément vos pages qui proposent un contenu pertinent, il déteste les pages qui ne présentent aucun contenu. Prenons l'exemple des pages de contact. Chaque site web en possède une en principe, il s'agit généralement d'un formulaire HTML tout simple pour envoyer un mail au webmaster.

C'est très utile pour vous, car cela vous permet d'avoir des retours de vos visiteurs, seulement Google a une véritable haine contre ces pages qui pour lui ne représentent absolument rien. Google aime votre contenu textuel, et pour lui, un formulaire HTML est tout sauf un contenu textuel. Il va donc falloir dès maintenant songer à interdire l'indexation de vos pages de contact comme vous savez le faire. Voici un exemple de pages dont vous avez tout intérêt à interdire l'indexation pour ne pas recevoir de pénalités :

  • les pages de contact ;

  • les profils des membres.

Référencer des sites en AJAX

AJAX et le référencement

AJAX, la problématique

Faire référencer des sites en AJAX a longtemps fait peur à beaucoup de webmasters. Pourquoi ? Pour la simple et bonne raison que la création d'applications en AJAX est permise par JavaScript, langage qui n'est pas interprété par le Googlebot. Ainsi, il y a encore peu de temps, si vous produisiez des sites dont le contenu était chargé et affiché en AJAX, vous preniez le risque de ne pas voir ce contenu indexé.

Les choses ont néanmoins changé depuis peu, et nous pouvons maintenant faire indexer des sites web en AJAX grâce à une certaine méthode dont on va parler tout de suite.

Faire référencer de l'AJAX

Un processus atypique

La méthode qui est expliquée ici est documentée sur la FAQ pour webmasters de Google. Vous noterez que cette méthode est relativement complexe, et qu'il est inutile de vous torturer l'esprit avec, si votre contenu n'est pas affiché en AJAX. Ceci étant dit, vous risquez de ne pas avoir le choix si votre site est construit en AJAX et que vous voulez un référencement solide. Alors attaquons ensemble !

Les ancres d'URL AJAX

La première étape est de procéder à quelques modifications de vos URL afin de prouver à Google que votre contenu chargé en AJAX est indexable. AJAX consiste en un rechargement de portions de page asynchrone. Cela signifie qu'une fois votre application chargée dans votre navigateur, l'URL ouverte ne changera pas, quoi que vous fassiez, à l'exception des ancres. Faites le test avec une application AJAX de Google par exemple ! Naviguez dans Gmail ou dans Google Documents, et vous verrez que le « corps » des URL restera le même, seuls les textes des ancres changeront.

Nous allons devoir effectuer une toute petite modification sur les ancres afin de prouver à Googlebot que votre site est explorable en AJAX. Les ancres se définissent dans l'URL grâce aux#, par exempleajax_app.html#ancre. Il va falloir ajouter un point d'exclamation «!» juste après le # qui précède le nom de votre ancre. Je vous assure qu'il n'y a pas de piège, nous sommes uniquement là pour montrer à Google que votre site en AJAX est indexable et rien d'autre.

Pour Google, cette URL AJAX est indexable...

... et celle-ci n'est pas indexable

exemple_app_ajax.html#!ancre

exemple_app_ajax.html#ancre

C'est là que le premier problème va se poser pour le robot, car une ancre ne signifie pas une nouvelle page. Dans un site orienté contenu c'est une vraie catastrophe.

Nouvelle notion : instantané HTML

Vous avez bien ajouté ce petit point d'exclamation à vos ancres ? C'est super, Google sait maintenant que votre site est indexable en AJAX. Imaginons que votre application AJAX soit un blog dont vous voulez travailler le référencement. Votre blog est un peu léger et il ne comporte que trois articles dont voici les titres :

  • Mes vacances au Japon ;

  • La naissance de mon petit frère ;

  • Mon nouvel ordinateur.

Ces pages sont donc définies par des ancres dans votre application HTML. Cela signifie que vos pages sont accessibles en AJAX à la même adresse... Une ancre, en HTML, n'est rien d'autre qu'un moyen d'accéder à un passage précis dans une page web, mais elles ne définissent en aucun cas de nouvelles pages.

URL

Titre d'article

show_article.html#mes-vacances-au-japon

Mes vacances au Japon.

show_article.html#la-naissance-de-mon-petit-frere

La naissance de mon petit frère.

show_article.html#mon-nouvel-ordinateur

Mon nouvel ordinateur.

Vous voyez tout de suite le problème. Il serait quand même particulièrement gênant que vos trois articles, qui parlent de sujets totalement différents, soient accessibles à la même adresse par les robots. Il va donc falloir trouver le moyen de donner aux robots un instantané HTML de vos pages web.

C'est très simple à comprendre : il faut envoyer à vos robots le code HTML de votre page, au moment précis où tel ou tel article est affiché. Google obtiendra ainsi le code HTML de votre article Mes vacances au Japon de manière dissociée et indépendante du code de votre article Mon nouvel ordinateur. Ainsi, le robot sera capable de comprendre qu'il s'agit bien de pages différentes qui constituent réellement deux entités différentes à référencer.

Flash et le référencement

Flash et le référencement

Image utilisateur
Qu'est-ce que Flash ?

Flash est une technologie créée par Adobe, une entreprise américaine éditant des logiciels assez chers mais de grande qualité. Ils sont très utilisés dans le monde professionnel. Parmi eux, on peut citer Photoshop, Dreamweaver ou encore AfterEffect. Ce sont tous des produits signés Adobe dont vous avez au moins entendu le nom ! Parmi ces logiciels, il en existe un autre baptisé « Adobe Flash ». Ce logiciel et le langage qu'il propose, l'ActionScript, permettent de créer une multitude de choses complexes. À l'aide de Flash, vous pouvez notamment créer :

  • des lecteurs audio ;

  • des lecteurs vidéo ;

  • des bannières animées ;

  • des applications complètes ;

  • des jeux vidéo.

Si Flash est suffisamment puissant pour créer toutes ces choses, il permet aussi de créer des sites web complets et fonctionnels orientés contenu.

Flash vs HTML

Si vous optez pour Flash (pourquoi pas ?) il va bien falloir vous débrouiller pour référencer vos sites, car Flash est vraiment différent de HTML. Le web se fait en HTML, c'est un standard que le W3C « impose », de même que le CSS pour la mise en forme. Ainsi, tout le monde est censé utiliser HTML et CSS pour faire des sites web. Google le sait très bien, et Googlebot a été créé de telle sorte qu'il soit parfaitement adapté à l'indexation des contenus HTML. Tout ça, vous le savez déjà.

Le fait est que l'on peut aussi utiliser Flash pour faire un site web. Cependant, avec Flash, il n'y a pas de code source, le contenu n'est pas balisé. Faites l'essai et naviguez sur cette application Flash complète. On voit bien que cela pourrait faire office de site web orienté contenu. C'est divisé en sections et il y a beaucoup de contenus textuels. Si vous essayez d'afficher le code source HTML de ces pages en appuyant sur Ctrl + U... rien ne s'affiche, car comme je vous l'ai dit Flash ne fonctionne pas comme ça ! La question que vous devez donc vous poser, c'est comment référencer un site qui n'est pas composé de HTML.

La collaboration Google/Yahoo!/Adobe

Google et Yahoo! ont compris qu'ils ne pouvaient pas se permettre de ne pas savoir indexer du contenu en Flash tant ils sont nombreux sur le web. Cela a pourtant été longtemps le cas, à tel point que Flash s'est constitué une très mauvaise réputation lorsqu'il s'agissait de parler référencement. On préférait tout simplement passer Flash sous silence et ne penser qu'en HTML et CSS. Aujourd'hui ce n'est plus tellement le cas, et officiellement, on arrive maintenant à référencer du contenu Flash pour peu que celui-ci soit bien conçu. En effet, Google, Yahoo! et Adobe collaborent depuis 2008 afin d'optimiser Flash pour le rendre « SEO-Friendly ». Google a d'ailleurs annoncé avoir implémenté Flash ; il serait maintenant capable de l'indexer au mieux. Même si les sites Flash ne proposent pas de contenu HTML, les robots d'indexation sont aujourd'hui capables d'identifier le contenu au sein même des animations Flash ! La présence d'un contenu HTML ne serait donc pas indispensable dans l'indexation.

Je suis pour ma part incapable de vous expliquer précisément comment construire des sites « SEO-Friendly » en Flash, car j'ai toujours utilisé les standards HTML et CSS. Néanmoins, le procédé reposerait sur l'emploi de certaines fonctions en ActionScript pour déterminer quel contenu correspond à quoi, à l'aide notamment d'URL et d'ancres. Au lieu de vous faire une bête traduction des informations officielles fournies par Adobe, je vous redirige directement vers leur FAQ qui semble complète à ce sujet, et surtout, vers ce tutoriel de référencement en Flash.

Faut-il utiliser Flash ?

Il faut quand même savoir que Flash reste plus lourd que HTML/CSS et JavaScript. Connaissez-vous les Google Doodle ? Il s'agit de logos animés que Google propose souvent sur son moteur de recherche à la place du logo habituel. Ces logos animés sont entièrement composés en JavaScript à l'aide du framework jQuery. Google doit répondre à plus d'un milliard de requêtes chaque jour. Dites-vous que ce n'est pas un hasard si la firme se refuse toujours à les proposer en Flash.

Après m'être documenté sur le sujet, mon sentiment est que malgré tous les efforts d'Adobe, de Google et de Yahoo!, j'ai du mal à croire que le Flash se référence aussi bien que le HTML. Néanmoins, je pense que, contrairement au passé, il ne faut pas tomber dans la bête diabolisation du Flash, car il semble lui aussi posséder plus d'un atout dans sa manche. Alors, pourquoi ne pas apprendre Flash ?

  • Interdisez l'indexation de vos pages faibles en contenu pour favoriser vos pages riches en contenu.

  • Méfiez-vous des duplicate content, ne plagiez pas les autres sites et ne proposez pas de contenu dupliqué sur le vôtre !

  • Attention à ne pas rendre votre site dépendant de JavaScript : Googlebot ne verra pas votre contenu si son affichage se fait grâce à JavaScript en AJAX.

  • Le Flash semble se référencer correctement de nos jours. Je vous encourage à lire la FAQ d'Adobe à ce sujet.

Exemple de certificat de réussite
Exemple de certificat de réussite