Ce phénomène est mis en avant ces temps-ci par le monde du webmarketing.

Pour résumé, on s'aperçoit que les principaux mots clés (dans le sens le mots clés les plus utilisés pour arriver sur un site) ne génèrent en réalité qu'une petite partie de la provenance par moteur et mots clés.

En effet, on constate généralement que les 20% des mots clés les plus générateurs d'audience représentent moins de 25% de l'audience totale en provenance des moteurs de recherche alors qu'on aurait pu en toute logique s'attendre à l'effet inverse (avoir une courbe exponentielle retournée) Et donc la question qui vient à se poser : doit-on vraiment optimiser (sous-entendu investir de l'énergie et donc de l'argent) le référencement sur ces termes ?

Je propose d'utiliser l'analyse d'audience pour mieux comprendre ce phénomène afin de savoir s'il convient d'agir dans un sens ou dans l'autre...

Je prends l'exemple de l'audience de ce blog même (mais cette étude peut se faire sur tout autre site, je l'ai d'ailleurs appliqué à d'autres sites pour comparer et les constats sont à peu près les mêmes) :

On constate 3 zones différentes sur la courbe :

  • la première partie avec une zone de forte progression (dérivé >2), ce sont les mots clés qui génèrent plus de 2 visites, on dira les « mots clés travaillés » (même s'ils ne le sont pas tous).
  • la seconde partie de la courbe avec une progression constante de 2 (y=2 x) : ce sont les termes qui génèrent une audience de 2 visites, je la qualifierais de « mots clés dérivés ».
  • la troisième partie de la courbe avec une progression constante de 1 (y=x) : ce sont les mots clés qui génèrent une audience de 1 visites, je la qualifierais de «traîne».

Sur des sites de plus grosse audience, on voit également des parties distinctes pour 3 et 4 visites par mots clés (soit y=3x et y=4x). Pour généraliser, on constate sur la majeure partie des sites Internet qu'au moins 50% de l'audience est générée par la longue traîne.

Les mots clés travaillés sont les termes directement optimisés par le référencement naturel et force est de constater que l'audience apportée par ces termes ne représente qu'une partie (environ 25%) de l'audience totale. La seconde partie de la courbe correspond aux termes dérivés qui la plupart du temps sont des termes liés aux mots clés travaillés, soit ils comportent un terme supplémentaire, soit le pluriel ou des variantes relativement proche. On voit dans l'exemple qu'il représente environ 10 à 15 % de l'audience en visite. Le plus surprenant étant sans aucun doute la dernière partie qui ne correspond qu'à des clés ne générant qu'une seule visite et pourtant, malgré cela, elle constitue 65% de notre audience. Ce qu'il faut bien comprendre c'est qu'avec un contenu important, effectivement les pages vont ressortir sur des recherches auquel on n'aurait jamais pensé comme « idees interessantes » ou « concept car twingo » et autre... mais comme la réalité veut qu'on soit au moins sur du y = x, l'effet nombre de clés possibles (permutation de 2, 3, 4 termes ou plus de termes d'une page) sur lesquelles on peut ressortir joue pleinement son effet de masse par rapport au nombre de recherche sur n termes optimisés (n fini et généralement faible, en tout cas largement plus faible que le nombre de permutations de termes d'une page). Néanmoins, environ 30 à 50% des termes de la longue traîne reprennent des termes travaillés ou dérivés.

Pour conclure, la majeur partie de l'audience arrive sur le site avec des termes recherchés qu'on n'avait pas imaginé (qui n'était pas proprement travaillé en terme de référencement). Néanmoins, le travail sur une liste de termes retenus pour décrire l'activité représentée par le site permet de canaliser la terminologie globale même si une part importante d'internaute arrive sur un site par des termes qui semblent "inimaginable". En revanche, l'effet longue traîne sera d'autant plus important que le contenu du site sera important, riche et varié.