La formule initiale du PageRank
Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant SEO

  • Olivier Duffez sur LinkedIn
  • Olivier Duffez sur X (Twitter)
  • Chaine Youtube WebRankInfo

Tout savoir sur le PageRankcritère historique de l'algo de Google

Le PageRank est une méthode inventée par Google pour mesurer l'importance relative des pages du webque l'on appelle souvent la popularité. Elle est basée sur la topologie du webc'est-à-dire sur l'étude des liens entre les pages. Voici des explications très complètes et à jour.

Résumez ou partagez cette page :
Cet article traite d'un sujet ancien dans le référencement Googlemais toutes les informations sont justes et vérifiées régulièrement (dernier remaniement et mise à jour : octobre 2017).

Description de l’algorithme du PageRank

Le PageRank peut paraître mystérieux pour l’internaute qui découvre ce terme. Pourtantvous verrez rapidement que cette notion est depuis toujours au coeur de l’algorithme de Googleet donc du classement des pages.

Formule PageRank
La formule initiale du PageRank décrite dans l'article de Sergei Brin et Larry Pagecofondateurs de Google.

Origine

A l’originele PageRank est un critère mathématique permettant de mesurer la popularité d’une page sur le web. Plus il est élevéplus la page est censée être populaire (et donc intéressante pour l’internaute).

Depuis l'origine de Googlele PageRank (que l’on abrège en PR) est l’un des éléments pris en compte par l'algorithme de classement… mais ce n’est pas le seul !!! Il en existe plusieurs centaines...

Le PageRank est également utilisé par le moteur de recherche Google dans tout son processus. Ainsiun site ayant une ou plusieurs page au PageRank élevé aura beaucoup d’avantages (il sera indexé plus souventet donc ses mises à jour seront rapidement disponibles dans Google).

Je vous invite à parcourir l'ensemble de ce dossier afin de bien comprendre l’algorithme. Lisez la rubrique sur les liens si ce n’est pas déjà faitcar elle sert de base à la compréhension du PageRank. Enfinparticipez aux discussions dans le forum sur le PageRank et les liens

La formule du PageRank (formule d'origine)

L'idée principale est que si une page A fait un lien vers une page Balors c'est que la page A juge que la page B est suffisamment importante pour mériter d'être citée et d'être proposée aux visiteurs. Ce lien de A vers B augmente le PageRank de B.

Deux idées supplémentaires mais essentielles viennent la compléter :

  • l'augmentation de PageRank de la page B est d'autant plus importante que le PageRank de la page A est élevé. En d'autres termesil est bien plus efficace d'avoir un lien depuis la page d'accueil de Google que depuis une page du site de votre petit cousin (ou alors c'est un génie en puissance !).
  • l'augmentation de PageRank de la page B est d'autant plus importante que la page A fait peu de liens. En d'autres termessi la page A juge qu'il n'y a qu'une page qui mérite un lienalors il est normal que le PageRank de la page B augmente plus que dans le cas où de nombreuses pages obtiennent un lien.

Maintenant que vous connaissez les principes du PageRankpassons à sa formulation mathématique... Nous nous basons sur un article rédigé par les deux fondateurs de Google (1)même si depuis l'algorithme du PageRank a bien évolué. Cela étantc'est important de connaître la base.

Soient A1A2...An : n pages pointant vers une page B. Notons PR(Ak) le PageRank de la page AkN(Ak) le nombre de liens sortants présents sur la page AkN le nombre de pages identifiées sur le web et d un facteur compris entre 0 et 1fixé en général à 0,85.

Alors le PageRank de la page B se calcule à partir du PageRank de toutes les pages Ak de la manière suivante :

PR(B) = (1-d)/N + d x ( PR(A1) / N(A1) + ... + PR(An) / N(An) )

Comme vous pouvez vous en rendre comptecette formule est à la fois simple et compliquée. Simple parce qu'elle ne dépend que de quelques termescompliquée parce qu'elle récursive

"récursive" ? qu'est-ce que ça veut dire ?

Simplement que pour calculer le PageRank d'une pageil faut avoir calculé celui de toutes les pages pointant vers elle. Mais alors comment commencer ?

En fait c'est très simpleil suffit de commencer avec des valeurs arbitraires de PageRank (par exemple 1 pour toutes les pages). Le choix de cette valeur n'a pas d'influence sur le résultat final à condition que toutes les pages commencent avec la même valeur.

Une application de la formule permet de calculer un nouveau PageRank pour chaque pageplus proche de la réalité que la valeur par défaut que nous avons choisie au début.

Ensuite nous recommençons à calculer les PageRank de toutes les pages en appliquant de nouveau la formulemais en partant cette fois des valeurs que nous avons calculées précédemment. Après un certain nombre d'itérationsle système converge : les valeurs de PageRank de chaque page ne bougent plus entre deux itérations.

En pratique la convergence est obtenue au bout de plusieurs dizaines d'itérations (tout dépend du nombre de pages considérées).

La modélisation du surfeur aléatoire

Il existe une autre façon d’interpréter le PageRankplus "imagée".

C'était d’ailleurs peut-être la base de la formulation de l’algorithme !

Elle est basée sur la modélisation du surf aléatoire d’un internaute sur le web. Je m'explique...

Imaginez qu’un internaute se promène sur le web en parcourant des pagespassant de l’une à l’autre en cliquant au hasard sur un lien. Il se peut qu’il se retrouve bloqué dans un groupe de pages liées entre elles mais fermées sur le reste du web. Dans ce cas il saute aléatoirement sur une autre page du web. Ce brusque changement peut aussi provenir directement du promeneur qui s’est lassé des pages qu’il visitaitou qui n’a pas trouvé ce qu’il cherchait…

Le PageRank d’une page peut alors être vu comme la probabilité qu’à un instant donné ce surfeur soit précisément sur cette page.

Cette probabilité sera d’autant plus forte que de nombreuses autres pages le ramènent dessussurtout si ces pages sont elles aussi importantes : c’est le deuxième terme de la formule.

Le premier terme modélise la probabilité qu’il reste sur la même pagesans suivre de lien sortant. Le facteur d dans la formule (damping factor) peut donc être vu comme la probabilité que le surfeur saute sur une autre page. C’est aussi un facteur indiquant le pourcentage de PageRank « transmis » aux pages liées.

A retenir sur la formule initiale du PageRank

Le PageRank d’une page B ne dépend que de 3 facteurs :

  • le nombre de pages Ak faisant un lien vers B,
  • le PageRank de chaque page Ak,
  • le nombre de liens sortants de chaque page Ak

Il ne dépend donc pas des éléments suivants :

  • le trafic des sites faisant un lien vers B
  • le nombre de clics sur les liens vers B dans les pages Ak
  • le nombre de clics sur les liens vers B dans les pages de résultats sur Google.

Maintenant que vous connaissez cette formuleje poursuis avec une question qui intéresse beaucoup de monde...

Comment augmenter son PageRank ?

Pour augmenter le PageRank d’une de pageil faut se débrouiller pour qu'elle reçoive plus de liens qu'avant. Ces liens (backlinks) peuvent être internes (issus du même site) ou externes.

Idées pour obtenir des liens et augmenter le PR

Voici quelques conseils à ce sujet :

  • essayez d’obtenir un grand nombre de liens vers votre page
  • choisissez en priorité des pages ayant un bon PageRank. Attention à la distinction entre le PageRank d’un site et celui de ses pages : le PageRank d’un site est par abus de langage celui de sa page d’accueilmais le lien vers votre page sera peut-être situé sur une autre page ayant un très mauvais PageRank.
  • choisissez des pages ayant le moins de liens sortants possible (en théorie surtout si leur PageRank est faiblemais sans pouvoir le mesurer ce n'est pas évident)
  • vérifiez que la page qui fait le lien est bien indexée par Googlesinon son PageRank vaut zéro et cela ne vous apportera rien. En particulierelle ne doit pas contenir de directive indiquant aux robots de ne pas l’indexer (fichier robots.txt ou balise META robots)et elle ne doit pas être orpheline (sinon Google ne peut pas l’indexer). Le plus simple est de taper la commande avancée info:https://www.example.com/page avec l'URL complète de la page à tester
  • vous pouvez obtenir en général facilement des liens depuis les annuairesmais le problème est qu'ils sont rarement perçus par Google comme de qualité.
Attention ! Nous ne sommes plus à l'époque où il fallait le maximum de liens entrantsquelle que soit leur qualité. Aujourd'hui il faut absolument privilégier des liens cohérentsintéressants pour l'internautesitués au coeur du contenu éditorialsur des pages de même thématique.

De l’importance de vos liens internes

Avoir des liens d’autres sitesc’est bien mais c’est dur à contrôler. Par contre les liens entre vos pagesvous pouvez et devez y attacher de l’importance.

Ainsiil est crucial de bien organiser son propre site pour optimiser le PageRank de toutes vos pages. Vous avez bien compris en lisant la formule du PageRank que chaque page possède une réserve de «points» (son PageRank). A vous ensuite de décider à quelles autres pages elle en fait profiteren leur faisant un lien.

Prenons l’exemple de votre page d’accueil qui a réussi à avoir un bon PageRank grâce aux échanges de liens avec d’autres sites. Vos autres pages peuvent en bénéficier si vous faites un lien depuis la page d’accueil. Mais attentionles mêmes règles s’appliquent : si vous faites beaucoup de liensla part de PageRank transmise à chacune de vos autres pages sera plus faible.

Quitte à optimiser son propre siteil vaut mieux donc éviter de faire des liens sortants (vers d’autres sites) sur vos pages qui ont un bon PageRankcar ce sera autant de moins transmis à vos autres pages. Il est donc assez classique de faire un lien depuis votre page d’accueil vers une page spécifique qui comportera des liens sortants.

A l’inversevous pouvez également construire votre site de manière à améliorer le PageRank de certaines de vos pages (au détriment d’autres). Par exemple il est commun de chercher à avoir le meilleur PageRank possible pour votre page d’accueil. Faites-donc un lien vers celle-ci sur chacune des pages de votre siteen mettant par exemple votre logo en haut à gauche.

OKbon... mais comment aller plus loin pour l'augmentation du PageRank ?

Optimiser son PageRank par le maillage interne

Le "jus" de lien !

Pour bien comprendre ce qui suitil faut avoir en tête que le PageRank sera d’autant plus grand qu’on a de liens de bonne qualité. On en distingue deux sortes :

  • les liens externes (d’autres sites faisant des liens vers vos pages)
  • les liens internes (entre vos propres pages)

Concrètementl’ensemble des liens externes entrants vous apporte un « capital de PageRank« . Il s’agit d’une certaine quantité de cette matière très recherchée qu’est le PageRank…

On appelle ça aussi du "jus" ou de la popularité.

Optimiser le PageRank à l’intérieur de votre site ne signifie pas l’augmenter mais répartir votre "capital de PageRank" dans vos pages. Vous comprendrez peut-être mieux pourquoi il est capital d’obtenir des liens externesmême si c’est un facteur sur lequel vous pouvez difficilement agir (il faut convaincre d’autres éditeurs de sites de faire des liens).

Pour en savoir plus : lisez maillage internec'est quoi ?

Ceci étant ditpassons aux conseils ! Encore une fois ceux-ci vous paraîtront très naturelsmais parfois on oublie de les appliquer. Si on ne devait citer que les deux conseils les plus importantsce serait ceux-là :

  • bien choisir la structure des liens entre les pages,
  • bien choisir le format de chaque lien (texteimageetc.).

Choisir la structure des liens entre les pages

Pour le premier pointil faut évidemment vérifier qu’aucune page n’est orpheline. Ensuiteen supposant que la page la mieux pourvue en PageRank est votre page d’accueilil faut faire des liens de celle-ci vers chacune de vos pages de niveau 2 (sans doute les plus importantes après la page d’accueil). Répétez ce schéma sur chacun de vos niveaux de hiérarchie (si possiblene dépassez pas 3 voire 4 niveaux).

Plus une page est profondemoins elle est performante en référencement lisez mon étude détaillée

Vous pouvez également croiser les liens entre différentes parties du siteà condition qu’il y ait un intérêt pour le visiteur (il y en aura alors aussi pour les robots...). En effet en général dans ce cas les pages traiteront de notions semblables ou complémentairesavec les mêmes mots-clés. Je fais référence ici à la notion de silo thématiquec'est-à-dire un groupe de pages traitant du même sujet. C'est une des possibilités d'optimisation du maillage interne.

A propos de structure de liens interneslisez mon dossier sur le calcul du PageRank interne

Choisir le format de chaque lien

Pour le second pointrespectez scrupuleusement les consignes de base. Les mots servant à créer le lien doivent être significatifs. Il est inefficace de faire un lien (interne) comme celui-ci :

cliquez <a href="page2.htm">ici</a> pour la liste des voitures à vendre.

Faites plutôt dans ce cas un lien comme celui-ci :

Consultez <a href="page2.htm">notre liste de voitures à vendre</a>.

Tous les liens doivent utiliser la balise <a> du HTML plutôt que des commandes javascript qui ne sont parfois pas prises en compte par les moteurs de recherche.

Remarque : les mots utilisés dans le lien (anchor text) n'ont aucun impact sur le PageRank (formule d'origine)mais un impact fort sur le référencement naturel (optimisation de la longue traîne). J'ai ma méthode IATG pour optimiser les ancres de liens internes.

Comment mesurer le PageRank ?

Le PageRank calculé en interne chez Google et celui diffusé à l'extérieur

Depuis que Google existeson algorithme utilise le PageRankmême si désormais c'est sous une forme qui a largement évolué. Disons qu'il est fort probable que Google calcule encore de nos jour le PageRank de chaque page web. En tout cas de chaque page crawlée par Googlebot.

Peut-on connaître la valeur exacte du PageRank d'une page ? Non ! Il n'y a aucun moyen de le savoircar Google ne la communique pas.

Le PageRank de la barre d'outils

Pendant des annéesGoogle a décidé de fournir une version très simplifiée du PageRanksous la forme d'un nombre entier entre 0 et 10. Cette valeur était diffusée dans sa barre d'outils sous la forme d'une barre verte :

PageRank toolbar
Exemple de PageRank affiché dans une barre d'outils : ici dans Firefox


Les années passantGoogle a diminué la fréquence de mise à jour de ce que j'appelle le Toolbar PageRank. Puis en 2012ça devait être la fin des mises à jour. Pourtant en 2013 le PageRank fut une dernière fois mis à jour (mais on apprit que cette mise à jour avait été faite sans être prévueune sorte de "mise en prod collatérale" ?). En 2014on nous avait promis la mort du PageRank des barres d'outils.

Pendant toutes ces annéesun très grand nombre d'outils s'est mis à récupérer cette valeur. Même si ce n'était pas la vraie valeurs'était toujours ça de pris...

Mais en mars 2016Google a cessé définitivement de diffuser le "Toolbar PageRank".

Le PageRank de l'annuaire Google (basé sur DMOZ)

A l'époque reine du PageRank (2000 - 2005 environ)Google proposait un annuaire de sitesappelé parfois "répertoire". En faitil s'agissait d'une copie (autorisée) de DMOZ.

A côté de chaque site inscrit (généralement la page d'accueil)Google affichait une indication de PageRank.  On pouvait même trier les sites au sein d’une catégorie par PageRank décroissant (plutôt que par ordre alphabétique).

Aussi étonnant que cela puisse paraîtreles deux échelles de PageRank n'étaient pas les mêmes !

En effet dans le répertoire on ne trouvait que 7 valeurs possibles. Et en poussant l'analyse jusqu'au boutles curieux avaient constaté qu'il existait même un PageRank dans le répertoire supérieur au maximum possible. Devinez qui se l'était attribué ? Le Roi Google bien entendu...

Le schéma suivant résume les 2 échelles de PageRank (barre d'outils à gaucherépertoire Google à droite) :

Les échelles de PageRank

Attentionil n'y a aucun lien entre la colonne de gauche et celle de droite (par exempleil ne faut pas déduire de cette image qu'un PR9 Toolbar équivaut à un PR7 Directory).

Comme vous l'avez devinél'annuaire Google basé sur DMOZ a disparu depuis.

Si vous souhaitez en discuterrejoignez la discussion sur les 2 échelles de PageRank dans le forum.

Conclusion sur le PageRank

En 2002le PageRank restait un algorithme complexe et assez mal connusurtout que sa version modifiée était tenue secrète par leurs auteurspour des raisons évidentes de concurrence industrielle.

Malgré touttoute personne s'intéressant au SEO doit connaître les fondements de l'algorithme de Googleà savoir le PageRank.

Aujourd'huile PageRank n’est qu’un des aspects exploités par Google : avoir un bon PageRank ne suffit pas à être bien placé !

Le plus important désormaisc'est de créer du contenu qui satisfait vos visiteursc’est la réelle valeur ajoutée de votre site. Si vous décevez ceux qui viennent de Googlevotre référencement pourrait en pâtir...

Lisez également nos autres conseils pour optimiser les liensen particulier les liens textesou bien la façon de choisir son titre ou ses balises META.

Vous avez maintenant sûrement de nombreuses questions… Peut-être trouverez-vous la réponse dans la FAQ (Foire Aux Questions)sinon allez la poser directement sur le forum PageRank et netlinking !

(1) The Anatomy of a Large-Scale Hypertextual Web Search EngineSergey Brin et Lawrence PageStandford Universitywww-db.stanford.edu/~backrub/google.html

Résumez ou partagez cette page :

Cet article vous a-t-il plu ?

Note : 3.9 (9 votes)
Cliquez pour voter !

Si vous avez des questionsposez-les dans le forum WebRankInfo.

Si vous préférez du consultingj'en propose sur mon site WebRankExpert.

Laisser un commentaire Annuler la réponse

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème techniqueil ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avisvous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règlesil pourra être refusé. Si vous indiquez votre adresse emailvous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

Un Commentaire

Serge Courrier

Merci pour l'article.
Je vous rappelle l'existence d'un article de janvier 1998 où PageRank est défininotamment par Sergey Brin et Lawrence (Larry) Pageles deux fondateurs de Google).
"The PageRank Citation Ranking: Bringing Order to the Web"
http://ilpubs.stanford.edu/422/1/1999-66.pdf

Répondre