English version
Trésor de Google

Le brevet Google du 31/12/03

Le 31 mars 2005, l'US Patent & Trademark Office (bureau des brevets américain) a rendu public un brevet déposé par les dirigeants de Google le 31 décembre 2003. Ce brevet vise à protéger quelques-unes des techniques et technologies utilisées par Google.
Accueil > brevet-google-31-12-03

Lire la version abrégée de cette page
Voir l'interprétation du texte
Voir l
a liste de tous les brevets Google en anglais

Ce brevet décrit quelques-unes des techniques qui sont, peuvent ou pourraient être utilisées par Google pour calculer le classement des pages présentées dans ses résultats de recherche. La totalité des techniques décrites dans ce brevet n'est pas nécessairement utilisée par Google. Ces informations ne doivent donc pas être considérées comme une description du fonctionnement de Google. Il ne s'agit que d'un brevet déposé par Google dans le but de protéger ses idées.

Cela dit, c'est la première fois qu'un document aussi important est accessible au public et son contenu est bigrement intéressant parce qu'il nous permet enfin d'avoir un aperçu large de la philosophie de Google.

L'original peut être consulté à : US Patent & Trademark Office

Voici une traduction libre et résumée de ce document en français. Cette "traduction" étant absolument non-officielle, on doit la considérer comme une interprétation du texte originale qui n'engage que la responsabilité de www.rankspirit.com

Dans un soucis de simplification, le texte d'origine n'a pas été traduit intégralement et certains points sont présentés dans un ordre différent de celui du texte original.

Age des documentsÂge des documents

- Un "âge" est attribué à chaque page du web découverte par Google. Google considère que la date à laquelle il a indexé une page pour la première fois représente la "date de naissance" de cette page.

- Un site récent a logiquement moins de liens pointant vers lui qu'un site ancien ayant eu le temps de se faire des "amis". Le PageRank d'un site doit donc logiquement être ajusté en fonction de son âge.

- Dans le même esprit, la vitesse à laquelle le nombre de liens pointant vers un site se développent peut être considérée comme un facteur aussi, voir plus, important que ce nombre de liens à un instant donné.

- l'âge moyen des résultats trouvés pour une requête donnée peut être considéré comme une référence. L'âge de chaque page trouvée sera individuellement comparée à l'âge moyen et le classement de cette page sera modifié en fonction de cette différence.

Dates de mise à jourMise à jour des documents

- la fréquence de mise à jour d'un document est un paramètre pouvant influencer son classement dans les résultats. Le fait que ces mises à jour concernent une part faible ou importante du document peut également être pris en compte.

- la variation de fréquence des mises à jour peut également être prise en compte. Un document qui est soudain mis à jour à de multiples reprises peut être classé différemment d'un document dont les mises à jour sont régulières.

- la dernière date à laquelle un document a été mise à jour peut également être prise en compte. Dans certains cas, le fait que le document n'ait pas été mise à jour récemment peut être considéré comme un facteur d'intérêt particulier. Dans d'autres cas, ce sera l'inverse.

Analyse des comportementsComportement des utilisateurs de Google

- le comportement des utilisateurs du moteur de recherche peut être prise en compte pour classer les résultats. Si les utilisateurs ont tendance à cliquer préférentiellement sur un résultat, ce résultat peut être reclassé à une meilleure position.

- Si, pendant une période donnée, les utilisateurs utilisent certains mots particuliers de façon répétitive dans leurs requêtes, Google peut établir une sélection des pages qui semblent particulièrement correspondre à cette nouvelle tendance (mode). Ces pages verront leurs positions favorisées pour les requêtes entrant dans le cadre sémantique de cette tendance.

- certaines requêtes qui sont toujours formulées de la même manière peuvent correspondre à des résultats qui évoluent. Par exemple, la liste des "champions de l'année" évoluera au fil du temps. Google tente d'identifier les requêtes de ce type et gère les résultats d'une façon particulière pour ce type de requête.

- En mesurant le temps qui s'écoule entre 2 clics successifs sur 2 résultats présentés à l'utilisateur, on peut se faire une idée du temps passé par l'utilisateur à consulter un site. Si ce temps moyen est plus important pour un site que pour un autre, on peut en conclure que ce site présente plus d'intérêt pour les utilisateurs et son classement dans les résultats peut être amélioré.

- Si ce temps à tendance à croître ou à décroître pour un site donné on peut en conclure que ce site perd ou gagne de l'intérêt pour les utilisateurs. Ce facteur peut influencer le classement de ce site.

RéférantsLiens pointant vers un document

- la fréquence de création et de disparition de liens vers un document ainsi que les dates auxquelles ces liens apparaissent et disparaissent et la durée pendant laquelle ils persistent sont des critères pris en compte par Google.

- la variation de cette fréquence est également un facteur déterminant. Un document générant une augmentation brutale de création de liens pourra voir son classement amélioré.

- l'âge des liens et la façon dont ils évoluent peuvent permettre de déterminer à quel type de site appartient le document.

- lorsqu'une page est mise à jour, les liens qu'elle contient et qui n'ont pas été supprimés peuvent être considérés comme particulièrement importants. On suppose en effet que c'est leur qualité qui leur a permis de rester dans la nouvelle version de la page.

- Si les liens qui pointent vers un document appartiennent à des pages récentes ou mises à jour récemment, on peut considérer que le document pointé est (toujours) d'actualité, même s'il n'a pas été mis à jour récemment.

- la variation du nombre de liens pointant vers une page peut également permettre de détecter les spams. Si le nombre de ces liens augmente d'une façon brutale et que ces liens proviennent en grande partie de sites sur lesquels il est possible d'enregistrer gratuitement un lien, la page pointée peut être pénalisée.

- la disparition massive de liens pointant vers un document peut être interprétée comme le fait que ce document est devenu obsolète.

HyperliensAncres (liens internes à un site)

- la variation des liens à l'intérieur d'un site peut être considéré comme un signal de mise à jour de ce site et/ou de réorientation de ses sujets.

- si cette variation est trop importante, elle peut signifier que le site a radicalement changé de contenu. Les classements des pages de ce site doivent alors être revus afin de ne pas continuer à proposer des résultats qui risquent de ne plus correspondre aux requêtes auxquelles ils étaient associés jusque là.

VisitesFréquentation du site

- Bien que le brevet ne décrive pas les techniques utilisées par Google pour mesurer la fréquentation d'un site, il est dit que cette fréquentation peut influer sur le classement de ce site.

- la variation saisonnière ou périodique de la fréquentation peut également amener Google à modifier de façon périodique le classement d'un site.

- D'autres caractéristiques périodiques peuvent être prises en compte :
- la mise en place et la mise à jour des publicités présentées sur le site,
- la qualité des annonceurs, leur popularité,
- le nombre de clics générés par ces publicités.

HébergeurHébergement et nom de domaine

- Le type d'hébergement utilisé par un site est un indicateur qui peut être utilisé pour son classement.

- La durée pour laquelle le nom de domaine a été déposé (par exemple 1 an, 2 ans ou 10 ans) est un indicateur qui peut être utilisé pour son classement.

- Les informations fournies au moment du dépôt du nom de domaine (DNS) sont des indicateurs qui peuvent être utilisés pour son classement. Une "liste noire" de certains particuliers ou de certaines compagnies habitué(e)s à déposer des noms pour des domaines considérés comme douteux est établie par Google.

- La qualité moyenne des domaines hébergés par un serveur peut servir à déterminer la qualité de ce serveur et vice-versa. Un nouvel hébergeur n'est pas considéré comme douteux a priori, mais il peut l'être si certains autres facteurs sont réunis.

Evolution des positionsHistorique des classements

- si, au fil du temps, une page donnée voit sa position varier de manière fréquente et importante dans les résultats de recherche, cette page peut éventuellement être considérée comme un spam et être pénalisée.

- Si une page donnée se retrouve toujours en tête des résultats pour des requêtes variées et sans rapport entre elles, cette page peut éventuellement être considérée comme un spam et être pénalisée.

- si un certain type de requête donne une liste de site qui ont tous un classement élevé et si cette liste à tendance à évoluer rapidement de mois en mois, on peut considérer que cette requête est de type "commercial". Pour ce type de requête, la sensibilité aux spams est plus importante que pour les autres.

- pour se protéger du spam, Google peut museler une trop forte croissance de pagerank. Un taux de croissance maximum peut être accepté pendant une période donnée, par exemple. En cas de très forte croissance, une enquête peut être menée à travers différent média pour déterminer si cette croissance correspond à un réel popularité ou si elle résulte de techniques de spam.

- si le document émane d'un site considéré comme "sûr" par Google (site officiel du gouvernement, par exemple), les mesures anti-spam peuvent être annulées.

Données personnellesDonnées de l'utilisateur

- Les données créées ou mises à jour par les utilisateurs peuvent être utilisées en tant qu'indicateurs pour classer des sites ou des pages. A travers les navigateurs ou les assistants de navigation (la GoogleBar, par exemple ?), Google peut examiner les favoris, le dossier "temp" et les cookies présents sur les postes des utilisateurs. Les sites figurants dans les favoris peuvent, par exemple, être considérés comme particulièrement intéressants et d'actualité.

Thème des sitesSujet(s) traité(s) par le document

- L'analyse du contenu d'un document permet de déterminer le(s) sujet(s) dont traite ce document. Les sujets des pages qui pointent vers ce document peuvent être déterminés de la même façon. La variation de ce ou ces sujets peut être suivie dans le temps et des conclusions peuvent en être tirées.

- Une variation brutale des sujets des pages pointant vers le document peut indiquer que le site comportant ce document a changé de propriétaire et que le pagerank de ce site doit être recalculé. Cette variation peut également révéler du spam. Les farm-links ont en effet une très grande variété de sujets traités et des liens de farm-links vers un document peuvent provoquer ce type de variation.

 

COMMENTAIRE IMPORTANT :

Certains des points figurant dans ce document peuvent faire frémir : Google espionnerait nos postes en analysant nos favoris et nos cookies ? Google aurait une "liste noire" d'hébergeurs ?

Encore une fois, il faut se rappeler qu'il s'agit d'un brevet : Google a déposé l'idée d'analyser les favoris et les cookies. Cela ne signifie pas qu'il met cette idée en application. Par ce commentaire, nous ne souhaitons pas défendre Google en quoi que ce soit, mais simplement préciser la portée de ce texte.

Lire la version abrégée de cette page
Voir l'interprétation du texte






A voir également :

Pour arriver en première page de google :

Demandez un devis à l’agence SEO.fr (15 ans d’expérience)