Testez
maintenant vos connaissances en SEO, moteurs de recherche
et en référencement
Voici quelques topics de l'indexation vue par Google:
Globalement, on peut se représenter la recherche Web comme la consultation d'un livre gigantesque dont l'index très volumineux permet de connaître l'emplacement exact de chaque élément. Lorsque vous effectuez une recherche Google, nos programmes vérifient notre index afin de vous présenter les résultats de recherche les plus pertinents.
Les trois processus clés permettant de renvoyer des résultats sont les suivants :
* L'exploration : la technologie Google connaît-elle votre site ? Est-elle en mesure de le trouver ?
* L'indexation : la technologie Google peut-elle indexer votre site ?
* La présentation des résultats : le contenu de votre site est-il de bonne qualité et utile ? Correspond-il à la recherche de l'internaute ?
Exploration
L'exploration est un processus au cours duquel le robot Googlebot recherche des pages nouvelles et mises à jour à ajouter dans l'index Google.
Nous utilisons un nombre impressionnant d'ordinateurs pour extraire (ou explorer) des milliards de pages Web. Le programme de Google chargé d'effectuer cette exploration du Web est appelé Googlebot. Ce type de programme est également connu sous les noms de robot, bot ou spider. Googlebot se sert d'algorithmes pour déterminer les sites à explorer, la fréquence d'exploration et le nombre de pages à extraire de chaque site.
Au départ, le processus d'exploration de Google consiste à répertorier les URL de pages Web à partir des précédentes explorations et des données fournies par les webmasters dans des plans de site. Puis, au cours de ses visites, Googlebot détecte les liens figurant sur chaque page et les ajoute à la liste des pages à explorer. Les nouveaux sites, les modifications de sites existants et les liens rompus sont répertoriés et utilisés pour effectuer les mises à jour de l'index Google.
Google n'accepte aucun paiement pour explorer un site plus fréquemment et la branche de son activité consacrée à la recherche Web reste indépendante du service monétisé Google AdWords.
Indexation
Googlebot traite chacune des pages explorées afin de compiler un index conséquent de tous les termes rencontrés et de leur emplacement sur chaque page. Sont également traitées les informations incluses dans les balises de contenu et les attributs principaux, notamment les balises "title" et les attributs "ALT". Googlebot peut traiter de nombreux types de contenus, mais pas tous. Il lui est par exemple impossible d'analyser le contenu de fichiers Flash ou de pages dynamiques.
Présentation des résultats
Lorsqu'un utilisateur entre une requête, nos ordinateurs recherchent les pages correspondantes dans l'index et renvoient les résultats que nous estimons être les plus pertinents. Cette pertinence est calculée à partir de plus de 200 facteurs, l'un d'eux étant le classement PageRank des pages. Ce dernier évalue l'importance d'une page en fonction des liens renvoyant à ladite page. En d'autres termes, tous les liens figurant sur d'autres sites et pointant vers l'une de vos pages sont pris en compte pour établir le classement PageRank de votre site. Tous les liens n'ont pas la même valeur : Google s'efforce d'identifier les liens de spam et les autres pratiques qui nuisent à la qualité des résultats de recherche. Les meilleurs liens sont ceux obtenus grâce à la qualité de votre contenu.
Pour obtenir un classement favorable dans les résultats de recherche, il est important que votre site soit exploré et indexé correctement par Google. Nos conseils aux webmasters répertorient certaines des meilleures pratiques à appliquer pour éviter des erreurs courantes et améliorer le classement de votre site.