Comment Google indexe un site ?

Comment Google indexe un site ?
Comment Google indexe un site ?
User Rating: 0 (0 votes)

Google est donc le moteur de recherche préféré des français (utilisé par plus de 70% des internautes français). Mais comment Google indexe un site et les milliards de pages présentes sur Internet. Une infographie produite par QuickSprout nous l’explique.

Qu’il y a t il dans l’index de Google ?

L’index de Google est la liste de toutes les pages que Google a consulté, lu et indexé. Lorsqu’un internaute effectue une recherche, Google sort et affiche les pages de ces données. Plus de 40 billions de pages internet sont actuellement indexées par Google.
En comparaison Bing possède dans son index 14 billions de pages.
Mais l’index de Google ne représente que 10% des pages créées sur le net, donc 90% des pages pésentes sur le net ne sont pas référencées et n’apparaîtront pas dans les résultats de Google.
Ce qui veut donc également dire qu’à l’heure actuelle, 450 billions de pages existent sur le web.

Comment Google indexe un site

Google utilise des programmes appelés « Spiders » qui indexe notre site.
Ces spiders ont les particularités suivantes :

  • Ils ont été créé avec l’idée de naviguer sur le web de la même manière que les internautes.
  • Les spiders avancent page par page, lien par lien
  • Ils essaient de trouver et d’indexer toutes les pages présentes sur le web

Ce « crawl » peut très bien effectué sur un même site plusieurs fois par jour comme une seule fois en 6 mois.

Mettre à jour ou changer le contenu de son site régulièrement induit des visites plus fréquentes des spiders de Google

Pour arriver à effectuer cet index, Google utilise 1 000 000 serveurs. En comparaison, Facebook a lui « seulement » 180 900 serveurs.

les 7 raisons les plus courantes qui font que Google ne puisse pas explorer vos pages

1 – Pas ou un mauvais fichier robots.txt

Le fichier robot.txt est un fichier informatique utilisé pour bloquer les chapitres de notre site que nous ne souhaitons pas être indexés par Google. Donc il est extrêmement important de bien configurer ce fichier.

2 – Un fichier .htaccess mal paramétré

Une des utilisations principales du ficher .htaccess au niveau du référencement est la gestion de redirection d’un vieux nom de domaine vers un nouveau.
Si ce fichier n’est pas optimisé correctement, nous perdrons la majorité de notre trafic naturel durant la période dédiée au transfert.

3 – Mauvaise écriture du titre, des balises méta, et des tags liés à l’auteur

La bonne écriture est :
Comment Google indexe un site

4 – Une mauvaise configuration des paramètres de l’URL

Nous pouvons configurer les paramètres d’URL dans les Outils Google Webmasters afin d’indiquer à Google quels liens dynamiques ne doivent pas être indexés.

5 – Un faible pagerank

Le nombre de page indexé par Google est proportionnel au pagerank.

6 – des problèmes de connectivité ou de DNS

Ce type de problème peuvent rendre nos serveurs inaccessibles par les « Spiders » de Google.

7 – Un domaine avec une mauvaise réputation

Des domaines utilisés comme ferme de linkspam ou autres raisons pouvant entraîner une pénalisation vont provoquer une désindexation par Google.

Comment aider Google à indexer plus de pages

– Prendre connaissance des erreurs mentionnés au niveau de Google Webmaster Tools et les corriger
– Bien faire attention avec des applications développés en Ajax
– Avoir un bon fichier robot.txt et s’assurer qu’il est bien opérationnel
– Ajouter un sitemap à son site

Vous souhaitez suivre une formation référencement.

infographie-Comment Google indexe un site


The following two tabs change content below.
j'ai débuté ma carrière professionnelle dans le monde de la documentation et c'est pour cette activité que je créa, en 2001, ma première newsletter. Je participe ensuite à la création et à la mise en place d'une solution d'e-mailing et de création de newsletters automatisées et prendrais rapidement la responsabilité du développement commercial et technique de ces solutions. J'ai accompagné au quotidien des clients aux profils divers (PME, grands groupes, sociétés cotées en bourse) dans la genèse, la mise en place et la gestion de leurs campagnes e-mails. Depuis 2013, je partage ses expériences et ses acquis en dispensant des programmes de formation, aussi bien en intra-entreprise qu'en centre de formation.

Derniers articles parEmmanuel Robin (voir tous)

j'ai débuté ma carrière professionnelle dans le monde de la documentation et c'est pour cette activité que je créa, en 2001, ma première newsletter. Je participe ensuite à la création et à la mise en place d'une solution d'e-mailing et de création de newsletters automatisées et prendrais rapidement la responsabilité du développement commercial et technique de ces solutions. J'ai accompagné au quotidien des clients aux profils divers (PME, grands groupes, sociétés cotées en bourse) dans la genèse, la mise en place et la gestion de leurs campagnes e-mails. Depuis 2013, je partage ses expériences et ses acquis en dispensant des programmes de formation, aussi bien en intra-entreprise qu'en centre de formation.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

− 6 = 3