Aller au contenu principal
Technique7 juin 20265 min

La limite des 2 Mo de Googlebot : ce que ça change pour le SEO

En Bref : L'essentiel à retenir

  • Depuis mars 2026, Googlebot ne récupère que les premiers 2 Mo du HTML d'une page pour l'indexation Search (15 Mo pour le crawl général, 64 Mo pour un PDF).
  • Le code au-delà de 2 Mo n'est ni rendu ni indexé, sans aucune erreur dans la Search Console : la page renvoie un code 200.
  • Les architectures modernes (CSS inline, JSON d'hydratation, SVG en Base64, JavaScript non différé) dépassent ce seuil bien plus souvent qu'on ne le croit.
  • L'amélioration progressive et le HTML sémantique, au cœur de l'accessibilité, produisent une page légère qui immunise contre la troncature.
SEOPerformanceHTMLGoogle

En mars 2026, Google a publié sur son blog officiel une clarification technique qui a surpris beaucoup d'équipes : pour indexer une page, Googlebot ne lit que ses premiers 2 Mo de HTML. Tout ce qui dépasse cette frontière est abandonné, sans le moindre avertissement.

Le plus dangereux, c'est le silence. La page renvoie un code 200, votre navigateur charge tout normalement, mais l'index de Google n'a qu'une version tronquée. Voyons ce que cette règle change, pourquoi tant de pages sont concernées, et comment une démarche d'accessibilité protège votre référencement.

Qu'est-ce que la limite de 2 Mo ?

Dans son article « Inside Googlebot », Google a officialisé une mécanique de récupération à plusieurs seuils. Pour l'indexation Search, le robot ne récupère que les 2 premiers mégaoctets du code HTML d'une URL. Une limite plus large de 15 Mo s'applique au crawl général des fichiers, et les PDF bénéficient de 64 Mo.

Concrètement, Googlebot compte chaque octet transféré dès la première ligne de la réponse, en-têtes HTTP compris. Dès que le compteur atteint 2 Mo, il coupe la connexion. Le reste du document n'est jamais téléchargé, jamais rendu par le moteur de rendu, jamais transmis à l'index.

[!IMPORTANT] C'est le HTML non compressé qui est mesuré, et la troncature ne déclenche aucune erreur dans la Search Console. Une page peut être à moitié indexée sans que rien ne le signale.

Pourquoi tant de pages dépassent ce seuil

Un document HTML bien conçu pèse rarement plus de quelques dizaines de kilooctets. Pourtant, beaucoup de pages modernes franchissent allègrement les 2 Mo, pour des raisons devenues courantes :

  • CSS injecté en ligne par des constructeurs de pages, parfois des centaines de kilooctets dans le <head>.
  • État d'hydratation JSON des applications React, Vue ou Angular, sérialisé directement dans le HTML.
  • Images et icônes SVG encodées en Base64 au lieu d'être chargées comme fichiers séparés.
  • JavaScript non différé et bibliothèques entières incluses dans le document.
  • HTML non minifié, rempli d'espaces et de commentaires de développement.

Quand ce poids s'accumule en haut du document, il repousse vers le bas les éléments stratégiques. Et c'est là que les dégâts commencent.

Ce qui disparaît au-delà de la coupure

Tout ce qui se trouve après le seuil de 2 Mo cesse d'exister pour Google. Selon l'emplacement de la coupure, les conséquences varient.

Élément au-delà de 2 MoConséquence SEO
Données structurées JSON-LDPerte des résultats enrichis
Balise canoniqueContenu dupliqué dans l'index
Maillage interne (pied de page)Liens non suivis
Contenu principalPage indexée incomplète

Le cas de la balise canonique est particulièrement vicieux : si elle est placée bas dans le document et passe au-delà de la limite, Google peut indexer des dizaines de variantes d'URL comme autant de pages distinctes, diluant votre budget de crawl.

Comment l'accessibilité protège votre budget de crawl

C'est ici que les bonnes pratiques d'accessibilité deviennent une assurance technique. Les méthodes imposées par le RGAA poussent exactement dans la bonne direction.

L'amélioration progressive dicte de livrer d'abord un document HTML sémantique léger, fonctionnel même sans CSS ni JavaScript. Les surcouches visuelles ne se chargent qu'ensuite, de façon asynchrone. Une page conçue ainsi pèse une fraction de la limite.

Le HTML sémantique natif (<header>, <nav>, <main>, <article>) remplace les empilements de <div> et allège mécaniquement le document. L'accessibilité oblige aussi à placer le contenu critique en haut, pour faciliter la lecture par les synthèses vocales, ce qui garantit que vos balises méta, votre JSON-LD et votre contenu principal restent dans la zone lue par Google.

En clair : un site qui vise la conformité RGAA dépasse rarement les 2 Mo de HTML. L'audit d'accessibilité fait, au passage, le travail d'un audit anti-troncature. C'est l'une des nombreuses raisons pour lesquelles accessibilité et SEO partagent le même socle technique.

Comment vérifier votre page

Quelques gestes simples permettent de savoir si vous êtes exposé :

  1. Affichez le code source (Ctrl+U) et mesurez le poids du document HTML seul, hors images et scripts externes.
  2. Ouvrez les DevTools, onglet Réseau, et regardez la taille du document principal (réponse HTML), pas celle de toutes les ressources.
  3. Vérifiez la position de vos éléments critiques : votre JSON-LD et votre balise canonique sont-ils proches du début du document ?
  4. Lancez un audit automatique gratuit : notre scanner analyse la structure sémantique et la lourdeur du code, les premiers facteurs de troncature.

Pour comprendre la nuance entre ce que l'accessibilité apporte vraiment au référencement et ce qui relève du mythe, lisez aussi notre article l'accessibilité améliore-t-elle vraiment le SEO ?.

Conclusion

La règle des 2 Mo transforme une bonne pratique en impératif d'indexation. Une page lourde n'est plus seulement lente : elle est partiellement invisible pour Google, en silence. La meilleure parade ne demande aucun outil exotique, juste un code propre, léger et sémantique, c'est-à-dire exactement ce que l'accessibilité exige déjà.

Commencez par mesurer l'état de votre site avec un audit gratuit, et traitez la structure avant tout le reste.

Votre site est-il conforme ?

Ne prenez pas de risques avec l'accessibilité. Lancez un audit complet de votre site en quelques minutes et obtenez un rapport détaillé des corrections à apporter.