Aller au contenu principal
Technique6 mai 2026Mis à jour le 6 mai 202612 min

Sous-titres conformes RGAA et Charte Arcom : guide complet 2026

En Bref : L'essentiel à retenir

  • Guide complet du cadre légal 2026 : RGAA 4.1.2, EAA, Ordonnance 2023-859. Secteur public : jusqu'à 50 000 € et 25 000 €. Secteur privé EAA : amende 7 500 € et astreinte 3 000 €/jour plafonnée à 300 000 €.
  • Articulation des critères RGAA 4.1 (transcription textuelle), 4.3 (sous-titres synchronisés) et 4.4 (pertinence des sous-titres) avec exemples concrets.
  • Charte Arcom 2011 expliquée : 16 critères, code couleur SME complet (blanc, jaune, rouge, magenta, cyan, vert), 12 à 15 cps, 40 caractères par ligne (36 en mode strict broadcast), gap 160 ms.
  • Workflow pratique de bout en bout : YouTube auto, traitement, validation, publication. Outils gratuits du marché et internes recommandés.
  • Erreurs fréquentes à éviter : confondre 4.3 et 4.4, oublier le contexte sonore, italique abusif, mauvaise attribution des locuteurs.
VidéoRGAASous-titresCharte ArcomEAAMultimédia

En 2026, sous-titrer une vidéo ne se résume plus à coller la transcription dans un coin de l'écran. Entre le RGAA 4.1, l'European Accessibility Act, l'Ordonnance 2023-859 et la Charte Arcom 2011, le cadre est dense, technique et désormais sanctionné financièrement. Ce guide complet vous donne tout ce qu'il faut pour produire des sous-titres conformes : cadre juridique, paramètres techniques, code couleur SME, workflow pratique et outils.

Trois textes structurent les obligations actuelles. Comprendre leur articulation évite les contre-sens et les sanctions évitables.

1.1 RGAA 4.1.2 : la référence française

Le Référentiel général d'amélioration de l'accessibilité, version 4.1.2, est la traduction opérationnelle française des WCAG 2.1 niveau AA. Sa thématique 4 ("Multimédia") couvre les critères 4.1 à 4.13. Pour les sous-titres, trois critères sont centraux :

  • Critère 4.1 : alternative textuelle (transcription) pour les médias temporels enregistrés.
  • Critère 4.3 : sous-titres synchronisés présents pour les médias temporels enregistrés.
  • Critère 4.4 : sous-titres synchronisés pertinents.

Le RGAA est opposable aux services publics depuis 2005, et aux entreprises privées de plus de 250 millions d'euros de chiffre d'affaires depuis 2019. L'EAA a élargi le périmètre depuis 2025.

1.2 European Accessibility Act et transposition française

La directive (UE) 2019/882, dite EAA, est applicable depuis le 28 juin 2025. Elle a été transposée en droit français par :

Le périmètre couvre désormais : e-commerce, banque, transport, livre numérique, plateformes audiovisuelles, services téléphoniques. Pour les vidéos, cela signifie que tout contenu vidéo participant à la fourniture du service doit être accessible (sous-titres et, selon le cas, audiodescription).

1.3 Sanctions financières applicables

Le régime de sanction diffère selon que l'organisme relève du secteur public ou du secteur privé.

Secteur public (Ordonnance 2023-859, contrôle Arcom) :

ManquementMontantRenouvellement
Défaut d'accessibilitéjusqu'à 50 000 €tous les 6 mois
Absence de déclaration d'accessibilitéjusqu'à 25 000 €tous les 6 mois

Secteur privé relevant de l'EAA (Décret 2023-931, contrôle sectoriel) :

ManquementMontant
Défaut de conformité (personne morale)amende pénale jusqu'à 7 500 € (classe 5), doublée en récidive
Astreinte en cas de persistance3 000 € / jour, plafond 300 000 €

Le contrôle est sectoriel : l'Arcom pour l'audiovisuel et le secteur public, la DGCCRF pour l'e-commerce et les services aux consommateurs, l'ARCEP pour les communications électroniques. Pour un éclairage complet sur les contrôles de l'Arcom, lisez notre bilan des contrôles Arcom 2024.

1.4 WCAG 1.2.2 : la référence internationale

À l'échelle internationale, la critère équivalent est WCAG 1.2.2 Captions (Prerecorded), niveau A. Si vous publiez un site multilingue ou multipays, alignez-vous sur les WCAG en plus du RGAA.

2. RGAA 4.1, 4.3, 4.4 : trois critères, trois exigences distinctes

C'est l'erreur la plus fréquente en audit : confondre transcription, sous-titres synchronisés et pertinence. Ces trois critères se cumulent.

2.1 Critère 4.1 : la transcription textuelle

Une transcription textuelle est une alternative écrite complète au contenu audio ou vidéo. Elle apparaît à proximité de la vidéo (par exemple dans un bloc dépliant), et elle est consultable indépendamment de la lecture.

Une bonne transcription comporte :

  1. Le titre de la vidéo et la durée.
  2. La liste des intervenants avec leurs rôles.
  3. Le dialogue intégral avec horodatage facultatif.
  4. La description des éléments visuels essentiels (graphique, geste, texte affiché).
  5. Les sons et musiques significatifs.

C'est aussi un atout SEO majeur, car le texte est indexable par les moteurs de recherche.

2.2 Critère 4.3 : les sous-titres synchronisés

Le critère 4.3 vérifie la présence de sous-titres synchronisés. Concrètement, l'audit RGAA répond à la question : "y a-t-il une piste de sous-titres pour cette vidéo ?". Un fichier .vtt ou .srt lié à la vidéo, ou un sous-titrage incrusté visible, suffit à valider 4.3.

Attention : YouTube affiche par défaut les sous-titres automatiques, mais ils ne comptent pas comme une piste manuelle. Pour valider 4.3 dans un audit, il faut une piste explicitement créée et publiée.

2.3 Critère 4.4 : la pertinence des sous-titres

Le critère 4.4 vérifie la qualité des sous-titres présents. C'est ici que la majorité des audits trouvent des non-conformités. Pour être pertinents, les sous-titres doivent :

  • Transcrire fidèlement les paroles, sans omissions.
  • Identifier les locuteurs ([Marie], [Voix off]).
  • Décrire les sons significatifs ([Sonnerie], [Musique mélancolique]).
  • Respecter une vitesse de lecture raisonnable (12 à 15 cps selon la Charte Arcom).
  • Ne pas masquer les éléments visuels essentiels (sous-titres incrustés trop bas).

[!NOTE] Une vidéo peut valider 4.3 (sous-titres présents) tout en échouant 4.4 (sous-titres incomplets, mal synchronisés ou trompeurs). C'est le cas typique des vidéos avec sous-titres automatiques YouTube non corrigés.

3. La Charte Arcom 2011 expliquée

La Charte du sous-titrage à destination des personnes sourdes ou malentendantes, publiée en décembre 2011 par le CSA (devenu Arcom), définit 16 critères de qualité pour le sous-titrage SME. Conçue pour la TV broadcast, elle s'est imposée comme la référence opérationnelle pour tout le sous-titrage français, web compris.

3.1 Paramètres techniques

ParamètreValeur recommandéeMode strict (TV)
Vitesse de lecture15 caractères / seconde12 cps
Longueur de ligne40 caractères (sans code de mise en forme)36 caractères
Lignes simultanées2 maximum2 maximum
Gap entre sous-titres160 ms minimum160 ms minimum
Durée minimum à l'écran1,5 seconde1,5 seconde
Durée maximum à l'écran6 secondes6 secondes

3.2 Police, italique et casse

  • Police sans empattements (Arial, Helvetica, sans serif).
  • Pas d'italique : illisible pour les malvoyants utilisant un agrandisseur.
  • Pas de capitales intégrales sauf indication précise (cri, message systeme).
  • Corps suffisant pour rester lisible à distance d'écran TV (3 m).

3.3 Position et alignement

  • Centré bas par défaut.
  • Jamais au-dessus d'un visage parlant.
  • Décalage gauche/droite pour distinguer plusieurs locuteurs présents simultanément (rare mais utile).

3.4 Le code couleur SME : six teintes obligatoires

C'est la spécificité française la plus mal connue des créateurs de contenu. Aucun outil grand public ne le respecte par défaut.

CouleurUsageExemple
BlancLocuteur visible à l'écranDialogue principal, face caméra
JauneLocuteur hors champVoix off, personne hors cadre
RougeEffets sonores et indications[Porte qui claque], [Sonnerie]
MagentaMusique, paroles chantées♪ Paroles ♪
CyanPensées, narration intérieureVoix interne d'un personnage
VertLangues étrangèresDialogue en anglais, espagnol

Le format WebVTT supporte ces couleurs via CSS et balises <c.colorYellow>. Le format SRT brut ne le permet pas (pas de mise en forme native).

3.5 Indications sonores

Les bruits significatifs sont indiqués entre crochets, en rouge dans la version SME. Quelques exemples typiques :

  • [Musique mélancolique]
  • [Coup de feu]
  • [Rires en arrière-plan]
  • [Téléphone qui sonne]
  • [Pas qui s'éloignent]

Les paroles chantées sont encadrées par des notes de musique et apparaissent en magenta : ♪ Sous le pont Mirabeau coule la Seine ♪.

4. Workflow pratique de bout en bout

Voici comment produire des sous-titres conformes en 2026, du brouillon à la publication.

4.1 Étape 1 : la transcription brute

Plusieurs options selon le budget et la sensibilité du contenu :

  • YouTube Studio : génère des sous-titres automatiques en français (et plusieurs autres langues). Gratuit, rapide, qualité variable selon la clarté audio.
  • Notre outil de transcription vidéo accessible : spécialisé sur le français, applique le post-traitement Charte Arcom (cps, longueur de ligne, gap), exporte en VTT/SRT/TXT prêt à l'emploi.
  • Logiciels desktop comme Subtitle Edit (gratuit, Windows/Linux) avec ses propres modules de transcription.
  • Prestataire humain : 1 à 3 € la minute, qualité maximale, indispensable pour les contenus sensibles (juridique, médical).

4.2 Étape 2 : le reformatage Charte Arcom

C'est l'étape que la plupart des outils sautent. Une transcription brute est composée de phrases longues. Pour devenir un sous-titre conforme, il faut :

  1. Découper chaque phrase en blocs de 40 caractères max sur 2 lignes max.
  2. Vérifier la vitesse : si > 15 cps, allonger le timing.
  3. Insérer les gaps de 160 ms minimum entre deux sous-titres.
  4. Ajuster les transitions sur les changements de plan ou de locuteur.

4.3 Étape 3 : la passe humaine

Aucun outil automatique ne fait ce qui suit :

  • Corriger les noms propres et les termes techniques mal transcrits.
  • Identifier les locuteurs quand ils ne sont pas visibles.
  • Ajouter les indications sonores [bruit] qui manquent.
  • Reformuler les phrases trop longues pour respecter la vitesse de lecture.
  • Appliquer le code couleur SME si vous êtes un média professionnel.

Comptez 30 à 60 minutes de travail humain par 5 minutes de vidéo. C'est dix fois plus rapide qu'un sous-titrage manuel à partir de zéro.

4.4 Étape 4 : la validation

Trois niveaux de contrôle complémentaires :

  1. Validation technique : vérifier le fichier VTT/SRT avec notre validateur de sous-titres RGAA ou Subtitle Edit (Outils > Vérifier les normes).
  2. Validation visuelle : visionner la vidéo avec les sous-titres affichés, idéalement sans le son, pour repérer ce qui manque.
  3. Validation utilisateur : faire tester par une personne sourde ou malentendante quand le budget le permet. C'est la seule façon de détecter les problèmes de vocabulaire et de rythme réels.

4.5 Étape 5 : la publication

  • YouTube / Vimeo : uploadez le .vtt ou .srt dans la section "Sous-titres" de votre vidéo. Sélectionnez la langue (français-FR pour la Charte Arcom).
  • Lecteur HTML5 : déclarez la piste avec <track kind="subtitles" src="video.vtt" srclang="fr" label="Français" default>.
  • Plateformes propriétaires (Brightcove, Kaltura) : suivez la documentation native, elles supportent toutes le VTT.

Publiez aussi la transcription textuelle complète sur la page de la vidéo (critère 4.1). C'est un double bénéfice : conformité RGAA et SEO.

5. Outils recommandés en 2026

5.1 Outils gratuits du marché

  • Subtitle Edit : éditeur desktop gratuit (Windows, Linux via Wine, macOS via build communautaire). Transcription automatique, validation des normes, export multi-formats. C'est la référence open source.
  • Aegisub : éditeur visuel orienté karaoké et sous-titrage avancé. Interface plus technique, idéal pour les fansubbers et la post-prod broadcast.
  • YouTube Studio : pratique pour les créateurs YouTube, mais le post-traitement Charte Arcom doit être fait à part.

5.2 Outils internes RGAA Checker

6. Erreurs fréquentes à éviter

Voici les pièges les plus courants en audit RGAA et Arcom.

6.1 Confondre 4.3 et 4.4

Ajouter une piste de sous-titres automatique YouTube valide 4.3 mais échoue 4.4. Les auditeurs vérifient les deux séparément. Une piste inutile vaut autant qu'une absence de piste.

6.2 Oublier le contexte sonore

Une vidéo musicale sous-titrée uniquement sur les paroles oublie le critère SME le plus important : indiquer la nature de la musique ([Rock énergique], [Piano calme]). Sans ce contexte, le spectateur sourd ne peut pas saisir l'ambiance.

6.3 Italique abusif

Beaucoup d'outils marquent en italique les voix off, les pensées ou les sons. C'est interdit par la Charte Arcom (illisibilité pour les malvoyants utilisant un agrandisseur). Utilisez plutôt le code couleur (jaune pour hors champ, cyan pour pensées, rouge pour sons).

6.4 Mauvaise attribution des locuteurs

Sur une interview à 3 personnes, ne pas identifier le locuteur transforme le dialogue en bouillie. La règle : identifier dès qu'il y a doute, soit par le nom ([Marie]), soit par la couleur (un locuteur = une couleur dédiée), soit par la position du sous-titre (gauche/droite).

6.5 Vitesse trop élevée

Le piège n°1 sur les vidéos rythmées (interviews, débats). Si la vitesse dépasse 15 cps, le sous-titre devient illisible avant d'avoir été lu. Solutions : reformuler plus court, allonger l'affichage, ou condenser plusieurs répliques en une seule synthèse.

6.6 Gap trop court

Deux sous-titres collés sans interruption visible empêchent le cerveau de distinguer la transition. 160 ms minimum, c'est le seuil empirique de la persistance rétinienne.

7. Tester sa conformité

Trois validateurs complémentaires à utiliser systématiquement avant publication.

7.1 Le validateur interne RGAA Checker

Notre validateur de sous-titres RGAA vérifie un fichier VTT ou SRT et liste les non-conformités : vitesse, longueur, gap, structure du fichier, balises mal fermées. Gratuit, sans création de compte, traitement local dans le navigateur.

7.2 Subtitle Edit checker

Le module Outils > Vérifier les normes de Subtitle Edit applique les règles SCC, EBU-TT et ARIB. Permet de définir des profils personnalisés (par exemple : Charte Arcom 12 cps en mode strict).

7.3 La revue humaine

Aucun outil ne remplace une personne sourde ou malentendante qui regarde la vidéo. Si vous publiez régulièrement, créez un partenariat avec une association locale (Unisda, Surdi 13, etc.) ou recrutez un relecteur SME freelance.

8. Cas particuliers

8.1 Le direct (CC live)

Le sous-titrage en direct (closed captioning live) sort du cadre de cet article. Il dépend de technologies spécialisées (sténotypie assistée par IA, vélotypie) et d'un cadre juridique distinct (Arcom impose 100 % de sous-titrage live aux chaînes de service public depuis 2010). Pour le web, le live YouTube génère des sous-titres automatiques en temps réel, mais leur qualité reste très inférieure aux exigences RGAA.

8.2 L'interview multi-locuteurs

Quand 3 ou 4 personnes parlent dans la même vidéo, identifier chaque locuteur est obligatoire. Deux approches :

  • Couleurs dédiées : locuteur 1 en blanc, locuteur 2 en jaune, locuteur 3 en cyan, etc. Limite : la Charte Arcom réserve déjà ces couleurs à des usages précis.
  • Tag locuteur : [Marie], [Pierre] en début de chaque réplique. Plus universel, plus lisible.

Mixer les deux est possible : couleur quand l'interlocuteur est visible, tag quand il ne l'est pas.

8.3 Les langues étrangères

Une réplique en anglais dans une vidéo française : sous-titre en vert selon la Charte Arcom, avec la traduction française entre parenthèses ou sur la ligne suivante. Exemple :

CODE
[En anglais] Hello, how are you?
(Bonjour, comment allez-vous ?)

8.4 Les vidéos sans dialogue

Une vidéo musicale instrumentale ou un plan de coupe silencieux n'a pas besoin de sous-titres de dialogue, mais doit indiquer la nature du contenu sonore ([Musique entraînante], [Silence]). Sans cette indication, la personne sourde ne sait pas si le son fonctionne ou si la vidéo est muette.

Conclusion

Sous-titrer en 2026, c'est conjuguer trois exigences :

  1. Réglementaire : RGAA 4.1, 4.3, 4.4, EAA, sanctions DGCCRF/Arcom.
  2. Opérationnelle : Charte Arcom 2011 (cps, longueur, gap, code couleur).
  3. Humaine : la passe finale par une personne (idéalement sourde ou malentendante) reste irremplaçable.

La bonne nouvelle, c'est que les outils ont énormément progressé. Avec un workflow combinant transcription IA + post-traitement Charte Arcom + revue humaine, on tombe à 30 à 60 minutes par 5 minutes de vidéo, contre plusieurs heures auparavant.

Prêt à industrialiser vos sous-titres conformes ? Notre outil de transcription vidéo accessible intègre la transcription IA et le post-traitement Charte Arcom en un seul passage. Vous récupérez VTT/SRT/TXT en quelques minutes, prêts pour la relecture finale.

Pour aller plus loin, consultez nos articles connexes : conformité vidéo et accessibilité, alternatives aux scripts et médias, sous-titrage automatique et RGAA.

Votre site est-il conforme ?

Ne prenez pas de risques avec l'accessibilité. Lancez un audit complet de votre site en quelques minutes et obtenez un rapport détaillé des corrections à apporter.