Perceptible Medios basados en el tiempo Nivel A WCAG 2.0, 2.1, 2.2

1.2.3 Descripción de audio o alternativa multimedia (pregrabada)

Meta Los vídeos pregrabados pueden ser comprendidos por más personas, incluyendo quienes no perciben el contenido visual.
Qué hacer Proporciona una audiodescripción del contenido visual o una alternativa completa en texto para vídeos pregrabados.
Por qué importa Las personas ciegas o con baja visión pueden acceder a la información visual transmitida en vídeos.

Criterio de éxito oficial

Nivel A · WCAG 2.0, 2.1, 2.2

Se proporciona una alternativa para medios basados en el tiempo o una audiodescripción del contenido de vídeo pregrabado en medios sincronizados, excepto cuando el medio es una alternativa para texto y está claramente etiquetado como tal.

¿Qué es una audiodescripción?

Una audiodescripción es una narración hablada que describe el contenido visual de un vídeo. Se sintoniza a través de un canal de audio separado o se intercala durante los silencios del audio original. Describe acciones, cambios de escena, expresiones faciales, texto en pantalla y otros detalles visuales que alguien que no puede ver necesita para entender el vídeo.

Este criterio de Nivel A permite elegir entre dos enfoques: proporcionar una audiodescripción del vídeo, o proporcionar una alternativa de texto completo que describa todo lo que sucede (tanto visual como auditivo).

Los dos enfoques de 1.2.3

Relación entre niveles

Los criterios 1.2.3, 1.2.5 y 1.2.8 se solapan. En Nivel A (1.2.3) puedes elegir entre audiodescripción o alternativa de texto. En Nivel AA (1.2.5) la audiodescripción es obligatoria. En Nivel AAA (1.2.8) se requiere una descripción de texto extendida.

¿Por qué es importante?

Sin alternativas, las personas ciegas pierden completamente los detalles visuales del vídeo. No saben qué hay en pantalla, quién está hablando, qué acciones ocurren o cómo se ve el entorno. Las audiodescripciones o alternativas textuales cierran esta brecha permitiendo acceso completo a la información visual.

La información visual es crucial en muchos vídeos: tutoriales que muestran procesos, películas con significado visual importante, presentaciones con gráficos, o demostraciones prácticas. Sin descripción de estos elementos visuales, las personas ciegas no pueden beneficiarse completamente del contenido.

¿Quién se ve afectado?

Personas ciegas — No pueden percibir ningún elemento visual del vídeo. Necesitan una descripción completa o audiodescripción para entender qué sucede.

Personas con baja visión — Pueden tener dificultades para ver detalles importantes en pantalla o seguir la acción. Una descripción adicional ayuda a llenar los vacíos.

Personas con discapacidades cognitivas — Pueden beneficiarse de múltiples formas de información para procesar mejor el contenido.

Personas sordociegas — Pueden acceder a alternativas textuales a través de dispositivos braille, permitiendo acceso completo.

Cómo implementar 1.2.3

Tienes dos opciones: proporcionar audiodescripción o una alternativa textual. Elige la que mejor se adapte a tu contenido:

Opción 1: Audiodescripción

La audiodescripción es una narración separada que describe el contenido visual. Se puede proporcionar como:

  • Pista de audio descriptiva separada en el reproductor de vídeo
  • Audio descrito directamente en una versión del vídeo
  • Descripción intercalada durante los silencios naturales del audio

Opción 2: Alternativa textual completa

Un documento de texto (transcripción extendida) que describa tanto el audio como el contenido visual del vídeo. Incluye:

  • Diálogos y narración exactos
  • Descripción de cada escena visual importante
  • Acciones clave y cambios de ambiente
  • Información de texto en pantalla

Técnicas WCAG aplicables

  • G69: Proporcionar una alternativa para medios basados en el tiempo para vídeo
  • G78: Proporcionar una segunda pista de audio que incluya la misma información importante que la pista de audio original
  • G173: Proporcionar una versión del vídeo con audiodescripción sincronizada
  • H96: Usar el elemento track para proporcionar pistas de descripción de audio

Errores comunes

  • Proporcionar solo el audio original sin audiodescripción ni alternativa textual
  • Crear descripciones muy superficiales que no capturan elementos visuales importantes
  • Confundir este criterio con subtítulos (los subtítulos no describen lo visual)
  • Proporcionar una alternativa textual pero hacer que sea muy difícil de encontrar
  • Usar audiodescripciones que hablan demasiado rápido o en momentos que interfieren con el diálogo importante

Criterios relacionados