YouTube, la más popular plataforma para compartir vídeos, ha puesto hoy en servicio un sistema de subtitulación automática de todos los vídeos en inglés. Hasta ahora el servicio se estaba probando en un número seleccionado de vídeos, pero ahora se extiende a cualquier vídeo en inglés, aunque a la hora de cargarlo el usuario puede indicar mediante un botón si quiere que esta funcionalidad se aplique inmediatamente a su contenido.
El sistema se basa en un algoritmo para el reconocimiento de voz desarrollado por Google. Como reconocen sus autores en The Times para que funcione correctamente la voz tiene que ser clara y no haber mucho ruido ambiente. También está por ver como reaccionará a los distintos acentos dentro de un mismo idioma.
El reconocimiento de voz se prometía como una función estándar en cualquier ordenador hacer más de una década, pero los requisitos de estos programas, como, por ejemplo la necesidad de que el programa «aprendiera» la dicción del usuario, hizo que nunca llegaran a generalizarse.
En el siguiente vídeo puede observarse una demostración del sistema. En el botón rojo cc (close caption) se puede configurar esta funcionalidad y obtener prestaciones tan importante como descargar la transcripción. Se nos advierte -eso sí- que todas estas prestaciones están todavía en beta.
Este sistema tiene una serie de aplicaciones de enorme interés:
– Ayuda a las personas con problemas de audición. Hasta ahora la transcripción es tremendamente costosa. En España el Centro de Subtitulado y Audiodescripción realiza esta tarea con carácter institucional. Todas las televisiones subtitulan películas, pero sólo TVE subtitula sus informativos, que tienen una problemática especial, por la inmediatez del trabajo, y que se resuelve en gran medida descargando los textos existentes en su sistema informático de redacción en el sistema de subtitulado.
– Herramienta para el aprendizaje de lenguas. La subtitulación puede servir no sólo al estudiante de una lengua extranjera, sino también al inmigrante que todavía no domina la lengua del país en que habita.
– Herramienta para la búsqueda y documentación de vídeos. Las posibilidades de buscar y documentar aumentan exponencialmente si contamos con la descripción de la palabra, aunque lógicamente el vídeo es mucho más que palabra. Televisiones y agencias de noticias pueden sacar un enorme partido a esta tecnología.
– Servir como punto de partida para el vídeo interactivo. La vinculación entre el texto y la imagen permite crear vínculos salientes a partir del texto. Dos aplicaciones GAudi (que me imagino que esta en el origen de esta aplicación) y el visor interactivo de RTVE, de las que ya me he ocupado anteriormente, ya utilizan estas posibilidades.
¿Funcionará en inglés? ¿Cuándo llegará en español?
martes, 01 Mar 11 a las 1:25 am
muy buen sistema, coincido con el post…no solo es para saber que es lo que dicen en el video, sino que tambien lo puedes utilizar para muchos otros fines.
saludos
alex.