Skip to main content

4.1. De texto a voz, de voz a texto

Las tecnologías de texto a voz permiten convertir un texto escrito en audio. Las tecnologías de voz a texto realizan el proceso inverso: transforman una explicación oral, una intervención o una grabación en texto. Ambas funciones están cada vez más integradas en herramientas educativas, procesadores de texto, asistentes de IA, dispositivos móviles y plataformas de accesibilidad.

pexels-cottonbro-7120126.jpg

¿Por qué mejora la accesibilidad?

Estas funciones amplían las formas de acceso y expresión. La lectura en voz alta puede facilitar la comprensión de un texto para alumnado con dificultades lectoras, discapacidad visual, fatiga, problemas de atención o desconocimiento parcial del idioma. El dictado o la transcripción pueden ayudar a alumnado con dificultades motrices, disgrafía, barreras en la escritura o necesidad de expresar oralmente antes de producir un texto escrito.

También son útiles para todo el grupo. Un texto leído en voz alta permite revisar mejor una redacción, detectar errores, reforzar la comprensión oral o convertir apuntes en material de estudio auditivo.

Fuente: Pexels

Herramientas concretas
Para texto a voz y apoyo a la lectura pueden utilizarse Microsoft Immersive Reader, ReadSpeaker o NaturalReader EDU. Para voz a texto y dictado pueden explorarse el dictado por voz de Google Docs, las funciones de dictado de Microsoft, Whisper o servicios como Microsoft Azure Speech.

En el aula, estas herramientas pueden utilizarse para transformar una lectura en audio, generar una transcripción de una explicación, preparar materiales auditivos de repaso o permitir que un alumno dicte una primera versión de su respuesta antes de revisarla por escrito.

La aplicación online de Office 365, también nos permite transcribir un mensaje oral. Con el correo de @educa.aragon.es podemos acceder al procesador de texto, y hacer clic en Dictar: 

image.png



image.png

Seleccionamos el idioma y el micrófono

image.png

Y podemos también subir audios que tengamos preparados previamente, que hayamos descargado, etc. 

image.png

Aplicaciones para móvil y tablet

Aplicaciones móviles de voz a texto y texto a voz

Las aplicaciones de reconocimiento y síntesis de voz pueden reducir barreras de acceso a la información y de comunicación. Permiten convertir una explicación oral en texto visible, transformar un documento escrito en audio o facilitar la interacción de personas que encuentran dificultades en la lectura, la escritura, la audición o el acceso visual.

Aplicaciones de voz a texto

Aplicación Dispositivos Función principal Aplicación educativa y accesible
Transcripción instantánea de Google Android Convierte en texto las conversaciones y sonidos del entorno en tiempo real. Puede ayudar a alumnado sordo o con pérdida auditiva a seguir una explicación oral, una conversación o una actividad grupal.
Ava iOS y Android Genera subtítulos en directo para conversaciones presenciales, clases y reuniones. Permite seguir conversaciones y puede diferenciar a las personas que intervienen, facilitando la participación en pequeños grupos.
Subtítulos en directo de Apple iPhone y iPad Transcribe el audio de las aplicaciones y las conversaciones cercanas. Facilita el acceso al contenido oral sin instalar una aplicación adicional y permite personalizar la apariencia del texto.
Subtítulos automáticos de Android Android, según el dispositivo Añade subtítulos al audio reproducido en vídeos, pódcast, llamadas y otras aplicaciones. Resulta útil para acceder a materiales audiovisuales que no incluyen subtítulos originales.
Microsoft Translator iOS y Android Transcribe y traduce conversaciones de voz, texto e imágenes. Puede apoyar la comunicación con alumnado de incorporación tardía y familias que todavía no dominan la lengua de escolarización.

Aplicaciones de texto a voz

Aplicación Dispositivos Función principal Aplicación educativa y accesible
Modo Lectura de Google Android Simplifica la presentación del texto y permite escucharlo mediante lectura en voz alta. Puede apoyar a alumnado con dificultades lectoras, baja visión, problemas de atención o necesidad de ajustar el tamaño, el contraste y la velocidad de lectura.
NaturalReader iOS y Android Lee en voz alta PDF, documentos, páginas web y textos capturados mediante la cámara. Permite convertir apuntes, fichas, libros o documentos fotografiados en contenido auditivo.
Voice Dream Reader iPhone y iPad Lee documentos, libros y páginas web y destaca el texto de forma sincronizada. Combina el canal visual y auditivo, lo que puede facilitar el seguimiento lector y la comprensión.
Speechify iOS y Android Convierte documentos, páginas web y textos escaneados en audio. Puede transformar materiales impresos o digitales en recursos auditivos y permitir ajustar la velocidad de reproducción.
Leer y hablar de Apple iPhone y iPad Lee en voz alta el texto seleccionado o el contenido completo de la pantalla. Ofrece una alternativa integrada para escuchar instrucciones, páginas web y documentos sin instalar otra aplicación.
Habla en directo de Apple iPhone y iPad Permite escribir un mensaje para que el dispositivo lo pronuncie en voz alta. Puede facilitar la comunicación de personas con dificultades temporales o permanentes del habla.

Ejemplo de uso en el aula

Durante una explicación oral, el docente puede colocar una tableta con Transcripción instantánea, Ava o Subtítulos en directo para que el alumnado pueda seguir el contenido por escrito. Posteriormente, el material entregado puede abrirse en Modo Lectura, NaturalReader o Voice Dream Reader para que también pueda escucharse.

De este modo, la misma información está disponible mediante voz, texto y lectura auditiva. La aplicación debe elegirse según la barrera detectada y las condiciones reales del alumnado, evitando utilizar varias herramientas cuando una función integrada en el propio dispositivo resulta suficiente.

Aspectos que debe revisar el profesorado

Las transcripciones automáticas pueden cometer errores por el ruido del aula, la distancia al micrófono, los turnos simultáneos, el acento o el vocabulario técnico. Los textos generados deben revisarse cuando vayan a conservarse o compartirse.

También es necesario comprobar las condiciones de uso, la edad recomendada, la necesidad de crear una cuenta y el tratamiento de las grabaciones. Antes de grabar o transcribir conversaciones deben respetarse la privacidad y el derecho a la información de las personas participantes.

Estas aplicaciones pueden facilitar el acceso, pero no sustituyen los apoyos profesionales ni una adaptación humana cuando se necesita una transcripción de alta precisión.