¿Pueden las AI Voices modernas reemplazar a los actores profesionales de doblaje?
Un área de la tecnología que está experimentando un rápido desarrollo es la tecnología de texto a voz
. Los cuatro gigantes tecnológicos: Amazon, Google, Microsoft e IBM, junto con muchos otros proyectos de código abierto, compiten silenciosamente entre sí para crear voces mejores y más realistas. Pero, ¿las voces de VozFly reemplazan a los actores de doblaje profesionales? Vamos a averiguar.
Hay cuatro cosas clave que uno consideraría al contratar a un actor de voz en off:
1. Calidad de la voz
2. Costo 3. Tiempo
de entrega
4. Derechos comerciales
Comparemos estas cosas y entendamos por qué decimos que las voces de texto a voz reemplazarán a los actores de voz en off. .
Calidad de voz AI
Primeras voces de IA
Las primeras voces de inteligencia artificial (AI Voices) sonaban extremadamente robóticas porque se generaban a través de un proceso conocido como enfoque concatenativo en el que los sonidos de las palabras se grababan primero y luego se unían para crear audio. La voz resultante sonaría monótona y carecía de entonación o expresión.
Voces modernas de texto a voz
Sin embargo, las últimas voces de IA se generan dinámicamente en función de un proceso llamado aprendizaje neuronal que se basa en el aprendizaje automático. Primero se entrena un modelo de computadora utilizando un conjunto de datos de alta calidad que luego aprende a predecir el habla en función del contexto de los textos de entrada.
Las voces resultantes suenan sorprendentemente reales.
Costo de crear audio
En promedio, un locutor profesional cobra $10 por 100 palabras. Text to Speech, por otro lado, cuesta una fracción de ese precio.
Hay dos tipos de voces de texto a voz disponibles: estándar y neuronal. Las voces estándar cuestan alrededor de $0,04 por 1000 palabras y las voces neuronales cuestan alrededor de $0,16 por 1000 palabras.
entrega de tiempo
Un actor de doblaje suele tardar entre 3 y 4 días en crear y entregar el audio. Con la tecnología Text to Speech, puede crear el audio casi en tiempo real.
También tiene la ventaja de hacer revisiones ilimitadas que son limitadas y consumen mucho tiempo con un actor de doblaje.
Derechos de difusión y comerciales
Aunque un actor de doblaje otorga todos los derechos que necesitaría para usar comercialmente el audio, generalmente cobra por proporcionar estos derechos.
Sin embargo, con las voces de texto a voz, no tiene que preocuparse ni pagar tarifas adicionales para usar el audio comercialmente.
Aplicaciones más adecuadas para voces de IA
Hay algunas de las aplicaciones que son más adecuadas para la tecnología de texto a voz que la contratación de actores de voz:
- Creación de versiones de audio de artículos y publicaciones de blog para reutilizar la mejora del contenido y la participación del usuario.
- Para crear audio de voz en off para videos de YouTube.
- Creación de audio de voz en off para presentaciones y demostraciones de productos.
- Crear anuncios.
- Para crear audio para avatares para VR o videojuegos.
- Cree contenido de audio para cursos y material de aprendizaje electrónico.
En general, las mejoras significativas que ve en las voces de texto a voz de hoy en día definitivamente las han convertido en consumibles para el usuario final y han abierto una gran cantidad de aplicaciones para ellas, pero aún no son aplicables a ciertos casos de uso, como la creación de comerciales. , narración de audiolibros, etc. donde se necesita una voz humana para transmitir una emoción en el audio.
Creemos que es solo cuestión de tiempo que las voces de IA se pongan al día para sonar exactamente igual o incluso mejor que los actores de voz profesionales
