En el vídeo que muestra a uno de estos presentadores en una demostración se aprecia cómo todo en el presentador está tomado de una persona real, pero es el movimiento de la boca el que se va generando gracias a algoritmos que también potencian la voz sintetizada.
El desarrollo de la agencia de prensa china no es por tanto nuevo, pero sí destaca por ser la primera implementación práctica de este tipo de tecnología: el modelo humano se mueve solo ligeramente y pestañea. Todo en él es real salvo el movimiento de la boca y las frases que pronuncia, que en ambos casos están sintetizados mediante estos sistemas de inteligencia artificial.
Para su creación Xinhua ha colaborado con la empresa Sogou, que cuenta con un buscador de internet en el gigante asiático, y cuentan con un presentador que habla chino y otro que habla inglés. Para Xinhua las aplicaciones son ilimitadas, y estos presentadores virtuales pueden usarse para leer comunicados de prensa en los canales de televisión, web y móvil de la agencia.
Apenas se nota la diferencia con un presentador de carne y hueso. Los ingenieros de la firma Sogou utilizaron una plataforma IA de aprendizaje automático. Misma que es capaz de revisar videos de los presentadores reales para facilitar la animación del personaje.
De modo que los técnicos de Xinhua sólo tienen que configurar el sintetizador de voz y alimentarlo con noticias para que el presentador hable como si fuera un profesional. Estos presentadores pueden trabajar 24 horas al día, no están sindicalizados y su ética laboral será exactamente la que la compañía o el gobierno requiera.
Xinhua AI anchor, launched on Wednesday, starts presenting news reports from Thursday. In this program, he takes you to have a look at what a Panama official and the Chinese businessman Jack Ma say about the ongoing #CIIE. pic.twitter.com/OZkRQtv1sQ
- China Xinhua News (@XHNews) 8 de noviembre de 2018