Pasar al contenido principal

Investigadores logran crear una tecnología que permite modificar lo que dice la gente en los vídeos con solo editar la transcripción y es aterrador

video movil

Reuters

  • Investigadores de Stanford han logrado crear un algoritmo capaz de modificar lo que dice una persona en un vídeo, con solo editar la transcripción.
  • Por el momento el algoritmo necesita al menos 40 minutos de material de archivo para lograr este cambio.
  • Aunque los expertos se muestran optimistas con este avance, esta técnica podría abrir nuevos caminos para las fake news y la desinformación.
  • Descubre más historias en Business Insider.

La tecnología ha hecho que ya no podamos fiarnos de una imagen. El siguiente paso parece ir encaminado a que también debamos desconfiar de lo que se dice en un vídeo.

Investigadores de la universidad de Stanford, el instituto Max Planck de informática y la Universidad de Princeton y Adobe han logrado generar una tecnología capaz de cambiar lo que  dice un apersona en un vídeo. Solo editando la transcripción del texto y sin que se perciban cambios en el habla.

El funcionamiento de este método se basa en un algoritmo capaz de reproducir la forma de hablar (movimientos de la boca y voz) de una persona en un vídeo. Para conseguirlo este ha sido entrenado para identificar fonemas, pronunciación de letras y palabras. 

esta tecnología cmabia lo que alguien dice en un vídeo
Ohad Fried/YouTube

Con ello, para modificar lo que una persona dice en un vídeo, basta con introducir cambios de lo que se quiere decir en la transcripción del texto. Una vez realizados esos cambios, esta tecnología permite que el algoritmo busque en el vídeo original los fonemas necesarios para crear el nuevo texto.

Una vez encontrados, genera un modelo de la cabeza del hablante que sustituye la frase original por la que se ha creado y altera el vídeo para que al introducir la frase cambiado no se perciban alteraciones, pausas o cortes en la emisión.

Leer más: Un nuevo hackeo creado por investigadores puede adivinar las contraseñas de tu móvil solo escuchando cómo tocas la pantalla

El resultado es aterrador. El vídeo alterado parece totalmente natural. Cualquiera que lo vea corre el riesgo de atribuir las palabras alteradas a la persona que aparece en pantalla.

Ohad Fried de la universidad de Stanford, ha compartido un vídeo en YouTube donde se puede ver cómo funciona esta nueva técnica de edición de vídeo y lo sorprendente que resulta.

Por el momento esta técnica solo puede aplicarse si se cuenta con al menos 40 minutos de material original de grabación. Además se trata de bustos parlantes, es decir, centrado en encuadres de personas hablando desde los hombros.

Una posible arma para las fake news

En cuanto a posibles usos, los investigadores del proyecto se muestran optimistas, y ven en esta técnica una nueva herramienta de edición de vídeos que podría permitir llevar a cabo cambios con tan solo modificar el texto en la transcripción.

Por supuesto también existe el riesgo de otorgar a la red una nueva forma de ampliar las fake news donde los vídeos podrían empezar a ser utilizados para que personajes relevantes, políticos... pudieran aparecer diciendo cosas que realmente no han dicho.

"Desafortunadamente, tecnologías como esta siempre atraerán a malos actores", ha dicho Fried, estudiante de doctorado en Stanford. "Pero la lucha vale la pena, dada la gran cantidad de aplicaciones creativas de edición de vídeo y creación de contenido que esto permite".

Ante este peligro que supone avanzar en las herramientas que podrían fomentar la desinformación, los investigadores consideran que el uso de marcas de agua en los vídeos podría ser una de las soluciones que eviten este tipo de falsos vídeos.

Y además