Humanos hechos con IA

Así funciona la creación de avatars que pueden conversar con familiar que luego de fallecer tienen una existencia digital.

18/05/2024

Una vez a la semana, Sun Kai tiene una videollamada con su madre. Se sincera sobre el trabajo, las presiones que enfrenta como hombre de mediana edad y pensamientos que ni siquiera comenta con su esposa. De vez en cuando, su madre hace algún comentario, como decirle que se cuide: es su único hijo. Pero sobre todo, ella simplemente escucha.

Eso es porque la madre de los Suns murió hace cinco años. Y la persona con la que oye hablar no es en realidad una persona, sino una réplica digital que hizo de ella, una imagen en movimiento que puede llevar a cabo conversaciones básicas. Han estado hablando durante unos años. 

Después de morir de una enfermedad repentina en 2019, Sun quería encontrar una manera de mantener viva su conexión. Así que recurrió a un equipo de Silicon Intelligence, una compañía de IA con sede en Nanjing, China, que cofundó en 2017. Les proporcionó una foto de ella y algunos clips de audio de sus conversaciones de WeChat.

Si bien la compañía se centró principalmente en la generación de audio, el personal pasó cuatro meses investigando herramientas sintéticas y generó un avatar con los datos proporcionados por Sun. Luego pudo ver y hablar con una versión digital de su madre a través de una aplicación en su teléfono. 

“Mi mamá no parecía muy natural, pero todavía escuché las palabras que a menudo decía: ‘¿Ya has comido?’” Sun recuerda la primera interacción. Debido a que la IA generativa era una tecnología naciente en ese momento, la réplica de su madre puede decir solo unas pocas líneas pre-escritas. Pero Sun dice que así es como era ella de todos modos. “Ella siempre repetiría esas preguntas una y otra vez, y me emocionó mucho cuando lo escuché,”, dice.
Hay muchas personas como Sun que quieren usar la IA para preservar, animar e interactuar con sus seres queridos perdidos mientras lloran y tratan de sanar. El mercado es particularmente fuerte en China, donde al menos media docena de empresas están ahora ofreciendo tales tecnologías y miles de personas ya han pagado por ellos. De hecho, los avatares son la manifestación más reciente de una tradición cultural: Los chinos siempre han tomado consuelo de confiar en los muertos. 

La tecnología no es perfecta, los —avatares aún pueden ser rígidos y robóticos, pero está madurando, y hay más herramientas disponibles a través de más compañías. A su vez, el precio de “resurrecting” alguien—también llamado crear “inmortalidad digital” en la industria china—ha caído significativamente. Ahora esta tecnología se está volviendo accesible para el público en general. 

Algunas personas se preguntan si interactuar con réplicas de IA de los muertos es en realidad una forma saludable de procesar el dolor, y no está del todo claro cuáles pueden ser las implicaciones legales y éticas de esta tecnología. Por ahora, la idea todavía hace que mucha gente se sienta incómoda. Pero como dice otra cofundadora de Silicon Intelligence, CEO Sima Huapeng, “Incluso si solo el 1% de los chinos puede aceptar [AI clonación de muertos], eso sigue siendo un mercado enorme 

Resurrección AI
Los avatares de los muertos son esencialmente falsificaciones profundas: las tecnologías utilizadas para replicar a una persona viva y una persona muerta son inherentemente diferentes. Los modelos de difusión generan un avatar realista que puede moverse y hablar. Se pueden adjuntar grandes modelos de idiomas para generar conversaciones. Cuantos más datos ingieran estos modelos sobre la vida de alguien, incluidas fotos, videos, grabaciones de audio y textos, más de cerca el resultado imitará a esa persona, ya sea muerta o viva.

China ha demostrado ser un mercado maduro para todo tipo de dobles digitales. Por ejemplo, el país tiene un sector de comercio electrónico robusto, y las marcas de consumo contratan a muchos transmisores en vivo para vender productos. Inicialmente, estas eran personas reales, pero como revisión de Tecnología MIT reportado el otoño pasado—muchas marcas están cambiando a influencers clonados por IA que pueden transmitir 24/7. 

En los últimos tres años, el sector chino que desarrolla avatares de IA ha madurado rápidamente, dice Shen Yang, profesor que estudia IA y medios en la Universidad de Tsinghua en Beijing, y las réplicas han mejorado de videos renderizados de minutos a avatares 3D “live” que pueden interactuar con las personas.  

Este año, dice Sima, ha visto un punto de inflexión, con la clonación de IA cada vez más asequible para la mayoría de las personas. “El año pasado, costó alrededor de $2,000 a $3,000, pero ahora solo cuesta unos cientos de dólares,”, dice. Eso es gracias a una guerra de precios entre las compañías chinas de IA, que luchan por satisfacer la próspera demanda de avatares digitales en otros sectores como el streaming.

De hecho, la demanda de aplicaciones que recrean a los muertos también ha aumentado las capacidades de las herramientas que replican digitalmente a los vivos. 

Silicon Intelligence ofrece ambos servicios. Cuando Sun y Sima lanzaron la compañía, se centraron en usar tecnologías de texto a voz para crear audio y luego usar esas voces generadas por IA en aplicaciones como llamadas automáticas.

Pero después de que la compañía replicó a la madre de Suns, se centró en generar avatares realistas. Esa decisión convirtió a la compañía en uno de los principales jugadores chinos que crean influencers impulsados por IA.
Su tecnología ha generado avatares para cientos de miles de videos y canales de transmisión similares a TikTok, pero Sima dice que más recientemente se ha visto que alrededor de 1,000 clientes lo usan para replicar a alguien que falleció. “Empezamos nuestro trabajo en ‘resurrection’ en 2019 y 2020,” dice, pero al principio la gente tardó en aceptarlo: “Nadie quería ser el primer adopters.” 

La calidad de los avatares ha mejorado, dice, lo que ha impulsado la adopción. Cuando el avatar se ve cada vez más realista y da menos respuestas fuera de carácter, es más fácil para los usuarios tratarlo como su familiar fallecido. Además, la idea se está popularizando a través de más representaciones en la TV china. 

Ahora Silicon Intelligence ofrece el servicio de replicación por un precio entre varios cientos y varios miles de dólares. El producto más básico viene como un avatar interactivo en una aplicación, y las opciones en el extremo superior de la gama a menudo implican más personalización y mejores componentes de hardware, como una tableta o una pantalla de visualización. Hay al menos un puñado más de empresas chinas que trabajan en la misma tecnología.

Un giro moderno en la tradición
El negocio en estas falsificaciones profundas se basa en la larga historia cultural de China de comunicarse con los muertos. 

En los hogares chinos, es común poner un retrato de un pariente fallecido durante unos años después de la muerte. Zhang Zewei, fundador de una empresa con sede en Shanghai llamada Super Brain, dice que él y su equipo querían renovar esa tradición con un marco de fotos “AI.” Crean avatares de seres queridos fallecidos que están precargados en una tableta Android, que parece un marco de fotos al ponerse de pie. Los clientes pueden elegir una imagen en movimiento que diga palabras extraídas de una base de datos fuera de línea o de un LLM. 

“En su esencia, no es muy diferente de un retrato tradicional, excepto que es interactivo,” dice Zhang.

Zhang dice que la compañía ha realizado réplicas digitales para más de 1,000 clientes desde marzo de 2023 y cobra $700 a $1,400, dependiendo del servicio comprado. La compañía planea lanzar pronto un producto solo para aplicaciones, para que los usuarios puedan acceder a los avatares en sus teléfonos, y podría reducir aún más el costo a alrededor de $140.
El propósito de sus productos, dice Zhang, es terapéutico. “Cuando realmente extrañas a alguien o necesitas consuelo durante ciertas vacaciones, puedes hablar con la vida artificial y curar tus heridas internas,”, dice.

E incluso si esa conversación es en gran medida unilateral, eso está en consonancia con una fuerte tradición cultural. Cada abril, durante el festival Qingming, los chinos barren las tumbas de sus antepasados, queman palos de joss y papel moneda falso, y les cuentan lo que sucedió el año pasado. Por supuesto, esas conversaciones siempre han sido unidireccionales. 

Pero ese no es el caso para todos los servicios de Super Brain. La compañía también ofrece videollamadas profundas en las que un empleado de la compañía o un terapeuta contratado finge ser el pariente que falleció. Usando DeepFace, una herramienta de código abierto que analiza las características faciales, la cara de la persona fallecida se reconstruye en 3D y se intercambia por la cara de la persona viva con un filtro en tiempo real. 
En el otro extremo de la llamada suele haber un familiar anciano que puede no saber que el pariente ha muerto—y cuya familia ha organizado la conversación como una artimaña. 

Ejemplo de una video llamada profunda que Super Brain hizo en julio de 2023. La cara en la esquina superior derecha es del hijo fallecido de la mujer.
 

Jonathan Yang, un residente de Nanjing que trabaja en la industria tecnológica, pagó por este servicio en septiembre de 2023. Su tío murió en un accidente de construcción, pero la familia dudó en decirle a la abuela de Yangi, que tiene 93 años y mala salud. Les preocupaba que ella no sobreviviera a las noticias devastadoras.

Entonces Yang pagó $1,350 para encargar tres llamadas falsas de su tío muerto. Le dio a Super Brain un puñado de fotos y videos de su tío para entrenar a la modelo. Luego, en tres vacaciones chinas, un empleado de Super Brain video llamado abuela de Yangsán y le dijo, como su tío, que estaba ocupado trabajando en una ciudad lejana y que no podría volver a casa, incluso durante el Año Nuevo Chino. 

“El efecto ha cumplido mis expectativas. Mi abuela no sospechaba nada,” Yang dice. Su familia tenía opiniones mixtas sobre la idea, porque algunos familiares pensaron que tal vez ella hubiera querido ver el cuerpo de su hijo antes de que fuera incinerado. Aún así, toda la familia se subió a bordo al final, creyendo que la artimaña sería mejor para su salud. Después de todo, es bastante común que las familias chinas digan “necessary” mentiras para evitar abrumar a las personas mayores, como se muestra en la película La Adiós. 

Para Yang, un seguidor cercano de las tendencias de la industria de la IA, crear réplicas de los muertos es una de las mejores aplicaciones de la tecnología. “Representa mejor el calor [de la IA],”, dice. La salud de sus abuelas ha mejorado, y puede llegar un día en que finalmente le digan la verdad. Para entonces, dice Yang, puede comprar un avatar digital de su tío para que su abuela hable con él cada vez que lo extrañe.

¿Es la IA realmente buena para el dolor? 
A pesar de que la tecnología de clonación de IA mejora, existen algunas barreras importantes que impiden que más personas la usen para hablar con sus parientes muertos en China. 

En el lado tecnológico, existen limitaciones a lo que pueden generar los modelos de IA. La mayoría de los LLM pueden manejar idiomas dominantes como el Mandarín y el Cantonés, pero no pueden replicar los muchos dialectos de nicho en China. También es desafiante—y, por lo tanto, costoso— replicar movimientos corporales y expresiones faciales complejas en modelos 3D. 
Luego está el tema de los datos de capacitación. A diferencia de clonar a alguien que todavía está vivo, lo que a menudo implica pedirle a la persona que grabe los movimientos corporales o diga ciertas cosas, las replicaciones póstumas de IA deben confiar en cualquier video o foto que ya esté disponible. Y muchos clientes no tienen datos de alta calidad, o suficientes, para que el resultado final sea satisfactorio. 

Complicar estos desafíos técnicos son innumerables preguntas éticas. En particular, ¿cómo puede alguien que ya está muerto aceptar ser replicado digitalmente? Por ahora, compañías como Super Brain y Silicon Intelligence confían en el permiso de los miembros directos de la familia. Pero, ¿qué pasa si los miembros de la familia no están de acuerdo? Y si un avatar digital genera respuestas inapropiadas, ¿quién es el responsable?

Tecnología similar causó controversia a principios de este año. Según los informes, una empresa en Ningbo utilizó herramientas de IA para crear videos de celebridades fallecidas y publicarlos en las redes sociales para hablar con sus fanáticos. Los videos se generaron utilizando datos públicos, pero sin buscar ninguna aprobación o permiso. El resultado fue intensas críticas de las celebridades ’ familias y fanáticos, y los videos finalmente fueron eliminados.