2023 será con mucha inteligencia artificial

Inteligencia artificial generativa será la disputa de las plataformas

Cómo China está construyendo un universo de IA generativo paralelo Las compañías tecnológicas chinas se apresuran a igualar la difusión estable y DALL-E 2, pero los obstáculos están por delante

3 01 2023

El salto que los modelos de aprendizaje automático han demostrado en los últimos meses es entusiasmar a todos con el futuro de la IA —, pero también nervioso sobre sus incómodas consecuencias.

Después de que las herramientas de texto a imagen de Stability AI y OpenAI se convirtieran en la conversación de la ciudad, la capacidad de ChatGPT para mantener conversaciones inteligentes es la nueva obsesión en sectores en general.

En China, donde la comunidad tecnológica siempre ha observado de cerca el progreso en Occidente, los empresarios, investigadores e inversores están buscando formas de hacer mella en el espacio generativo de IA. Las empresas tecnológicas están diseñando herramientas basadas en modelos de código abierto para atraer clientes de consumidores y empresas.

Las personas están aprovechando el contenido generado por IA. Los reguladores han respondido rápidamente para definir cómo se debe usar la síntesis de texto, imagen y video. Mientras tanto, las sanciones tecnológicas de EE. UU. Están generando preocupación sobre la capacidad de China para mantenerse al día con el avance de la IA.

A medida que la IA generativa asalta el mundo hacia fines de 2022, echemos un vistazo a cómo esta tecnología explosiva está sacudiéndose en China.

Sabores chinos
Gracias a las plataformas de creación de arte viral como Stable Diffusion y DALL-E 2, la IA generativa está repentinamente en boca de todos. A mitad de camino en todo el mundo, los gigantes tecnológicos chinos también han cautivado al público con sus productos equivalentes, agregando un giro para adaptarse a los gustos y el clima político del país.

Baidu, que se hizo famoso en los motores de búsqueda y en los últimos años ha estado intensificando su juego en conducción autónoma, opera ERNIE-ViLG, una Modelo de parámetros de 10 mil millones capacitado en un conjunto de datos de 145 millones de pares de texto de imagen chinos. ¿Cómo es justo contra su contraparte estadounidense? A continuación se presentan los resultados de los rápidos niños “ que comen shumai en el barrio chino de Nueva York ” dados a Difusión estable, frente al mismo mensaje en chino ( 車唐人小手 ງ )

Como alguien que creció comiendo dim sum en China y Chinatowns, diría que los resultados son un empate. Ninguno de los dos obtuvo el shumai correcto, que, en el contexto de dim sum, es un tipo de suculentas, camarones y bola de masa de cerdo en una envoltura amarilla medio abierta. Mientras que la difusión estable clava la atmósfera de un restaurante de dim sum de Chinatown, su shumai está apagado ( pero veo a dónde va la máquina ). Y mientras ERNIE-ViLG genera un tipo de shumai, es una variedad más comúnmente vista en el este de China que en la versión cantonesa.

La prueba rápida refleja la dificultad de capturar matices culturales cuando los conjuntos de datos utilizados están inherentemente sesgados — suponiendo que la difusión estable tendría más datos sobre la diáspora china y ERNIE-ViLG probablemente sea entrenado en una mayor variedad de imágenes de shumai que son más raras fuera de China.

Otra herramienta china que ha hecho ruido es Tencent's Diferentes dimensiones me, que puede convertir fotos de personas en personajes de anime. El generador de IA exhibe su propio sesgo. Destinado a usuarios chinos, despegó inesperadamente en otras regiones amantes del anime como América del Sur. Pero los usuarios pronto se dieron cuenta de que la plataforma no pudo identificar individuos negros y de mayor tamaño, grupos que faltan notablemente en el anime japonés, lo que lleva a resultados ofensivos generados por IA.

Además de ERNIE-ViLG, otro modelo chino de texto a imagen a gran escala es Taiyi, una creación de IDEA, un laboratorio de investigación dirigido por el reconocido informático Harry Shum, quien cofundó la sucursal de investigación más grande de Microsoft fuera de los EE. UU., Microsoft Research Asia. El modelo de IA de código abierto está capacitado en 20 millones de pares de texto de imagen chinos filtrados y tiene mil millones parámetros.

A diferencia de Baidu y otras empresas tecnológicas con fines de lucro, IDEA es una de las pocas instituciones respaldadas por los gobiernos locales en los últimos años para trabajar en tecnologías de vanguardia. Eso significa que el centro probablemente disfruta de más libertad de investigación sin la presión de impulsar el éxito comercial. Con sede en el centro tecnológico de Shenzhen y con el apoyo de una de las ciudades más ricas de China, es un atuendo prometedor que vale la pena ver.

Reglas de IA
Las herramientas de IA generativas de China no solo se caracterizan por los datos domésticos de los que aprenden; También están formados por las leyes locales. Como revisión tecnológica del MIT señalado, El modelo de texto a imagen de Baidu filtra palabras clave políticamente sensibles. Eso es de esperar, dada la censura ha sido durante mucho tiempo una práctica universal en Internet chino.

Lo que es más significativo para el futuro del campo incipiente es el nuevo conjunto de medidas regulatorias dirigidas a lo que el gobierno llama tecnología de síntesis profunda “ ”, que denota tecnología “ que utiliza aprendizaje profundo, realidad virtual y otros algoritmos de síntesis para generar texto, imágenes, audio, video y escenas virtuales. ”Al igual que con otros tipos de servicios de Internet en China, desde juegos hasta redes sociales, se les pide a los usuarios que verifiquen sus nombres antes de usar aplicaciones de IA generativas. El hecho de que las indicaciones se puedan rastrear a la identidad real de uno inevitablemente tiene un impacto restrictivo en el comportamiento del usuario.

Pero en el lado positivo, estas reglas podrían conducir a un uso más responsable de la IA generativa, que ya se está abusando en otros lugares para producir NSFW y contenido sexista. La regulación china, por ejemplo, prohíbe explícitamente a las personas generar y difundir noticias falsas creadas por IA. Sin embargo, cómo se implementará eso recae en los proveedores de servicios.