Nuevos modelos de IA generativa

Cada semana te mostramos nuevas herramientas disponibles, siempre más en el newsletter Comunicación de Esteban Concia.

Compartí la noticia

Modelo de texto a voz

Dia es un modelo de texto a voz de 1,6 millones de parámetros creado por Nari Labs. Fue empujado al Hub usando la integración PytorchModelHubMixin.

Dia genera directamente un diálogo altamente realista a partir de una transcripción. Puedes condicionar la salida al audio, habilitando el control de la emoción y el tono. El modelo también puede producir comunicaciones no verbales como risas, tos, aclarar la garganta, etc.

Para acelerar la investigación, estamos proporcionando acceso a los puntos de control de los modelos preentrenados y al código de inferencia. Los pesos de los modelos están alojados en Hugging Face. El modelo solo admite la generación inglesa en este momento.

https://huggingface.co/spaces/nari-labs/Dia-1.6B

Cada semana te mostramos nuevas herramientas disponibles, siempre más en el newsletter Comunicación de Esteban Concia.

Aprenderás a usar la función Elementos de Kling AI para transformar imágenes estáticas de productos en vídeos animados profesionales para marketing en todas las plataformas.

Paso a paso:

1. Abre la sección "Imagen a Vídeo" de Kling AI y selecciona la pestaña "Elementos".

2. Sube la imagen de tu producto como elemento principal (de alta calidad y con un fondo limpio) y añade elementos complementarios como accesorios o elementos contextuales para realzar su atractivo.

3. Escribe una propuesta específica que describa la escena ideal para la presentación de tu producto.

4. Haz clic en "Generar" para crear tu vídeo de producto profesional, listo para todos los canales de marketing.v