Google afirma que su generador de imágenes Imagen 3 supera a DALL-E 3. Cómo probarlo por ti mismo

Con tantos chatbots de inteligencia artificial en el mercado, elegir el mejor puede ser un desafío. Para intentar resolver esta cuestión, Google DeepMind enfrentó a los principales chatbots entre sí y descubrió que los usuarios están más impresionados con un generador de imágenes en particular: Imagen 3.

Además: Acabo de probar el generador de imágenes AI ImageFX de Google, y estoy sorprendido de lo bueno que es

Un informe publicado el miércoles detalla cómo Google DeepMind evaluó el rendimiento de Imagen 3 en comparación con su predecesor, Imagen 2, y con modelos externos líderes, incluidos DALL-E 3, Midjourney v6, Stable Diffusion 3 Large y Stable Diffusion XL 1.0, tanto en evaluaciones humanas como automáticas.

Las evaluaciones humanas probaron cinco aspectos de calidad de los modelos de generación de imágenes a partir de texto: preferencia, alineación de la imagen con el mensaje, atractivo visual, alineación detallada de la imagen con el mensaje y razonamiento numérico.

En la categoría de preferencia general, que mide cuán satisfecho estaba un usuario con la imagen en comparación con el mensaje de entrada, Imagen 3 ganó con una ventaja significativa sobre la competencia, como se muestra en la imagen a continuación:

Imagen 3 también tuvo un rendimiento competitivo en las otras categorías de evaluación humana, así como en las evaluaciones automáticas, que probaron nuevamente la alineación del mensaje con la imagen y la calidad de la imagen.

“En general, Imagen 3 claramente lidera en la alineación del mensaje con la imagen, especialmente en mensajes detallados y habilidades de conteo; mientras que en atractivo visual, Midjourney v6 toma la delantera, con Imagen 3 en segundo lugar”, concluyó el informe.

“Al considerar todos los aspectos de calidad, Imagen 3 claramente lidera en la preferencia general, lo que indica que logra el mejor equilibrio entre salidas de alta calidad que respetan la intención del usuario”.

¿Suena demasiado bueno para ser verdad? Aquí te mostramos cómo puedes probar Imagen 3 en ImageFX, una herramienta en Google Labs que permite a las personas crear imágenes con simples mensajes de texto.

Cómo usar ImageFX

ImageFX está disponible a través de Google Labs, la plataforma de la compañía para probar ideas y productos. Al igual que en otros experimentos de Google Labs, acceder a la herramienta es fácil y gratuito.

Todo lo que tienes que hacer es visitar Google Labs y seleccionar ImageFX o visitar la página de ImageFX directamente. Luego, inicia sesión en tu cuenta personal de Google y comienza a experimentar con la herramienta. Como con cualquier otro generador de imágenes a partir de texto, escribe un mensaje conversacional con lo que te gustaría ver renderizado.

Además: Los mejores generadores de imágenes AI de 2024: Probados y revisados

Una ventaja de ImageFX es su toque divertido: una interfaz de mensajes que incluye “fichas expresivas” que puedes usar para experimentar con “dimensiones adyacentes de tu creación e ideas”, según Google. Una vez que escribes un mensaje, aparecerá un interruptor en palabras seleccionadas de tu mensaje, lo que sugiere formas nuevas y divertidas de ajustarlo.

Cada generación rendereará cuatro imágenes de alta calidad que podrás disfrutar. En mi experiencia, ImageFX incluso rindió bien las manos. Las manos suelen ser un tema complicado para los generadores de imágenes.