- Google Whisk utiliza imágenes como entrada en lugar de indicaciones basadas en texto
- Está construido sobre el modelo de inteligencia artificial creativa de Google Imagen 3.
- La herramienta experimental se puede probar de forma gratuita para los usuarios de EE. UU.
La nueva herramienta de inteligencia artificial de Google facilita la creación y remezcla de conceptos visuales. En lugar de pedirle que describa lo que tiene en mente, Whisk le permite ingresar tres indicaciones de imagen: una para el tema, otra para la escena y otra para el estilo. La espuma se encarga del resto, lo que la convierte en una forma más intuitiva de experimentar con diferentes ideas.
Si bien la mayoría de los mejores generadores de imágenes de IA requieren que escribas un mensaje detallado, Whisk lo maneja detrás de escena. Cuando colocas imágenes en la interfaz web de Whisk como inspiración, el modelo Gemini de Google las analiza automáticamente y escribe un título detallado para cada una. Luego se introducen en el modelo de Imagen 3 para crear una imagen coincidente.
Por ejemplo, puedes poner una imagen de un coche como tema y una imagen de un campo como escena. Puedes agregar acuarela como estilo para ver qué crea la espuma. Haga clic en el botón y obtendrá un par de imágenes basadas en su entrada.
Desde aquí, es fácil remezclar las imágenes. La interfaz le permite especificar detalles adicionales basados en texto para ajustar los resultados. También puedes insertar fácilmente diferentes imágenes de origen o tirar los dados si necesitas inspiración. Los nuevos resultados aparecen en pares en el feed, lo que lo convierte en una forma intuitiva de generar ideas. También puede optar por refinar las imágenes revelando el mensaje de texto y agregando más detalles.
batirlo
Si bien Whisk está diseñado para eliminar la necesidad de instrucciones basadas en texto, Google incluye la opción de refinar las instrucciones escritas porque los resultados no siempre coinciden con el material original.
b un Publicación de blog Respecto a la herramienta experimental, Google explica que Whisk “captura la esencia de tu tema, no una réplica exacta”. Es tan efectivo como el análisis que hace Gemini de las imágenes que envías. Si bien en general es muy impresionante, también es incapaz de entrar en tu mente: podrías esperar que Whisk extraiga un detalle de una imagen y se centre en otro.
La publicación explica además: “Debido a que Foam extrae solo algunas características clave de su imagen, puede crear imágenes que sean diferentes de sus expectativas. Por ejemplo, el sujeto resultante puede tener una altura, peso, peinado o tono de piel diferente. Entendemos que estas características pueden ser críticas para su proyecto y Whisk podría no dar en el blanco, por lo que le permitimos ver y editar las pautas básicas en cualquier momento”.
Incluso con estos inconvenientes, cree una aplicación interesante de las herramientas de inteligencia artificial existentes de Google. Los modelos creativos básicos son los mismos que si estuvieras chateando con Gemini a través de su interfaz de texto. Sin embargo, al depender de la entrada de imágenes, Whisk es una forma más accesible e intuitiva para que los creadores visuales jueguen con sus ideas.
Basándose en los primeros comentarios de los creativos digitales, Google se refiere a Whisk como “un nuevo tipo de herramienta creativa” diseñada para “una exploración visual rápida, no para ediciones perfectas en píxeles”.
Cómo probar Google Whisk
Actualmente, Google Whisk solo está disponible para usuarios de EE. UU. Si reside allí, puede probarlo a través de su navegador web en labs.google/whisk.
Jugar con la herramienta experimental es completamente gratuito. Los datos de su experiencia con Whisk se enviarán a Google para ayudar a perfeccionar y desarrollar futuros productos de IA.