Hace dos años, OpenAI inició la moda de los chatbots con el lanzamiento de ChatGPT. Ahora espera despertar el interés en una nueva ola de tecnología de inteligencia artificial.
El jueves, OpenAI presentó una herramienta llamada Operador que puede conectarse a Internet y realizar tareas de forma autónoma, como comprar alimentos o hacer una reserva en un restaurante.
“Puede navegar por sitios web y realizar acciones en sitios web, como usted y yo”, dijo en una entrevista el líder de ingeniería y productos de OpenAI, Yash Kumar.
Los investigadores de inteligencia artificial llaman a estas tecnologías agentes de IA. Mientras que los chatbots pueden responder preguntas, escribir poemas y crear imágenes, los agentes pueden utilizar otro software en Internet.
Durante una sesión informativa con The New York Times, Kumar demostró cómo el sistema podía hacer una reserva en un restaurante de San Francisco a través del sitio web OpenTable y comprar una lista de compras a través de Instacart. El operador se ve y se comporta de manera muy similar a ChatGPT y otros chatbots. El usuario escribe una solicitud en una ventana pequeña. Entonces el sistema responde lo mejor que puede.
La herramienta abre un navegador web y permite al usuario ver sitios específicos a medida que los visita. Los operadores pueden cometer errores. Pero en algunos casos, puede corregir estos errores. Durante la manifestación para The Times, el sistema asumió incorrectamente que el Sr. Kumar estaba en Iowa, antes de encontrar correctamente un restaurante en San Francisco.
Los operadores no son completamente autónomos. En ocasiones, un usuario necesita corregir sus errores y realizar solicitudes y sugerencias adicionales. Para sitios como OpenTable e Instacart, los usuarios deben proporcionar su nombre de usuario y contraseña personales. Pero OpenAI dice que no almacena esta información personal.
Sin embargo, la empresa captura datos que muestran cómo el sistema interactúa con los usuarios y accede a los sitios en su nombre. Puede utilizar estos datos para entrenar versiones futuras del operador.
OpenAI dijo que, a partir del jueves, el operador estará disponible para cualquiera que se suscriba a ChatGPT Pro, un servicio de 200 dólares al mes que brinda acceso a todas las herramientas más recientes de la compañía. Planea ofrecer la herramienta a través de otros servicios pagos y eventualmente implementarla en la versión gratuita de ChatGPT. Los usuarios estadounidenses serán los primeros en obtener la nueva herramienta.
(El New York Times ha demandado a OpenAI y su socio Microsoft, alegando infracción de derechos de autor del contenido de noticias sobre sus sistemas de inteligencia artificial. OpenAI y Microsoft han negado los reclamos).
En los últimos meses, otras empresas líderes, incluidas Google y Anthropic, han presentado herramientas similares. Sin embargo, muchas de estas herramientas aún no están ampliamente disponibles.
El operador se basa en la misma tecnología que sustenta ChatGPT. Esta tecnología es lo que los investigadores de IA llaman una red neuronal: un sistema matemático que puede aprender habilidades analizando grandes cantidades de datos.
Las versiones más nuevas de esta tecnología aprenden de una amplia gama de datos, incluidos texto, imágenes y sonidos. En este caso, el operador aprende a través de imágenes cómo la gente utiliza las hojas de cálculo, los sitios de compras y otros servicios en línea. Después de identificar patrones en estos datos, el nuevo sistema puede ofrecer servicios similares a los usuarios de computadoras.
Kumar reconoció que, al igual que ChatGPT y otros chatbots, Operador sigue siendo una tecnología experimental. Pero dijo que seguirá mejorando en los próximos meses.
“No es la cosa más poderosa del mundo”, dijo. “Pero es mucho mejor que este tipo de tecnología”.