Este miércoles, el CEO y cofundador de Google DeepMind, Demis Hassabis, junto al CEO de Google, Sundar Pichai, anunciaron el lanzamiento de Gemini. Se trata de un nuevo tipo de Inteligencia Artificial (IA), que cuenta con un innovador modelo de lenguaje que, según afirmó la empresa en su blog, supera a GPT-4 de OpenAI.
De acuerdo al comunicado oficial, Gemini es “un modelo de IA multimodal, lo que significa que puede generar y comprender, operar y combinar a la perfección diferentes tipos de información; incluyendo texto, imágenes, audios, videos y lenguajes de programación”.
La principal novedad es la optimización de Gemini 1.0, su versión original, que se subdivide en tres dimensiones. Ultra es el modelo de mayor capacidad y tamaño para la realización de tareas más complejas, y compite con las funciones gratuitas de Chat GPT. En tanto, Pro abarca una amplia gama de tareas más cotidianas. Por último, Nano es el más simple pero eficiente para su uso en dispositivos móviles.
Estas diversas adaptaciones permiten su ejecución en aparatos de diferentes magnitudes, lo que posibilita que les desarrolladores lo utilicen en el mundo de los negocios como así también les consumidores. Quienes estuvieron a cargo del proyecto más grande de la compañía fueron les miembres de Google DeepMind y Google Research.
Gemini es un modelo de IA multimodal de forma nativa, lo que significa que fue preparada desde el comienzo para adaptarse a distintas modalidades. Luego, se buscó su perfeccionamiento mediante datos multimodales adicionales para facilitar su comprensión y razonamiento sobre todo tipo de entradas. Al respecto, les especialistas explicaron que esta IA es “mucho mejor que los modelos multimodales existentes, y sus capacidades son de vanguardia en casi todos los ámbitos”.
¿Cuándo y dónde estará disponible?
Google Bard es un bot conversacional de IA que fue desarrollado por Google, y está basado en la familia PaLM 2. Desde la fecha del anuncio, Gemini puede utilizarse en esta aplicación la versión Pro, la cual se encuentra disponible en inglés para más de 170 países y territorios, menos en Europa. Esto logra que Bard aumente su efectividad en comprender, resumir, razonar, generar ideas, escribir y planificar.
Por su parte, el Pixel 8 Pro es una de las grandes apuestas de celulares para la gama alta de 2023 y un firme candidato para la lista de los mejores móviles del momento. Esta creación de Google correrá la IA de tipo Nano con la que se podría resumir en la grabadora de voz, sumar la redacción Inteligente en Gboard en WhatsApp. Como proyecto para el año entrante se sumarán otras aplicaciones de mensajes de texto.
Desde el 13 de diciembre, desarrolladores y clientes podrán vivir la experiencia Pro a través de la API de Gemini en Google AI Studio, una herramienta web gratuita que ayuda a desarrolladores a prototipar y lanzar aplicaciones de manera rápida y sencilla.
Además, ese día también se habilitará su disponibilidad en Vertex AI. Esto permitirá una personalización de Gemini con control total sobre los datos y, a su vez, suma los beneficios de Google Cloud como seguridad, privacidad, gobernanza de datos y compliance de nivel corporativo.