6 de diciembre 2023 - 13:57

Google presentó a Gemini, su modelo de Inteligencia Artificial más avanzado

Este tipo de lenguaje se trata del proyecto científico y de investigación más grande de la compañía hasta el momento. Cómo funciona.

Google presentó una serie de anuncios sobre un importante avance en materia de Inteligencia Artificial: el nuevo modelo de lenguaje Gemini. Esta novedad atraviesa al mundo de los negocios, IT, desarrolladores y consumidores, a continuación les compartimos un resumen de los principales anuncios junto a links a los blogs oficiales más útiles.

Gemini es el resultado de los esfuerzos colaborativos a gran escala por parte de distintos equipos de Google, incluidos Google DeepMind y Google Research y se trata del proyecto científico y de investigación más grande de la compañía hasta el momento.

Se ha optimizado Gemini 1.0, la primera versión de este modelo, en tres dimensiones diferentes:

Gemini Ultra: el modelo de mayor capacidad y tamaño para tareas complejas
Gemini Pro: el mejor modelo para escalar una amplia gama de tareas
Gemini Nano: el modelo más eficiente para tareas en dispositivos móviles.

¿Qué es Gemini?

Es un modelo de Inteligencia Artificial multimodal, lo que significa que puede generar y comprender, operar y combinar a la perfección diferentes tipos de información, incluyendo texto, imágenes, audios, videos y lenguajes de programación.

También es el modelo más flexible hasta el momento, capaz de ejecutarse eficientemente en cualquier dispositivo, desde móviles hasta centros de datos. Gemini mejorará significativamente la forma en la que los clientes corporativos y desarrolladores construyen y escalan con IA.

Basado en tecnología de última generación

Hasta el momento, el método estándar para crear modelos multimodales consistía en entrenar componentes separados para distintas modalidades, y luego unirlos para imitar a grandes rasgos algunas de sus funciones. A veces, estos modelos pueden ser buenos en determinadas tareas, como la descripción de imágenes, pero tienen algunas dificultades con el razonamiento más conceptual y complejo.

Por eso, la compañía diseñó Gemini para que fuera un modelo de IA multimodal de forma nativa, es decir, previamente entrenado en diferentes modalidades (y desde el inicio). Se perfeccionó con datos multimodales adicionales para poder mejorar su eficacia. Esto ayuda a Gemini a comprender y razonar sin problemas todo tipo de entradas desde el principio, mucho mejor que los modelos multimodales existentes, y sus capacidades son de vanguardia en casi todos los ámbitos.

Pruebas comparativas

Este nuevo modelo de IA se ha puesto a prueba rigurosamente y evaluando su rendimiento en una amplia variedad de tareas que abarcan: desde la comprensión de imágenes naturales, audio y video, hasta codificación y el razonamiento matemático. El desempeño de Gemini Ultra supera 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de grandes modelos lingüísticos. Podrán conocer más en este documento técnico, haciendo clic acá.

Gemini 1.0 se encontrará disponible en una serie de productos y plataformas:

Para usuarios

A partir de hoy, Bard con Gemini Pro estará disponible en inglés en más de 170 países y territorios.. Esta herramienta será más capaz en cuestiones como comprender y resumir, razonar, generar ideas, escribir y planificar. Esta es la mayor mejora de calidad de Bard desde su lanzamiento.
También se llevará “Gemini” a Pixel . Pixel 8 Pro es el primer teléfono inteligente diseñado para ejecutar Gemini Nano que impulsa nuevas funciones como resumir en la aplicación de Grabadora e implementar Redacción Inteligente en Gboard, comenzando con WhatsApp, y el próximo año se incluirán más aplicaciones de mensajería.
Como parte de las exhaustivas verificaciones de confianza y seguridad de Gemini Ultra, Google lo pondrá a disposición de clientes, desarrolladores, socios y expertos en seguridad y responsabilidad seleccionados para que experimenten y den su opinión antes de lanzarlo para desarrolladores y clientes corporativos, a principios del año que viene.
A principios del 2024, la compañía lanzará Bard Advanced: una nueva experiencia de IA avanzada mediante la que podrá acceder a los mejores modelos y capacidades, comenzando por Gemini Ultra.
Y ya estamos trabajando para que Gemini potencie otros productos como Search, Chrome, nuestros anuncios y Duet AI.

Para clientes y desarrolladores

A partir del 13 de diciembre, desarrolladores y clientes podrán acceder a Gemini Pro a través de la API de Gemini en Google AI Studio y en Vertex AI.
Ai Studio es una herramienta web gratuita que ayuda a desarrolladores a prototipar y lanzar aplicaciones de manera rápida y sencilla.
Vertex AI, por su parte, permite una personalización de Gemini con control total sobre los datos y suma los beneficios de Google Cloud como seguridad, privacidad, gobernanza de datos y compliance de nivel corporativo.
Los desarrolladores de Android podrían crear aplicaciones sobre Gemini Nano, nuestro modelo más eficiente para dispositivos móviles, a través de AI Core.

De cara al futuro

La versión Ultra de Gemini se encuentra ahora en etapa de pruebas de seguridad con socios externos y la abriremos a un grupo de usuarios, desarrolladores y clientes para una experimentación temprana a comienzos del próximo año.

La era Gemini

Esto es un hito importante en el desarrollo de la Inteligencia Artificial y el comienzo de una nueva era para Google, a medida que continúa innovando rápidamente y avanzando de manera responsable en las capacidades de cada uno de los nuevos modelos. Hasta el día de hoy, la compañía ha alcanzado grandes progresos con Gemini y seguirá trabajando arduamente para ampliar aún más sus capacidades para versiones futuras.

Temas

Google
Inteligencia Artificial

SUMATE A LA COMUNIDAD DE ÁMBITO

Google presentó a Gemini, su modelo de Inteligencia Artificial más avanzado

Este tipo de lenguaje se trata del proyecto científico y de investigación más grande de la compañía hasta el momento. Cómo funciona.

Cambios en el Dow Jones: entra Alphabet y sale Verizon

El homenaje oculto de Google a Messi tras convertirse en el máximo goleador de los mundiales

Se ha optimizado Gemini 1.0, la primera versión de este modelo, en tres dimensiones diferentes:

¿Qué es Gemini?

Gemini 1.0 se encontrará disponible en una serie de productos y plataformas:

Te puede interesar

Un país prohíbe la Inteligencia Artificial a niños en las escuelas: los motivos detrás de la polémica medida

OpenAI lanza "Jalapeño", su primer procesador diseñado para modelos de IA

GTA VI: cuánto cuesta, qué incluye cada edición y cuándo se lanza el esperado videojuego

Anthropic denuncia que Alibaba usó 25.000 cuentas falsas para acceder a Claude y replicar su IA

Otras noticias

Dólar hoy: a cuánto cotiza este viernes 26 de junio

Dólar blue hoy: a cuánto opera este viernes 26 de junio

Euro hoy y Euro blue hoy: a cuánto cotiza este viernes 26 de junio

Real blue: a cuánto opera este viernes 26 de junio

Temporada de recoger barriletes del carry trade; ahora sopla sudestada y el segundo semestre lo sabe

No tires tus dólares: cuáles son los recuerdos del Mundial 2026 que realmente valen la pena comprar

Dólar: el BCRA ya compró más de u$s11.000 millones en 2026

Euro hoy y Euro blue hoy: a cuánto cotizó este jueves 25 de junio