Gemini 2.5 pro - El nuevo modelo
Hoy presentamos Gemini 2.5, nuestro modelo de IA más inteligente. Nuestra primera versión 2.5 es una versión experimental de 2.5 Pro, que es lo último en una amplia gama de puntos de referencia y debuta en el puesto número 1 en LMA por un margen significativo.
Los m odelos Gemini 2.5 son modelos de pensamiento, capaces de razonar sus pensamientos antes de responder, lo que resulta en un mejor rendimiento y precisión.
En el campo de la IA, la capacidad de “razonamiento” de un sistema se refiere a algo más que clasificación y predicción. Se refiere a su capacidad para analizar información, sacar conclusiones lógicas, incorporar contexto y matices y tomar decisiones informadas.
Durante mucho tiempo, hemos explorado formas de hacer que la IA sea más inteligente y más capaz de razonar mediante técnicas como aprendizaje por refuerzo y cadena de pensamientos . Sobre esta base, recientemente presentamos nuestro primer modelo de pensamiento, Pensamiento flash Gemini 2.0 .
Ahora, con Gemini 2.5, hemos logrado un nuevo nivel de rendimiento al combinar un modelo base significativamente mejorado con un post-entrenamiento mejorado. En el futuro, estamos construyendo estas capacidades de pensamiento directamente en todos nuestros modelos, para que puedan manejar problemas más complejos y soportar agentes aún más capaces y conscientes del contexto.
Razonamiento mejorado
Gemini 2.5 Pro es lo último en tecnología en una variedad de puntos de referencia que requieren un razonamiento avanzado. Sin técnicas de tiempo de prueba que aumentan el costo, lidera en puntos de referencia en matemáticas y ciencias como GPQA y AIME 2025.
También obtiene una puntuación de 18,8% en modelos sin uso de herramientas en Humanity's Last Exam, un conjunto de datos diseñado por cientos de expertos en la materia para capturar la frontera humana del conocimiento y el razonamiento.
Nos hemos centrado en el rendimiento de la codificación y con Gemini 2.5 hemos logrado un gran salto con respecto a 2.0, con más mejoras por venir. 2.5 Pro se destaca en la creación de aplicaciones web visualmente atractivas y aplicaciones de código agente, junto con la transformación y edición de código. En SWE-Bench Verified, el estándar de la industria para evaluaciones de códigos de agente, Gemini 2.5 Pro obtiene una puntuación del 63,8 % con una configuración de agente personalizada.
A continuación se muestra un ejemplo de cómo 2.5 Pro puede usar sus capacidades de razonamiento para crear un videojuego produciendo el código ejecutable a partir de una sola línea. https://youtu.be/RLCBSpgos6s?si=YqmXtKUxfDOQkXnx
Aprovechando lo mejor de Gemini
Gemini 2.5 se basa en lo que hace que los modelos Gemini sean excelentes: multimodalidad nativa y una ventana de contexto amplia. 2.5 Pro se entrega hoy con una ventana de contexto de 1 millón de tokens (2 millones próximamente), con un sólido rendimiento que mejora con respecto a las generaciones anteriores. Puede comprender vastos conjuntos de datos y manejar problemas complejos de diferentes fuentes de información, incluidos texto, audio, imágenes, video e incluso repositorios de código completos.
Los desarrolladores y las empresas pueden comenzar a experimentar con Gemini 2.5 Pro en Google AI Studio ahora, y los usuarios de Gemini Advanced pueden seleccionarlo en el menú desplegable de modelos en computadoras de escritorio y dispositivos móviles. Estará disponible en Vertex AI en las próximas semanas.
Como siempre, agradecemos los comentarios para que podamos continuar mejorando las impresionantes nuevas habilidades de Gemini a un ritmo rápido, todo con el objetivo de hacer que nuestra IA sea más útil.