abril 22, 2025

Google presenta su modelo de IA más avanzado, Gemini 2.5 Pro, que ya está disponible

Google ha anunciado el lanzamiento de Gemini 2.5 Pro, su modelo de inteligencia artificial (IA) más avanzado hasta la fecha. Este nuevo algoritmo destaca por sus potentes capacidades de razonamiento y programación, lo que le ha permitido superar a la competencia en la mayoría de las pruebas estándar de rendimiento.

Koray Kavukcuoglu, director tecnológico de Google DeepMind, afirma que Gemini 2.5 Pro tiene la capacidad de «razonar sus pensamientos» antes de emitir una respuesta, lo que optimiza su rendimiento y mejora la precisión de los resultados. Esto significa que la nueva IA puede analizar grandes volúmenes de datos, extraer conclusiones lógicas, incorporar contextos y tomar decisiones fundamentadas.


Un collage fotográfico de un rostro representado en cuadrados yuxtapuesto frente a dos brazos robóticos.
Google Presenta Gemini Robotics, una IA para robots humanoides
Google presenta su nuevo modelo de inteligencia artificial que dota de más inteligencia a los humanoides y otros robots, y una herramienta diseñada para darles una brújula moral.


Avances Tecnológicos en Gemini 2.5 Pro

El funcionamiento de esta versión de Gemini se fundamenta en técnicas de aprendizaje por refuerzo y en la inducción de cadenas de pensamiento. Google ya había utilizado estas metodologías en el desarrollo de Gemini 2.0 y Gemini 2.0 Flash Thinking, pero sostiene que con su nuevo modelo ha alcanzado un estándar de rendimiento superior. La compañía explica que su algoritmo más reciente combina un modelo base significativamente mejorado con un proceso de post-entrenamiento avanzado. Esto le permite abordar problemas más complejos en diversas áreas y ofrecer soporte a agentes de IA con mayores capacidades y sensibilidad contextual.

Kavukcuoglu resalta las habilidades de codificación de Gemini 2.5 Pro, que sobresale en la creación de aplicaciones web visuales, herramientas con agentes de código (agentic code) y edición de código. En la evaluación SWE-Bench Verified, un estándar para agentic code, el modelo alcanzó un 63.8 % con configuración de agente personalizada.

Leer:  Cómo saber si tu hijo está bien: señales psicológicas que no debes ignorar

Capacidades Multimodales y Futuras Expansiones

El nuevo sistema de IA admite entradas multimodales, lo que significa que puede procesar texto, audio, imágenes, videos y grandes conjuntos de datos. La propuesta se presenta en el mercado con una ventana de comprensión de contexto de 1 millón de tokens, aunque se anticipa que este parámetro se ampliará a 2 millones en el futuro.

Noticias relacionadas