abril 22, 2025

DeepSeek-R1 reta a OpenAI o1: el innovador modelo de IA chino que entusiasma a expertos en EE UU

DeepSeek-R1 es un innovador modelo de inteligencia artificial (IA) desarrollado en China que ha captado la atención tanto de la comunidad científica como del sector tecnológico. Este avance se presenta como una opción más económica y accesible en comparación con algoritmos avanzados de razonamiento, como los de OpenAI.

El algoritmo, creado por la startup DeepSeek, ha demostrado un rendimiento comparable al del sistema más avanzado de OpenAI, liderado por Sam Altman, en la resolución de problemas matemáticos, químicos y de programación. Según un documento técnico publicado en la revista Nature, el modelo alcanza una precisión del 97% en la resolución de desafíos matemáticos evaluados con el parámetro MATH-500 y supera al 96% de los participantes humanos en las pruebas de programación de la iniciativa Codeforces.


DeepSeek-R1 en medio de las tensiones entre China y Estados Unidos

Al igual que su contraparte estadounidense, DeepSeek-R1 procesa las solicitudes a través de «cadenas de pensamiento» que simulan el razonamiento humano. Este modelo fue entrenado utilizando el funcionamiento del chatbot V3 de DeepSeek, aplicando técnicas de aprendizaje por refuerzo. En este proceso, los ingenieros recompensaron al sistema por alcanzar respuestas correctas y por describir su «pensamiento» durante la resolución de problemas. Además, se utilizó una arquitectura de «mezcla de expertos», que permite al modelo decidir qué redes de procesamiento activar para cada tarea específica.

El costo de entrenamiento de DeepSeek-R1 se aproxima a los 6 millones de dólares, una cifra notablemente inferior a los más de 60 millones que Meta invirtió en su modelo Llama 3.1. Este ahorro en recursos informáticos reduce drásticamente los precios de acceso para los usuarios. De hecho, el uso de DeepSeek-R1 representa solo una trigésima parte del costo asociado con el uso de OpenAI.

Leer:  Del 'guau' al wow: inteligencia artificial para interpretar los ladridos de los perros

Accesibilidad y colaboración internacional

Mario Krenn, director del Laboratorio de Ciencias Artificiales del Instituto Max Planck, destaca que «un experimento que costaba más de 300 libras con OpenAI ahora puede realizarse por menos de 10 dólares. Esta diferencia drástica influirá en la adopción futura del algoritmo chino».

DeepSeek-R1 ha sido publicado bajo una licencia del Instituto Tecnológico de Massachusetts como una herramienta «open-weight», lo que significa que sus cadenas de pensamiento son accesibles para investigadores y el modelo puede ser reutilizado sin restricciones. Sin embargo, no se considera completamente un producto de código abierto, ya que sus datos de entrenamiento no están disponibles. A pesar de esto, Marco Dos Santos, científico informático de la Universidad de Cambridge, afirma que la accesibilidad del programa «permite una mejor interpretación de los procesos de razonamiento del modelo».

Los expertos subrayan que DeepSeek-R1 ha sido desarrollado a pesar de los estrictos controles de exportación impuestos por Estados Unidos. Recientemente, el expresidente Joe Biden presentó un programa para limitar aún más el envío de chips y modelos de IA a China y otros países. François Chollet, investigador de IA y creador de la biblioteca de aprendizaje profundo Keras, enfatiza que «el hecho de que DeepSeek-R1 provenga de China demuestra que la eficiencia en el uso de recursos es más crucial que la mera escala de cómputo». Por su parte, Alvin Wang Graylin, vicepresidente global de HTC, concluye que «la ventaja que Estados Unidos alguna vez percibió tener se ha reducido. Ambas naciones deben adoptar un enfoque colaborativo para desarrollar una IA avanzada en lugar de perpetuar la actual competencia estéril de carrera armamentista».

Leer:  Las 27 mejores películas disponibles en Apple TV+ que puedes ver ahora mismo

Noticias relacionadas