
Microsoft ha lanzado Muse, un innovador sistema de inteligencia artificial (IA) diseñado para generar gráficos y acciones de controlador en videojuegos. Este avance se considera el primer modelo de acción humana y mundial (WHAM, por sus siglas en inglés) y tiene como objetivo convertirse en una herramienta de apoyo para los creativos en el ámbito gamer.
Este desarrollo es fruto de una colaboración entre Microsoft Research y Ninja Theory, uno de los estudios first party de Xbox. En términos generales, Muse tiene la capacidad de predecir imágenes, simular entradas y crear secuencias de juego basadas en la física y el funcionamiento de juegos existentes. Según un artículo publicado en la revista Nature, los ingenieros han integrado una serie de modelos espacio-temporales que permiten al sistema entender la dinámica de los videojuegos actuales. Esta habilidad se deriva de un entrenamiento que utiliza datos de más de 500,000 sesiones de juego humano.
Recopilación de Datos y Entrenamiento
El equipo de Microsoft ha recopilado más de siete años de partidas continuas y anónimas del juego Bleeding Edge, un título multijugador en 3D desarrollado por Ninja Theory. Esta colección incluye los siete mapas del juego y acumula más de 100,000 millones de imágenes de partidas, junto con las acciones de control correspondientes. Como resultado, se creó el conjunto de datos «7 Maps dataset«, que se utiliza para entrenar la versión más avanzada del WHAM.
Esta metodología ha permitido a Muse aprender directamente de las partidas, en lugar de seguir reglas predefinidas como otros modelos de IA. De este modo, puede generar imágenes de juego realistas y acciones de control precisas sin conocimientos preestablecidos. El sistema opera con 1,600 millones de parámetros y una longitud de contexto de un segundo, codificando cada fotograma en 540 tokens con una resolución de 300×180 píxeles.
Evaluación del Rendimiento
El rendimiento de Muse se ha evaluado en tres aspectos clave: consistencia, diversidad y persistencia. La consistencia se refiere a la capacidad del modelo para generar secuencias que respeten la dinámica del juego. La diversidad mide su habilidad para crear variantes a partir de la misma indicación inicial, reflejando diferentes formas en que el juego podría evolucionar. Por último, la persistencia evalúa su capacidad para incorporar y mantener modificaciones del usuario en las secuencias generadas, como un personaje que se copia y pega en una imagen del juego.
Este enfoque innovador no solo promete revolucionar la manera en que se desarrollan los videojuegos, sino que también plantea nuevas posibilidades para la interacción entre humanos y máquinas en el ámbito del entretenimiento digital.