Un equipo del MIT y Harvard reversionó el clásico juego de hundir barcos para estudiar cómo los modelos de inteligencia artificial formulan preguntas, buscan información y toman decisiones cuando no tienen todos los datos disponibles.
17/05/2026 9:34
Escuchar esta nota
Investigadores del Instituto Tecnológico de Massachusetts (MIT) y de la Universidad de Harvard realizaron un experimento poco común para mejorar el desempeño de la inteligencia artificial en escenarios inciertos: pusieron a una IA a jugar Batalla Naval.
El objetivo no era simplemente ganar un juego, sino analizar cómo los modelos de lenguaje —la tecnología detrás de muchos chatbots actuales— hacen preguntas, buscan información y toman decisiones cuando deben actuar sin conocer todos los datos.
Una IA frente a la incertidumbre
Los modelos de lenguaje suelen ser muy eficientes cuando responden tareas definidas o preguntas concretas. Sin embargo, su rendimiento puede bajar en contextos más inciertos, donde deben explorar posibilidades, formular hipótesis y decidir qué información necesitan para avanzar.
Por eso, investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL) y de la Escuela de Ingeniería y Ciencias Aplicadas de Harvard (SEAS) usaron una versión modificada de Batalla Naval para estudiar ese comportamiento.
En el juego tradicional, los participantes deben encontrar barcos ocultos en una cuadrícula lanzando coordenadas. En esta versión experimental, el juego fue transformado en una dinámica colaborativa y conversacional, donde los modelos debían formular preguntas y usar las respuestas para mejorar sus decisiones.
El problema: saber preguntar
Uno de los hallazgos principales fue que los modelos más grandes y avanzados, como GPT-5, podían superar a jugadores humanos promedio. Sin embargo, los modelos más pequeños tenían mayores dificultades y eran menos racionales al momento de formular preguntas útiles.
Según los investigadores, el problema no estaba solo en responder, sino en saber qué preguntar para obtener información valiosa.
“Los modelos de lenguaje actuales están optimizados principalmente para responder consultas complejas, pero no está tan claro si aprenden a formular buenas preguntas por sí mismos”, explicó Gabriel Grand, investigador del CSAIL y autor principal del estudio.
Para mejorar ese punto, los investigadores asignaron a los modelos una estrategia de inferencia capaz de medir probabilidades de acierto y simular posibles escenarios. Con esta técnica, incluso los modelos más pequeños lograron mejorar notablemente.
Uno de los casos más llamativos fue el de Llama-4-Scout, que pasó de tener apenas un 8% de victorias frente a humanos a alcanzar un 82%.
Más allá de los juegos
El experimento también fue probado en otros juegos de búsqueda de información, como Quién es Quién, donde el objetivo es adivinar un personaje mediante preguntas y descartes.
En esa prueba, Llama-4-Scout pasó de una tasa de éxito del 30% al 72%, mientras que GPT-4o subió del 62% al 90% con la misma técnica.
Los investigadores creen que este tipo de avances podría tener aplicaciones mucho más amplias, como la programación, la resolución de problemas matemáticos y la investigación científica.
La idea es que una IA no solo responda mejor, sino que también aprenda a explorar mejor un problema, identificar qué información falta y encontrar soluciones en escenarios complejos.
El desafío de encontrar “una aguja en un pajar”
Según el MIT, estos resultados muestran que los agentes de IA tienen un potencial todavía poco explorado para navegar grandes espacios de posibilidades y encontrar soluciones excepcionales, algo parecido a buscar una aguja en un pajar.
Sin embargo, los propios investigadores advierten que todavía hay límites. Valerio Pepe, investigador de OpenAI, graduado de Harvard y coautor del estudio, explicó que aunque GPT-5 puede vencer a un jugador promedio de Batalla Naval, los jugadores expertos siguen siendo difíciles de superar para todos los modelos.
El siguiente paso será probar estos métodos en escenarios más complejos que los juegos de mesa, donde existan muchas más variables y donde la capacidad de preguntar, simular y decidir pueda marcar una diferencia real.
Mira la programación en Red Uno Play
{{hora}}
{{hora}}