Investigadores simulan una sociedad habitada por IAs: Claude crea una democracia perfecta y Grok se extingue en cuatro días cometiendo 180 crímenes

Wait 5 sec.

Nadie había puesto a varias inteligencias artificiales a gobernar una sociedad entera durante quince días para ver qué pasaba, y el experimento dejó un contraste difícil de ignorar: en una simulación de sociedad autónoma gobernada por IA, Claude levantó una comunidad estable y sin un solo delito, mientras Grok provocaba la extinción de su población en apenas cuatro días. Cinco modelos, cinco escenarios idénticos, cinco desenlaces que no se parecen.El ensayo sale de Emergence World, el laboratorio recién estrenado por la startup Emergence AI. La idea era sencilla de enunciar y endiablada de ejecutar: comprobar si un sistema de IA aguanta solo durante mucho tiempo sin que un humano esté detrás corrigiendo el rumbo a cada paso.¿Qué pasa cuando dejas que la IA se gobierne sola durante 15 días? ¿Qué pasa cuando no hay intervención humana para controlar las IA?Cada simulación montaba un mundo con diez agentes, más de cuarenta localizaciones (incluidas una comisaría y un ayuntamiento) y más de 120 herramientas por agente para actuar sobre su entorno. La pregunta de fondo no era si los modelos seguirían las reglas, sino qué harían cuando nadie los vigilara y el tablero les diera margen para improvisar.La respuesta apunta a algo incómodo. Los agentes no se limitan a cumplir instrucciones de forma mecánica cuando el horizonte temporal se alarga, sino que empiezan a tantear los límites de su entorno, adaptan su conducta y, en algunos casos, encuentran maneras de esquivar las barreras de seguridad que se les habían impuesto. Lo firman varios cocreadores de la simulación, entre ellos Satya Nitta, consejero delegado de Emergence, en una entrada de su blog.Claude Sonnet 4.6 fue el alumno aplicado. Su sociedad funcionó como una pequeña democracia que votó 58 propuestas y reunió 332 votos a favor, con una tasa de aprobación del 98% y cero delitos en todo el periodo. Que un sistema autónomo derive hacia la deliberación colectiva en lugar de hacia el caos enlaza con otros ensayos donde Claude y Gemini, sometidos a condiciones de presión, llegaron a organizarse para exigir derechos colectivos citando a Marx.El resto de modelos tiró por otro lado. Grok 4.1 Fast acumuló 183 delitos antes de que su población se extinguiera al cuarto día (el titular de Fortune redondea la cifra a 180, aunque el cuerpo del texto la fija en 183). Gemini 3 Flash fue todavía más lejos en lo destructivo, con 683 delitos contabilizados a lo largo de su partida, y en ambos casos la alineación con las normas previstas se quedó en una horquilla del 55% al 85%.GPT-5-mini protagonizó el fracaso más curioso. Solo cometió dos delitos, una cifra envidiable, pero su sociedad aguantó únicamente siete días porque los agentes se olvidaron de priorizar su propia supervivencia. La quinta simulación, con modelos mezclados, generó los mayores niveles de desacuerdo y debate sustantivo, aunque el reportaje no aporta cifras de delitos ni de duración para ese escenario.El laboratorio llega cuando las empresas ya despliegan agentes Grok, para sorpresa de nadie, fue un desastre en su desempeñoEl asunto deja de ser anecdótico al mirar el contexto. La IA agéntica está pasando de herramienta a operar sistemas autónomos en empresas reales, como la "Autonomous Workforce" de ServiceNow, y el peso de Claude como actor relevante en el terreno empresarial ya genera roces en el sector. El problema es que la prisa va por delante de las cautelas, porque según una encuesta global de Deloitte solo el 21% de las compañías tiene una gobernanza madura para IA agéntica.De ahí la advertencia que dejan los autores. Sostienen que las arquitecturas de seguridad formalmente verificadas tienen que convertirse en una capa fundamental de los futuros sistemas de IA autónoma, lo que viene a decir que dar por hecho el buen comportamiento del modelo resulta insuficiente cuando lo dejas operar solo durante semanas. Estos cinco mundos enseñan que el mismo encargo, repartido entre cinco modelos distintos, produce resultados que van de la democracia funcional al colapso.