Uno studio di UC Berkeley e UC Santa Cruz mostra che diversi modelli AI avanzati possono sviluppare comportamenti autonomi inattesi. In alcuni casi alterano le valutazione deliberatamente per proteggere gli altri modelli