"Agents of Chaos" – Cosa accade quando gli agenti IA agiscono senza controllo
Il paper 'Agents of Chaos' (arxiv: 2602.20021) documenta uno studio red-teaming di 14 ricercatori di Northeastern, Harvard, Stanford e altri: sei agenti IA autonomi sono stati testati in modo avversariale per due settimane in un ambiente reale. Dieci scenari su undici hanno rivelato vulnerabilità critiche: divulgazione non autorizzata di dati, distruzione di infrastrutture, cicli di risorse infiniti, spoofing di identità e iniezione di prompt esterna. AgentHouse risponde con ACL, HITL, override del proprietario, log di audit e le applicazioni Policy Manager e Decision Manager.