"Agents of Chaos" – Was passiert, wenn KI-Agenten unkontrolliert agieren
Das Paper 'Agents of Chaos' (arxiv: 2602.20021) dokumentiert ein Red-Teaming-Experiment von 14 Forschern aus Northeastern, Harvard, Stanford u.a.: Sechs autonome KI-Agenten wurden zwei Wochen lang in einer realen Umgebung mit Email, Discord und Shell-Zugang von 20 Forschern adversariell getestet. In 10 von 11 Szenarien wurden kritische Schwachstellen aufgedeckt: unbefugte Datenweitergabe, Zerstörung von Infrastruktur, Ressourcen-Endlosschleifen, Identitätsbetrug und externe Prompt Injection. AgentHouse adressiert diese durch ACLs, HITL, Owner-Override, Audit-Logs sowie die Anwendungen Policy Manager und Decision Manager.