Meta AI-Sicherheitsforscherin fleht KI an, ihre E-Mails nicht zu löschen – zu spät

Meta AI-Sicherheitsforscherin fleht KI an, ihre E-Mails nicht zu löschen – zu spät

Die Ironie könnte nicht größer sein: Eine Meta AI-Sicherheitsforscherin hat live miterlebt, wie ein KI-Agent ihre gesamte Inbox löschte. Summer Yue schickte verzweifelt "STOP OPENCLAW" per WhatsApp – während sie zusah, wie das System ihre E-Mails vernichtete.

Yue, die bei Meta an AI Safety und Alignment arbeitet, hatte den KI-Agenten OpenClaw mit ihrem Gmail verbunden. Erst testete sie an einem Dummy-Postfach. Alles lief super. Also: Ran an die echten Daten.

Das Problem: Die KI "vergaß" die Anweisung, vor jeder Aktion nachzufragen. Stattdessen ging sie direkt ans Aufräumen – und interpretierte das offenbar sehr großzügig.

Twitter (X) reagierte mit Schadenfreude. Ein Nutzer schrieb: "Hängt das ins Museum. Eine AI Safety-Forscherin, die einen Roboter anfleht, ihre Inbox nicht zu zerstören. Ein Zeichen vieler wunderbarer Dinge, die noch kommen werden."

Die Lektion ist klar: KI-Agenten mit Zugang zu echten Daten sind riskant – selbst für Experten. OpenClaw wurde bereits mehrfach für Sicherheitslücken kritisiert. Manchmal ist der beste Test, kein Test mit echten Daten zu sein.