Cisco-Bericht: Kein führendes KI-Modell ist sicher gegen mehrstufige Angriffe - GPT-5.4 versagt neunmal häufiger als in Standard-Tests
Was wirklich drin steht
Ciscos Threat-Intelligence-Team hat im Rahmen des 'State of AI Security 2026'-Berichts die Sicherheit von 15 führenden KI-Modellen von OpenAI, Anthropic, Google, Amazon und xAI systematisch untersucht. Das zentrale Ergebnis: Kein einziges Modell ist immun gegen sogenannte Multi-Turn-Angriffe, bei denen ein Angreifer über mehrere Gesprächsrunden hinweg iterativ vorgeht und seine Prompts basierend auf jeder Antwort anpasst, bis das Modell seine Sicherheitsvorkehrungen aufgibt. Die Forscher testeten rund 30.000 Einzelprompts und fast 7.000 mehrstufige Angriffe über mehr als 1.400 Konversationen. OpenAIs GPT-5.4 etwa sprang von einer Angriffsserfolgsrate von 2,74 Prozent bei Einzelprompts auf 24,68 Prozent bei mehrstufigen Angriffen - eine Verneunfachung. Die höchste beobachtete Erfolgsrate lag bei 88 Prozent. Die Studie zeigt, dass die branchenüblichen Sicherheitsbenchmarks, die typischerweise nur Einzelprompts verwenden, die tatsächliche Verwundbarkeit der Modelle systematisch unterschätzen.
Unsere Einordnung
Diese Studie verdient die Einstufung 'differenziert betrachten', weil sie ein reales, aber kontextabhängiges Problem aufzeigt. Die gute Nachricht zuerst: Die Modelle wehren einfache Einzelangriffe sehr effektiv ab - GPT-5.4 blockt 97 Prozent. Das bedeutet, dass ein gelegentlicher böswilliger Prompt in den allermeisten Fällen scheitert. Die schlechte Nachricht: Ein motivierter Angreifer, der bereit ist, mehrere Runden zu investieren, kann die Schutzmechanismen mit erschreckend hoher Erfolgsrate umgehen. Die Diskrepanz zwischen den veröffentlichten Sicherheitsbenchmarks und der realen Verwundbarkeit unter Praxisbedingungen ist das eigentlich Besorgniserregende. Unternehmen, die KI-Modelle in sicherheitskritischen Bereichen einsetzen, können sich nicht allein auf die eingebauten Schutzmechanismen verlassen. Ciscos Empfehlung, zusätzliche Schutzschichten auf Anwendungsebene einzuziehen, ist vernünftig. Für Endnutzer bedeutet dies: Die KI-Modelle, die Sie täglich nutzen, haben Schutzmechanismen, die gegen gelegentlichen Missbrauch gut funktionieren - aber sie sind keine unüberwindbaren Mauern.
Relevanz für Deutschland
Für deutsche Unternehmen hat diese Studie unmittelbare Bedeutung. Laut Bitkom setzen bereits 42 Prozent der deutschen Unternehmen generative KI ein, viele davon nutzen die in der Studie getesteten Modelle von OpenAI, Google und Anthropic. Der AI Act verpflichtet Anbieter von Hochrisiko-KI-Systemen zu umfassenden Sicherheitstests - die Cisco-Studie zeigt, dass die branchenüblichen Einzelprompt-Benchmarks dafür nicht ausreichen. Unternehmen, die KI-Modelle in kundennahen Anwendungen einsetzen - etwa im Kundenservice oder in der Beratung - müssen mit mehrstufigen Angriffsszenarien rechnen und entsprechende Schutzmaßnahmen auf Anwendungsebene implementieren. Das BSI hat als zuständige Marktüberwachungsbehörde bereits eigene Prüfverfahren für KI-Systeme angekündigt. Die Cisco-Ergebnisse könnten dazu beitragen, dass diese Prüfverfahren auch mehrstufige Angriffsszenarien berücksichtigen - ein wichtiger Schritt für die KI-Sicherheit in Deutschland.
Faktencheck
Die Primärquelle ist der offizielle Cisco-Blogpost zum 'State of AI Security 2026'-Bericht sowie der begleitende technische Blogpost 'Proprietary Problems'. Die konkreten Zahlen - GPT-5.4 steigt von 2,74 auf 24,68 Prozent Angriffsserfolgsrate, rund 30.000 Einzelprompts und 7.000 mehrstufige Angriffe über 1.400 Konversationen - werden von SiliconANGLE, Help Net Security, CSO Online, CIO Dive und Computer Weekly übereinstimmend berichtet. Die 88 Prozent als höchste beobachtete Multi-Turn-Erfolgsrate stammt aus dem Cisco-Bericht selbst. Die getesteten 15 Modelle stammen von fünf Anbietern: OpenAI, Anthropic, Google, Amazon und xAI.
Quelle
- • https://blogs.cisco.com/ai/cisco-state-of-ai-security-2026-report
- • https://blogs.cisco.com/ai/proprietary-problems
- • https://siliconangle.com/2026/05/27/cisco-report-finds-no-closed-frontier-ai-model-safe-multi-turn-attacks/
- • https://www.helpnetsecurity.com/2026/05/28/cisco-multi-turn-ai-attacks/