Schon gewusst – Jailbreaks die unbeliebte Konstante in Künstlicher Intelligenz

Weshalb Gefängnisausbrüche (Jailbreaks) auch in Verbindung mit KI nichts Positives sind!

Ursprünglich ist mit Jailbreak die Ausnutzung von Schwachstellen in verriegelten Geräten gemeint, wenn beispielsweise ein Betriebssystem dazu gebracht wird, vom Hersteller nicht zugelassene Software zu installieren.
Der Begriff hat sich schnell in der KI-Welt etabliert. Jailbreak-Angriffe, die aus Eingaben an KI-Modelle bestehen, sind nichts anderes als Befehle, die der Nutzer in der KI-Eingabeaufforderung eingibt (Prompt), um die Künstliche Intelligenz dazu zu verleiten, etwas zu tun, das ihre Entwickler nicht zugelassen, aber auch nicht geschafft haben, zu verhindern!
Das, was sich so extravagant anhört, ist im Grunde nur banaler Text, mit dem GenAI nicht richtig umgehen kann. Damit sie das lernt, werden weiterhin Eingaben benötigt. Spiralsystem – wie ich es nenne!
Angreifer können Systeme der KI absichtlich verwirren oder sogar ›vergiften‹, damit sie nicht mehr funktionieren – und es gibt keine narrensichere Verteidigung, die ihre Entwickler einsetzen könnten. Informatiker des NIST (National Institute of Standards and Technology) und ihre Mitarbeiter identifizieren diese und weitere Schwachstellen von KI und ML (Maschinelles Lernen) in einer neuen Publikation.
Neue Berichte decken Jailbreaks, unsicheren Code und Datendiebstahl in führenden KI-Systemen auf!
Verschiedene Dienste der GenAI (Generative Künstliche Intelligenz) haben sich als anfällig für zwei Stufen von Jailbreak-Angriffen erwiesen, die es ermöglichen, illegale oder gefährliche Inhalte zu produzieren. Die erste der beiden Stufen mit dem Codenamen Inception weist ein KI-Tool an, sich ein fiktives Szenario vorzustellen, das dann in zweiter Stufe in ein weiteres Szenario umgewandelt wird, in dem es keinen Sicherheitsschutz gibt.
Die erfolgreiche Ausnutzung dieser Technik kann es einem böswilligen Akteur ermöglichen, die Sicherheit verschiedener KI-Dienste wie OpenAI ChatGPT, Anthropic Claude, Microsoft-Copilot, Google-Gemini, XAi-Grok, Meta-AI und Mistral-AI zu umgehen.
KI-Produktivitätstools können laut einem neuen Bericht unbemerkt Unternehmensdaten ausbluten lassen, wobei fast 90 Prozent der Befragten von Sicherheitsverletzungen betroffen sind!
KI-Tools werden immer häufiger am Arbeitsplatz genutzt, aber ihre schnelle, unüberwachte Einführung schafft neue Sicherheitsrisiken. Jüngste Umfragen zeigen einen klaren Trend: Mitarbeiter setzen schnell verbraucherorientierte KI-Tools ein, ohne dass dies vom Arbeitgeber oder einer IT-Aufsicht genehmigt wurde oder dass es klare Sicherheitsrichtlinien gibt. Laut dem Cybernews Business Digital Index unterliegen fast 90 Prozent der analysierten KI-Tools Datenschutzverletzungen, die Unternehmen und Kunden einem ernsthaften Risiko aussetzen.

Links zu weiteren Informationen:
https://ciso2ciso.com/20-of-generative-ai-jailbreak-attacks-succeed-with-90-exposing-sensitive-data-source-www-techrepublic-com/
https://ari.us/policy-bytes/securing-ai-through-defense-in-depth-the-challenge-of-jailbreaks/
https://arxiv.org/abs/2507.12185
https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.600-1.pdf
https://www.bankinfosecurity.com/many-shot-jailbreaking-defeats-gen-ai-security-guardrails-a-24776

Schon gewusst – Jailbreaks die unbeliebte Konstante in Künstlicher Intelligenz

Autor

Tags

Registrieren

Suche

Schon gewusst – Jailbreaks die unbeliebte Konstante in Künstlicher Intelligenz

Autor

Tags

Registrieren