KI / OpenAI

OpenAI: Bekämpfung von KI-Missbrauch durch staatliche Cyberakteure!

von Wolfgang Walk · 14. Februar 2024

Hacker im Dunklen und Verborgenen, IT Security.

Quelle: pixabay @TheDigitalArtist

KI-Technologien können das Leben vieler Menschen verbessern und komplexe Probleme lösen, aber sie können auch von böswilligen Akteuren missbraucht werden, die anderen Schaden zufügen wollen. Besonders gefährlich sind dabei staatlich unterstützte Gruppen, die über fortgeschrittene Technologien, große finanzielle Ressourcen und qualifiziertes Personal verfügen. Diese Gruppen können einzigartige Risiken für das digitale Ökosystem und das menschliche Wohlergehen darstellen.

OpenAI, eine Organisation, die sich der Schaffung und Verbreitung von verantwortungsvoller künstlicher Intelligenz verschrieben hat, hat in Zusammenarbeit mit Microsoft Threat Intelligence fünf solcher staatlich unterstützten Akteure identifiziert und gestoppt, die versuchten, KI-Dienste im Rahmen von bösartigen Cyber-Aktivitäten zu nutzen. In diesem Artikel werden die Erkenntnisse und Maßnahmen von OpenAI beschrieben und erläutert, wie sie darauf abzielen, solche Akteure zu erkennen und zu verhindern, um den Informationsaustausch und die Transparenz bezüglich ihrer Aktivitäten zu fördern.

Welche staatlichen Akteure waren beteiligt und was haben sie getan?

Basierend auf der Zusammenarbeit und dem Informationsaustausch mit Microsoft wurden fünf staatlich unterstützte bösartige Akteure identifiziert.

Land	Bedrohungsakteur
China	Charcoal Typhoon
China	Salmon Typhoon
Iran	Crimson Sandstorm
Nordkorea	Emerald Sleet
Russland	Forest Blizzard

Die von OpenAI identifizierten Konten, die mit diesen Akteuren verbunden waren, wurden beendet.

Diese Akteure suchten im Allgemeinen danach, OpenAI-Dienste für das Abfragen von Open-Source-Informationen, das Übersetzen, das Finden von Programmierfehlern und das Ausführen von grundlegenden Programmieraufgaben zu verwenden. Im Einzelnen:

Charcoal Typhoon nutzte OpenAI-Dienste für die Übersetzung von Webseiten und Dokumenten aus verschiedenen Sprachen ins Chinesische, vermutlich um Informationen zu sammeln oder Inhalte zu erstellen.
Salmon Typhoon nutzte OpenAI-Dienste für die Codeanalyse, um Fehler oder Schwachstellen in verschiedenen Programmiersprachen zu finden, vermutlich um Exploits zu entwickeln oder zu testen.
Crimson Sandstorm nutzte OpenAI-Dienste für die Textgenerierung, um Propaganda-Inhalte in verschiedenen Sprachen zu erstellen oder zu modifizieren, vermutlich um Desinformation zu verbreiten oder zu verstärken.
Emerald Sleet nutzte OpenAI-Dienste für die Web-Scraping, um Informationen von öffentlich zugänglichen Quellen abzurufen, vermutlich um Datenbanken aufzubauen oder zu aktualisieren.
Forest Blizzard nutzte OpenAI-Dienste für die Textanalyse, um die Bedeutung oder den Ton von Texten in verschiedenen Sprachen zu bestimmen, vermutlich um Zielgruppen oder Meinungsführer zu identifizieren oder zu beeinflussen.

Weitere technische Details über die Art der Bedrohungsakteure und ihre Aktivitäten finden Sie im Microsoft-Blogbeitrag, der heute veröffentlicht wurde.

Wie wirksam sind KI-Dienste für bösartige Cyber-Aktivitäten?

Die Aktivitäten dieser Akteure stehen im Einklang mit früheren Red-Team-Bewertungen, die von OpenAI in Zusammenarbeit mit externen Cybersicherheitsexperten durchgeführt wurden. Diese Bewertungen ergaben, dass GPT-4, das neueste und leistungsfähigste Sprachmodell von OpenAI, nur begrenzte, inkrementelle Fähigkeiten für bösartige Cybersicherheitsaufgaben bietet, die über das hinausgehen, was mit bestehenden Werkzeugen oder Methoden bereits möglich ist. Die Bewertungen zeigten auch, dass GPT-4 einige inhärente Einschränkungen aufweist, wie z. B. die Unfähigkeit, komplexe Logik oder kausale Beziehungen zu erfassen, die Unzuverlässigkeit bei der Erzeugung von faktenbasiertem oder konsistentem Text und die Anfälligkeit für die Erkennung durch andere KI-Systeme oder menschliche Prüfer. Insgesamt schätzten die Experten den Nutzen von GPT-4 für böswillige Akteure als gering oder vernachlässigbar ein, während die Risiken für die Allgemeinheit und für legitime Nutzer hoch oder erheblich seien.

Wie verhindert OpenAI den Missbrauch seiner KI-Dienste?

OpenAI verfolgt einen mehrschichtigen Ansatz, um den Missbrauch seiner KI-Dienste zu verhindern und zu bekämpfen. Dazu gehören die folgenden Maßnahmen:

Die Anwendung von strengen Richtlinien und Nutzungsbedingungen, die den Missbrauch von OpenAI-Diensten verbieten und die Einhaltung von ethischen und rechtlichen Standards erfordern.
Die Durchführung von regelmäßigen Audits und Überprüfungen, um die Nutzung von OpenAI-Diensten zu überwachen und Anomalien oder verdächtige Aktivitäten zu erkennen.
Die Zusammenarbeit mit vertrauenswürdigen Partnern, wie Microsoft, um Informationen und Erkenntnisse über potenzielle Bedrohungsakteure zu teilen und gemeinsame Abwehrmaßnahmen zu ergreifen.
Die Entwicklung und Implementierung von technischen Sicherheitsmaßnahmen, wie zum Beispiel die Begrenzung der Anzahl oder Häufigkeit der Anfragen, die Rate-Limiting, die Authentifizierung, die Verschlüsselung und die Wasserzeichen, um den Zugang zu und die Nutzung von OpenAI-Diensten zu kontrollieren und zu schützen.
Die Förderung von Forschung und Innovation, um die Sicherheit und Robustheit von KI-Systemen zu verbessern und die Erkennung und Abwehr von bösartigen Angriffen zu erleichtern.
Die Sensibilisierung und Aufklärung der Öffentlichkeit und der Stakeholder über die potenziellen Risiken und Herausforderungen der KI und die besten Praktiken für den verantwortungsvollen Umgang mit KI.

OpenAI ist sich bewusst, dass kein Ansatz perfekt oder unfehlbar ist und dass sich die Bedrohungslandschaft ständig verändert. Daher ist OpenAI bestrebt, seine Strategien und Maßnahmen zur Verhinderung und Bekämpfung des Missbrauchs seiner KI-Dienste kontinuierlich zu überprüfen und anzupassen. OpenAI ist auch offen für die Zusammenarbeit mit anderen Akteuren, die sich für eine verantwortungsvolle und sichere KI einsetzen, und lädt alle Interessierten ein, sich an diesem wichtigen Dialog zu beteiligen.