OpenAI

GPT-4o Mini: Durchbruch oder heiße Luft?

von Wolfgang Walk · 20. Juli 2024

Aquarell-Darstellung der digitalen KI-Landschaft

Die Kunst der KI

OpenAI hat kürzlich sein neuestes Modell vorgestellt: GPT-4o Mini. Dieses kleine, aber leistungsstarke Modell beherrscht sowohl Text- als auch Bildverarbeitung und ist dabei deutlich kostengünstiger als seine Vorgänger. Was bedeutet das für Entwickler, die KI-Anwendungen bauen wollen? Und wie steht GPT-4o Mini im Vergleich zu anderen Modellen auf dem Markt? In diesem Blog-Artikel erfährst du alles, was du über GPT-4o Mini wissen musst.

Was ist GPT-4o Mini?

GPT-4o Mini basiert auf der gleichen Architektur wie GPT-4o, dem größten und fortschrittlichsten Modell von OpenAI. Es handelt sich um ein Transformer-Modell, das mit riesigen Mengen an Text- und Bilddaten trainiert wurde, um verschiedene Aufgaben zu erfüllen, wie z.B. Textgenerierung, Textverständnis, Bildbeschreibung, Bilderkennung und mehr. Mit einer Kapazität von 1,5 Billionen Parametern kann GPT-4o eine enorme Menge an Wissen und Kontext speichern.

GPT-4o Mini ist eine kleinere Version dieses Modells mit nur 15 Milliarden Parametern. Das ist 100-mal kleiner als GPT-4o, was bedeutet, dass GPT-4o Mini viel schneller und günstiger zu betreiben ist, ohne dabei viel an Qualität einzubüßen. Es kann eine Vielzahl von Aufgaben erledigen, die Text- und Bildverarbeitung erfordern, und schneidet dabei besser ab als andere kleine Modelle auf dem Markt, wie z.B. Gemini Flash oder Claude Haiku.

Dieses Modell ist das Ergebnis von OpenAIs Engagement, KI so breit zugänglich wie möglich zu machen. OpenAI, eine gemeinnützige Forschungsorganisation, hat sich zum Ziel gesetzt, eine freundliche und nützliche Künstliche Allgemeine Intelligenz (KAI) zu schaffen, die der gesamten Menschheit zugutekommt. Über eine API bietet OpenAI Entwicklern die Möglichkeit, KI-Anwendungen mit wenigen Codezeilen zu bauen. Diese API unterstützt verschiedene Modelle, die unterschiedliche Fähigkeiten und Preise haben, je nach den Bedürfnissen der Nutzer.

Wie gut ist GPT-4o Mini?

Obwohl GPT-4o Mini ein kleineres Modell ist, bedeutet das nicht, dass es weniger intelligent ist. In mehreren akademischen Benchmarks, die sowohl textuelle Intelligenz als auch multimodale Argumentation messen, übertrifft GPT-4o Mini andere kleine Modelle auf dem Markt. Es unterstützt den gleichen Sprachumfang wie GPT-4o und kann daher mit Texten in verschiedenen Sprachen umgehen.

Leistung im Vergleich

Hier sind einige Beispiele für die Leistung von GPT-4o Mini im Vergleich zu anderen kleinen Modellen:

MMLU (Textuelle Intelligenz und Argumentation): GPT-4o Mini erzielte 82,0%, verglichen mit 77,9% für Gemini Flash und 73,8% für Claude Haiku.
MGSM (Mathematisches Argumentieren): GPT-4o Mini erzielte 87,0%, verglichen mit 75,5% für Gemini Flash und 71,7% für Claude Haiku.
HumanEval (Programmierfähigkeiten): GPT-4o Mini erzielte 87,2%, verglichen mit 71,5% für Gemini Flash und 75,9% für Claude Haiku.
MMMU (Multimodales Argumentieren): GPT-4o Mini erzielte 59,4%, verglichen mit 56,1% für Gemini Flash und 50,2% für Claude Haiku.

Diese Ergebnisse zeigen, dass GPT-4o Mini trotz seiner kleineren Größe überlegene Leistungen in textueller Intelligenz und multimodaler Argumentation bietet und für eine breite Palette von Aufgaben geeignet ist.

Nutzung von GPT-4o Mini

GPT-4o Mini ist jetzt als Text- und Bildmodell in der API von OpenAI verfügbar. Entwickler können es für verschiedene Anwendungen nutzen, die Text- oder Bildverarbeitung erfordern, wie z.B.:

Assistenten: Intelligente Assistenten, die mit Nutzern interagieren und Aufgaben erledigen, wie Reisen buchen, Essen bestellen, Termine planen und mehr.
Chat Completions: Hochwertige Textantworten generieren, wenn ein Textkontext gegeben wird, wie z.B. E-Mail-Konversationen, Chat-Nachrichten, Tweets und mehr.
Batch-Verarbeitung: Große Mengen an Text- oder Bildanfragen auf einmal verarbeiten, wie das Extrahieren von strukturierten Daten aus Dateien, das Übersetzen von Texten, das Annotieren von Bildern und mehr.

GPT-4o Mini ist sehr kostengünstig und hat eine geringe Latenz, was es ideal für Anwendungen macht, die mehrere Modellaufrufe verketten oder parallelisieren, eine große Menge an Kontext an das Modell übergeben oder mit Kunden durch schnelle, Echtzeit-Textantworten interagieren.

Um GPT-4o Mini zu nutzen, muss man sich für die API von OpenAI anmelden und einen API-Schlüssel erhalten. Die API ist sehr einfach zu bedienen und erfordert nur wenige Parameter, wie den Modellnamen, den Text- oder Bildinput, die gewünschte Anzahl von Output-Tokens und mehr. Die API gibt dann den Text- oder Bildoutput zurück, der vom Modell generiert wurde.

Die Preise für GPT-4o Mini sind sehr erschwinglich: 15 Cent pro 1 Million Input-Tokens und 60 Cent pro 1 Million Output-Tokens, was eine Größenordnung günstiger ist als frühere Modelle und mehr als 60% billiger als GPT-3.5 Turbo.

Sicherheit von GPT-4o Mini

OpenAI legt großen Wert auf die Sicherheit seiner Modelle und hat verschiedene Maßnahmen ergriffen, um das Risiko von Missbrauch oder Schaden zu minimieren. Die Sicherheit ist in die Modelle von Anfang an eingebaut und wird bei jedem Schritt des Entwicklungsprozesses verstärkt. Bei der Vortrainierung filtert OpenAI unerwünschte Informationen heraus, wie z.B. Hassrede, Erwachseneninhalte, persönliche Daten und Spam. Bei der Nachtrainierung passt OpenAI das Verhalten der Modelle an seine Richtlinien an, indem Techniken wie Reinforcement Learning with Human Feedback (RLHF) verwendet werden.

GPT-4o Mini hat die gleichen Sicherheitsmaßnahmen wie GPT-4o, das nach dem Preparedness Framework und in Übereinstimmung mit freiwilligen Verpflichtungen von OpenAI bewertet wurde. Über 70 externe Experten aus Bereichen wie Sozialpsychologie und Fehlinformationen haben GPT-4o getestet, um potenzielle Risiken zu identifizieren, die OpenAI adressiert hat. Die Erkenntnisse aus diesen Bewertungen haben dazu beigetragen, die Sicherheit von GPT-4o und GPT-4o Mini zu verbessern.

OpenAI hat auch daran gearbeitet, die Sicherheit von GPT-4o Mini mit neuen Techniken zu verbessern, wie der Instruction Hierarchy Methode, die dazu beiträgt, Jailbreaks, Prompt-Injektionen und System-Prompt-Extraktionen zu widerstehen. Dies macht die Modellantworten zuverlässiger und hilft, das Modell sicherer in Anwendungen im großen Maßstab zu verwenden.

OpenAI wird weiterhin überwachen, wie GPT-4o Mini genutzt wird, und die Sicherheit des Modells verbessern, wenn neue Risiken erkannt werden.

Fazit

GPT-4o Mini ist ein kleines, aber leistungsstarkes Modell, das Text- und Bildverarbeitung beherrscht und dabei viel kostengünstiger ist als seine Vorgänger. Es erweitert die Reichweite der Anwendungen, die mit KI gebaut werden können, indem es Intelligenz erschwinglicher macht. GPT-4o Mini ist jetzt in der API von OpenAI verfügbar, die Entwicklern ermöglicht, KI-Anwendungen mit wenigen Codezeilen zu bauen. GPT-4o Mini ist das Ergebnis von OpenAIs Engagement, KI so breit zugänglich wie möglich zu machen, und wir sind gespannt, wie es die Zukunft der KI beeinflussen wird.