GPT-5-Codex: OpenAIs Agent, der Code programmiert und überprüft

  • GPT-5-Codex ist eine für die agentenbasierte Codierung in Codex optimierte Variante von GPT-5.
  • Passt die Denkzeit je nach Aufgabe dynamisch von Sekunden bis über sieben Stunden an.
  • Verbessert die Codeüberprüfung und die Erkennung kritischer Fehler mit weniger fehlerhaften Kommentaren.
  • Verfügbar in Plus, Pro, Business, Edu und Enterprise; API folgt später.

Allgemeines Bild des GPT-5-Codex

OpenAI präsentiert hat GPT-5-Codex, eine Variante des generalistischen Modells, die sich auf agentenbasierte Programmieraufgaben innerhalb von Codex konzentriert. Ziel ist es, Teams den Wechsel zwischen interaktiven Sitzungen und langfristiger Hintergrundarbeit zu ermöglichen, ohne Kontext oder Ergebnisqualität zu verlieren.

Das Unternehmen betont, dass das Modell Passen Sie die Zeit an, die Sie mit dem Denken verbringen basierend auf Komplexität: reagiert in Sekundenschnelle auf einfache Anfragen und kann Stunden investieren, wenn die Aufgabe es erfordert. Dieser auf Software-Engineering ausgerichtete Ansatz umfasst erweiterte Funktionen von Codeüberprüfung und Erkennung kritischer Fehler.

Was ist GPT-5-Codex und wozu dient es?

Im Vergleich zum Allzweck-GPT-5 wurde diese Version mit realen Entwicklungsszenarien trainiert mit Frameworks wie PyTorch um Projekte von Grund auf neu zu erstellen, Funktionen und Tests hinzuzufügen, zu debuggen, umzugestalten und Änderungen konsequent zu überwachen.

Laut OpenAI ist das Modell mehr strikte Einhaltung der Agentenrichtlinien (AGENTS.md), also befolgen Sie die Anweisungen besser, ähnlich wie bei Projekten wie OpenAssistantund erzeugt qualitativ hochwertigeren Code mit kurzen Eingabeaufforderungen, ohne dass lange Eingabeaufforderungen geschrieben werden müssen.

Neben der Programmierung kann GPT-5-Codex Bewerten Sie die Richtigkeit, indem Sie den Code und die Tests ausführenund kennzeichnen Sie Auswirkungsprobleme, bevor sie in die Produktion gehen. Dies ist besonders für Teams mit anspruchsvollen Überprüfungen nützlich.

Bei Schnittstellenjobs sieht das Unternehmen es als zuverlässiger Partner für Front-End-Aufgaben und Erstellung von Desktop-Anwendungen mit Verbesserungen bei der Generierung mobiler Erfahrungen auf der Grundlage interner Bewertungen menschlicher Präferenzen.

All das oben Genannte ist in den üblichen Ablauf integriert: Terminal (CLI), IDE, Web, GitHub und die ChatGPT-App, mit Kontextkontinuität zwischen Cloud und lokaler Umgebung.

Leistung und anpassbare „Denkzeit“

Einer der Schlüssel zum Start ist seine dynamisches Argumentationsmanagement: Das Modell entscheidet selbst in Echtzeit, wie viel „Kopf“ dafür aufgewendet werden soll, und kann die Ausführung verlängern, wenn es erkennt, dass die Aufgabe komplexer wird.

OpenAI behauptet, beobachtet zu haben Einzelsitzungen von mehr als sieben Stunden bei groß angelegten Refactorings mit Iterationen, die Testfehler korrigieren und Ergebnisse validieren, bis das Ziel erreicht ist.

Dieses Verhalten steht im Gegensatz zu Strategien, die auf Router, die Ressourcen vorbestimmen; hier bewertet das Modell den Aufwand im Verlauf neu und kombiniert agilen Dialog mit konsequenter Ausführung.

Auf praktischer Ebene bedeutet dies schnelle Antworten auf spezifische Anfragen und es muss mehr Zeit investiert werden, wenn die Arbeit die Orchestrierung von Änderungen über mehrere Module hinweg oder die Auflösung komplexer Abhängigkeiten umfasst.

Für Softwareteams verspricht dieser Ansatz weniger irrelevante Iterationen und mehr Konzentration auf Schritte mit großer Wirkung, insbesondere bei der Überprüfung großer Repositories oder der Bearbeitung übergreifender Aufgaben.

Konzeptbild eines Code-Agenten

Tools und Integration: CLI, IDE, Web und GitHub

Die Codex-Befehlszeilenschnittstelle wurde Neugestaltung um agentenbasierte FlowsBilder können jetzt direkt in der CLI angehängt werden, um Designentscheidungen zu erleichtern oder visuelle Inkonsistenzen zu erkennen.

Das System kann Überwachen Sie den Fortschritt mit To-Do-Listen und integriert Tools wie die Websuche und MCP, einen offenen Standard für die sichere Verbindung von LLMs mit externen Daten und Dienstprogrammen.

Die Schnittstelle verbessert außerdem die Tool-Aufrufformat und Vergleiche, wodurch die Argumentation des Agenten besser nachvollziehbar und die Unterschiede besser überprüfbar werden.

In Entwicklungsumgebungen ermöglichen die IDE-Erweiterung und die GitHub-Integration Verschieben Sie Arbeit zwischen lokalen Standorten und der Cloud, ohne den Kontext zu verlieren, wobei für präzisere Antworten auf Open Source im Editor zurückgegriffen wird.

OpenAI gibt an, dass der Agent läuft auf standardmäßig kontrollierte Umgebungen und dass es möglich ist, Berechtigungen anzupassen, um potenziell zerstörerische Aktionen bei sensiblen Projekten einzuschränken.

Verfügbarkeit und Zugang

GPT-5-Codex ist aktiviert in ChatGPT Plus, Pro, Business, Edu und Enterprise, zusätzlich zu Codex-Erfahrungen im Terminal, Web, IDE und GitHub.

Das Unternehmen plant, es verfügbar zu machen für API-Clients später, obwohl derzeit weder ein Zeitplan noch konkrete Preise für diesen Kanal vorliegen.

GPT-5 Codex-Tests und -Metriken

Laut Informationen von OpenAI und externen Berichten bietet GPT-5-Codex bessere Ergebnisse als GPT-5 in agentenorientierten Szenarien, wie beispielsweise der SWE-bench Verified Benchmark.

In konkreten Zahlen werden sie genannt Verbesserungen von bis zu 74,5 % im SWE-Bench-Verifiziert und ein Anstieg bei den Refactoring-Tests von 33,9 % mit GPT-5 auf 51,3 % mit GPT-5-Codex, was auf Fortschritte bei der Wartung und Bearbeitung mehrerer Dateien hindeutet.

Das Unternehmen betont außerdem, dass seine Bewertungskommentare sind weniger fehlerhaft oder irrelevant, wodurch die Aufmerksamkeit auf kritische Probleme gerichtet und der Lärm in PRs reduziert werden kann.

Was der GPT-5-Kodex für technische Teams bedeutet

Für Entwickler ist es wichtig, einen Agenten zu haben, der kombiniert schnelle Interaktion und autonomes Arbeiten öffnet die Tür zu kürzeren Zyklen und einer effektiveren Priorisierung komplexer Aufgaben.

Damit ein Modell in Organisationen Stunden mit einer Aufgabe verbringen kann, sind eine Unternehmens-KI-Strategie, klare Richtlinien zu Kosten- und Ausführungsgrenzen sowie eine Validierung seiner Leistung über mehrere Sprachen und Monorepos mit umfassendem Kontext hinweg erforderlich.

Praktiken von sichere Integration in bestehende Abläufe, mit Berechtigungskontrollen, Agenten-Entscheidungsverfolgung und lesbaren Diffs, um Qualität und Rückverfolgbarkeit aufrechtzuerhalten.

Mit einem Schwerpunkt auf Software-Engineering, GPT-5-Codex möchte ein technischer Beitrag sein in der Lage, komplexe Projekte zu erstellen, zu überprüfen und aufrechtzuerhalten, den Rechenaufwand an die tatsächliche Größe des Problems anzupassen und die Messlatte für KI-gestützte Codierungstools höher zu legen.

Red Hat
Verwandte Artikel:
Red Hat stärkt seine Enterprise-KI-Strategie mit OpenShift AI, F5 und einem Ökosystem intelligenter Agenten.