【2026-05-12 AI コーディングエージェント速報】GPT-5.2-Codex が SWE-Bench Pro 最高水準を達成/Windsurf が Devin Review を全ユーザー開放/Copilot CLI v1.0.45 で /autopilot コマンド追加 他

【2026-05-12 AI コーディングエージェント速報】GPT-5.2-Codex が SWE-Bench Pro 最高水準を達成/Windsurf が Devin Review を全ユーザー開放/Copilot CLI v1.0.45 で /autopilot コマンド追加 他

本日 2026年5月12日、Codexer Navi 編集部が AI コーディングエージェント業界の最新動向をニュース番組スタイルでお届けします。対象期間は 2026年5月11日〜12日(日本時間)。今回は OpenAI が新世代コーディングモデル「GPT-5.2-Codex」を突如投入した週となりました。Windsurf・GitHub Copilot CLI も同日に大型アップデートを重ね、業界の動きが再び加速しています。

本日のヘッドライン

  • 【最重要】GPT-5.2-Codex リリース — SWE-Bench Pro で最高水準、長期エージェント作業を大幅強化
  • 【重要】Windsurf が Devin Review / Quick Review を全 IDE ユーザーに開放
  • 【重要】GitHub Copilot CLI v1.0.45 — /autopilot・/fork 追加、起動 1.5 秒短縮
  • 【注目】OpenAI Codex CLI v0.131.0-alpha.7〜9 が短時間で連続リリース


結論powered by Claude

2026年5月11〜12日、OpenAI が GPT-5.2-Codex を投入し、SWE-Bench Pro および Terminal-Bench 2.0 でベンチマーク最高水準を更新しました。Windsurf は Cognition 買収後の統合成果として AI コードレビュー機能を全ユーザーに開放。GitHub Copilot CLI は /autopilot コマンドとセッション分岐機能を追加し、起動速度も大幅に改善。OpenAI Codex CLI は alpha 版を連続投下し、v0.131.0 安定版リリースが近いことを示しています。

目次 (6)

【1】GPT-5.2-Codex リリース — SWE-Bench Pro で最高水準、長期エージェント作業を大幅強化

OpenAI は 2026年5月11日に「GPT-5.2-Codex」を正式発表しました(出典: https://openai.com/index/introducing-gpt-5-2-codex/)。

GPT-5.2-Codex は GPT-5.2 ベースをエージェント型コーディング向けにさらに最適化したモデルです。主要な強化点は四つあります。第一に、長期実行タスクにおけるコンテキスト圧縮の改善により、長時間セッション中の精度低下が抑制されました。第二に、大規模リファクタリング・マイグレーション作業への対応力が強化され、大型コードベース全体を跨ぐ変更作業の完遂率が向上しています。第三に、Windows 環境でのパフォーマンスが改善され、クロスプラットフォームでの利用体験が均質化されました。第四に、サイバーセキュリティ関連タスクへの能力が大幅に強化されています。ベンチマークでは SWE-Bench Pro および Terminal-Bench 2.0 で最高水準を達成したとされます(出典: https://developers.openai.com/codex/changelog)。

有料 ChatGPT ユーザー向けには全 Codex サービスで即日提供が開始されており、API 経由のアクセスは数週間以内に展開予定です。Codex を業務利用している開発者にとっては、コンテキスト圧縮の改善により長時間セッションの品質が向上し、大規模コードベースのリファクタリング自動化が現実的な選択肢になります。API 公開後はモデル指定を変更するだけで既存の Codex 連携パイプラインを強化できる見込みです。


【2】Windsurf — Devin Review / Quick Review を全 IDE ユーザーに開放

Windsurf は 2026年5月12日に、AI 駆動コードレビュー機能「Devin Review」および「Quick Review」を全 Windsurf IDE サブスクリプションユーザーへ追加料金なしで開放しました(出典: https://windsurf.com/changelog)。

Windsurf はすでに Devin 開発元の Cognition に買収されており、今回の開放は Devin の技術スタックを IDE 内に本格統合する動きの一環です。Devin Review はセルフサービスユーザー向けに 2 週間の無料トライアル付きで提供されます。Windsurf 独自の SWE-1.5 モデルは高速なコード推論を特徴とし、Fast Context が SWE-grep により 10 倍高速なコード検索を実現しているとされています(参考: https://releasebot.io/updates/windsurf)。

PR レビューの待ち時間短縮と品質向上の両立が期待されます。Cursor と Windsurf を比較検討しているエンジニアにとっては、エンタープライズ級のコードレビュー機能が追加費用なしで利用できるようになったことはコスト優位性が高まる要素です。先日発表された GitHub Copilot の使用量課金移行を受け、Windsurf への乗り換えを検討する動きが加速する可能性があります。


【3】GitHub Copilot CLI v1.0.45 — /autopilot・/fork コマンド追加、起動速度を最大 1.5 秒短縮

GitHub は 2026年5月11日 17:43 UTC に Copilot CLI v1.0.45 をリリースしました(出典: https://github.com/github/copilot-cli/releases)。

今回のリリースで注目される追加機能は三つです。第一に、/autopilot コマンドによるモード切り替えが追加されました。インタラクティブモードとオートパイロットモードをその場で切り替えられるため、状況に応じたエージェントの自律実行と確認ステップの挿入を使い分けやすくなっています。第二に、/fork コマンドが追加され、現在のセッションを新しい独立セッションとして分岐できるようになりました。複数の実装方針を並列で試す際や、セッションの状態を保全しつつ派生調査を行う場面での利便性が高まります。第三に、OpenTelemetry 出力が GenAI セマンティック規約に準拠するようになり、MCP ツール呼び出しのトレースが標準化されました。可観測性基盤を持つチームにとって Copilot CLI のトレーシング統合が容易になります。

起動速度の面では、OSC カラークエリ処理を最適化することで最大 1.5 秒の短縮を実現。日常的な CLI 利用体験の改善として体感しやすいアップデートです。Windows 環境では PowerShell 7+ が未導入の場合のフォールバック機能も追加されています。


【4】OpenAI Codex CLI v0.131.0-alpha.7〜9 が短時間で連続リリース — 安定版リリースが近いか

OpenAI の Codex CLI は 2026年5月12日の早朝(UTC)に alpha.7、alpha.8、alpha.9 を短時間で連続リリースしました(出典: https://github.com/openai/codex/releases)。

前回収録済みは alpha.5(5月10日)まで。各アルファ版の詳細な変更内容は GitHub のページ表示エラーにより全容の取得が困難でしたが、v0.131.0 系ではプラグイン共有・フック詳細表示・シンプル化されたリモート起動・スレッドページネーション・AWS Bedrock 認証(AWS ログイン)・画像解像度改善が中心機能として開発中です。

alpha 版の短時間連続投下は安定版リリースが近いシグナルとして業界で注目されています。Codex CLI を組み込んでいる開発者は v0.131.0 stable のリリースノートを待ちつつ、Bedrock 認証対応を活用した AWS 統合のアーキテクチャを事前に設計しておく価値があります。


本日の動向まとめ

| ツール | 内容(2026年5月11〜12日) | |--------|--------------------------|| | GPT-5.2-Codex | 有料 ChatGPT ユーザー向けに全 Codex サービスで提供開始。API 経由は数週間以内に展開予定(出典: https://openai.com/index/introducing-gpt-5-2-codex/) | | Windsurf | Devin Review・Quick Review を全サブスクユーザーに開放。セルフサービスユーザーは 2 週間無料トライアル付き(出典: https://windsurf.com/changelog) | | GitHub Copilot CLI | v1.0.45 で /autopilot・/fork・OpenTelemetry 準拠を追加(出典: https://github.com/github/copilot-cli/releases) | | OpenAI Codex CLI | alpha.7〜9 連続投下。v0.131.0 stable リリースが近い可能性(出典: https://github.com/openai/codex/releases) |


編集部からの展望

本日最大のインパクトは GPT-5.2-Codex の登場です。コンテキスト圧縮の改善と大規模リファクタリング対応の強化は、「どこまで AI エージェントに任せられるか」という境界をさらに押し広げます。SWE-Bench Pro での最高水準達成は、ベンチマーク上の指標が実務レベルに着実に近づいていることを示しており、エンタープライズ採用を後押しするシグナルとして業界全体で注目されています。

Windsurf の Devin Review 開放は、Cognition 買収後の統合成果が IDE ユーザーに届いた最初の大きな節目です。Copilot CLI v1.0.45 の /autopilot コマンドと合わせ、AI コーディングエージェントの「自律実行と人間による確認のバランス調整」という共通テーマが各ツールで重視されていることが読み取れます。

次回の注目点は GPT-5.2-Codex の API 公開タイミングと、OpenAI Codex CLI v0.131.0 安定版のリリースです。続報は次回の速報でお届けします。

参考になったら ♡
Codexer Navi 編集部
@codexer_navi

Anthropic の Claude / Claude Code を中心に、日本のエンジニア向けに最新動向と実務 を毎日発信。 運営方針 は メディアについて をご覧ください。