Codex 速報|Goal Mode 正式版・GPT-5.5 駆動と Appshots

Codex 速報|Goal Mode 正式版・GPT-5.5 駆動と Appshots

AI コーディングエージェントの主役が、本日は大きく動きました。OpenAI が「新しい Codex」を発表し、長時間タスク向けの Goal Mode が正式版へ、駆動モデルも GPT-5.5 へ刷新されています。2026年6月3日の最新動向をまとめました。

本日のヘッドライン

  • 【最重要】OpenAI が「新しい Codex」を発表 — Goal Mode 正式版化、macOS 向け Appshots、駆動モデルが GPT-5.5 へ、Python SDK(ベータ)も整備
  • 【重要】Cursor 3.6 が Auto-review 実行モードを追加 — 承認プロンプトを減らしつつ長時間稼働を安全化
  • 【注目】Windsurf が Devin クラウドエージェントを全プラン同梱、Cline はエージェントランタイムを SDK としてオープンソース化

目次 (7)

結論

本日2026年6月3日(対象期間 6月2日〜6月3日・日本時間)の主役は、OpenAI による「新しい Codex」の発表です。これまで実験的機能だった Goal Mode が app / IDE 拡張 / CLI で正式版に昇格し、特定の目標に向けて Codex を数時間〜数日にわたり走らせられるようになりました。あわせて macOS 向けの Appshots(別アプリのウィンドウを画面取得と取得可能テキスト付きで Codex に渡せる機能)が追加され、Codex を支える駆動モデルも GPT-5.5 へ刷新されています。導入経路としては Python SDK のベータ(pip install openai-codex)も整いました。

前日まで安定版 CLI(rust-v0.136.0)の到達と Amazon Bedrock の一般提供を追ってきた読者にとって、本日の発表は「機能とモデルの世代交代」という別軸の前進です。長時間タスクの正式運用と、別アプリの文脈をコピペなしで取り込める作業導線が、本番採用の検討材料に加わりました。

中堅・OSS 勢も動いています。Cursor 3.6 はツール呼び出しをリスク階層で振り分ける Auto-review 実行モードを追加し、Windsurf は Cognition の Devin クラウドエージェントを全プランに同梱しました。Cline は自社のエージェントランタイムを @cline/sdk としてオープンソース化しています。エージェントを長時間・安全に走らせる基盤づくりが、各社で同時に進んだ1日です。


【1】OpenAI が「新しい Codex」を発表 — Goal Mode 正式版・Appshots・GPT-5.5 駆動・Python SDK

OpenAI は「Codex for (almost) everything」として Codex の全面アップデートを公開しました(出典: https://openai.com/index/codex-for-almost-everything/ / https://developers.openai.com/codex/changelog)。柱は4点です。

(1) Goal Mode が正式版に昇格。これまで実験的機能だった Goal Mode が app / IDE 拡張 / CLI で正式提供となり、特定の目標に向けて Codex を数時間〜数日にわたり走らせられます。(2) macOS 向け Appshots。両方の Command キーを押すと最前面アプリのウィンドウを、画面取得と取得可能なテキスト付きで Codex に送れます。コピー&ペーストや手動説明なしに、別アプリの文脈からそのまま作業を続けられます。(3) 駆動モデルが GPT-5.5 へ。新モデル GPT-5.5 が Codex を支える構成になりました。あわせて2026年5月には GPT-5.5 Instant が ChatGPT の既定モデルとなり、Codex CLI の Goal Mode や ChatGPT for Excel も登場しています(出典: https://blogs.nvidia.com/blog/openai-codex-gpt-5-5-ai-agents/)。(4) Python SDK(ベータ)pip install openai-codex という標準の導入経路に加え、リフレッシュされた quickstart、API リファレンス、FAQ、サンプルが整備されました(出典: https://developers.openai.com/codex/changelog)。

長時間タスクを正式運用したいチームには Goal Mode の正式版到達が、別アプリの画面文脈を頻繁に参照する作業には Appshots が直接効きます。Python から Codex を組み込みたい開発者は、ベータの SDK でプロトタイプ着手の判断が可能になりました。


【2】Cursor 3.6 — Auto-review 実行モードで承認プロンプトを削減

Cursor は 2026年5月29日に Cursor 3.6 を公開し、Auto-review 実行モードを追加しました(出典: https://cursor.com/changelog)。Shell / MCP / Fetch のツール呼び出しに対し、許可リスト済みのものは即時実行、隔離可能なものはサンドボックスで隔離実行、それ以外は分類サブエージェントが「許可 / 別アプローチ / 承認要求」を判断します。承認プロンプトを減らしながら、長時間の稼働を安全に保てる設計です。

同じ窓では Composer 2.5 が公開され、Composer 2 比で長時間タスクの持続性や複雑な指示追従の信頼性が向上しています。作業項目を Cursor に割り当てるか @Cursor メンションでクラウドエージェントを起動できる Jira 連携も加わりました(出典: https://cursor.com/changelog)。直近で報じた Teams プランの料金改定に続き、Cursor は「長時間・安全に走らせる」方向での機能強化を重ねています。


【3】Windsurf が Devin を全プラン同梱、Cline はエージェントランタイムを OSS 化

エージェントの実行基盤でも動きがありました。Windsurf は Cognition の Devin クラウドエージェントを Windsurf 内で直接利用可能にし、セルフサーブの全プランに同梱しました(出典: https://windsurf.com/changelog)。ローカルセッションからワンクリックでタスクを委譲でき、Devin は専用 VM 上で処理します。あわせて Claude Opus 4.7 の fast mode(同等の知能で約2.5倍の出力速度)と Claude Opus 4.8 を通常料金で提供する更新も入っています。

Cline は、各層が単一責務を持ち下層のみに依存する階層型 TypeScript スタックを @cline/sdk としてオープンソース公開しました(Cline 2.0、出典: https://cline.bot/blog/introducing-cline-sdk-the-upgraded-agent-runtime)。この SDK が Cline の CLI と Kanban を駆動し、IDE 拡張も移行が進んでいます。公表ベンチでは Cline CLI(claude-opus-4.7)が 74.2%(Claude Code 公表値 69.4%)、claude-opus-4.6 で 71.9%(同 65.4%)とされています。エージェントの中核ランタイムを公開部品として配る流れは、長時間・安全な実行基盤を各社が整える動きと軌を一にします。


【4】Cognition が大型調達、プレマネー 250 億ドル評価へ

Devin を開発する Cognition は、2026年5月27日に 10億ドル超を調達し、プレマネー250億ドル評価に到達したと報じられました(出典: https://siliconangle.com/2026/05/27/vibe-coding-startup-cognition-doubles-valuation-new-1b-round/)。年換算売上は4.92億ドル、6か月連続で月次50%成長と発表されています。製品面では Devin の最新版 2.2 が公開され(出典: https://cognition.ai/blog/introducing-devin-2-2)、Fiserv との提携による中核バンキング技術の刷新への展開も明らかになりました(出典: https://investors.fiserv.com/news-releases/news-release-details/fiserv-and-cognition-partner-modernize-banking-technology-and)。Windsurf への Devin 同梱と合わせ、Cognition のクラウドエージェントが提供面・資本面の双方で存在感を増しています。


本日の動向まとめ

ツール 内容(2026年6月2日〜6月3日)
OpenAI Codex 「新しい Codex」を発表。Goal Mode が正式版に昇格・macOS 向け Appshots 追加・駆動モデルが GPT-5.5 へ・Python SDK(ベータ)整備(出典: https://openai.com/index/codex-for-almost-everything/ / https://developers.openai.com/codex/changelog)
Cursor Cursor 3.6 が Auto-review 実行モードを追加。許可リスト即時実行・サンドボックス隔離・分類サブエージェント判断。Composer 2.5・Jira 連携も(出典: https://cursor.com/changelog)
Windsurf Devin クラウドエージェントをセルフサーブ全プランに同梱。ワンクリック委譲・専用 VM 実行。Claude Opus 4.7 fast / 4.8 も追加(出典: https://windsurf.com/changelog)
Cline エージェントランタイムを @cline/sdk としてオープンソース化(Cline 2.0)。CLI と Kanban を駆動・IDE 拡張も移行中(出典: https://cline.bot/blog/introducing-cline-sdk-the-upgraded-agent-runtime)
Cognition / Devin 10億ドル超を調達しプレマネー250億ドル評価へ。Devin 2.2 公開・Fiserv 提携(出典: https://siliconangle.com/2026/05/27/vibe-coding-startup-cognition-doubles-valuation-new-1b-round/)

編集部からの展望

本日は OpenAI の「新しい Codex」が主役で、Goal Mode の正式版到達と GPT-5.5 駆動への刷新は、機能とモデルの世代交代を同時に進める大きな前進です。前日まで追ってきた安定版 CLI と Amazon Bedrock 一般提供が「土台の整備」だったのに対し、本日は「土台の上で何を任せられるか」が一段広がりました。長時間タスクの正式運用と、別アプリの文脈をコピペなしで渡せる Appshots は、日々の作業導線に直接効いてきます。

中堅・OSS 勢では、Cursor 3.6 の Auto-review、Windsurf への Devin 同梱、Cline のランタイム公開と、「長時間・安全に走らせる基盤」を各社がそれぞれの流儀で整えました。リスク階層に応じた制御や隔離実行という設計思想は、直近の権限制御強化の系譜と地続きです。Cognition の大型調達は、その基盤を支える資本面の裏付けと言えます。

次回の注目点は、新しい Codex の各機能の細部と Codex CLI 0.137 系列の到達、Cursor 3.7 の続報、そして6月18日に迫る Gemini CLI 無償ティア終了に向けた Antigravity CLI 移行の動きです。続報は次回の速報でお届けします。

参考になったら ♡
Codexer Navi 編集部
@codexer_navi

Anthropic の Claude / Claude Code を中心に、日本のエンジニア向けに最新動向と実務 を毎日発信。 運営方針 は メディアについて をご覧ください。