Codex アップデート解説|Goal Mode正式版とGPT-5.5駆動

Codex アップデート解説|Goal Mode正式版とGPT-5.5駆動

2026年6月3日、OpenAIが「新しいCodex」を発表し、コーディングエージェントとしてのCodexが大きくアップデートされた。実験的提供だったGoal Modeが正式版に昇格して長時間タスクを任せられるようになり、macOS向けのAppshotsが加わったほか、Codexを動かす土台モデルもGPT-5.5へと刷新されている。本記事では何がアップデートされたのかを機能ごとに整理する。


結論powered by Claude

今回のアップデートは、OpenAIが「Codex for (almost) everything」として打ち出したCodexの全面的な刷新だ。単発のコード補完を担うツールではなく、目標を与えて長時間任せられるエージェントとしてのCodexを前面に押し出し、Goal Modeの正式版化・macOS向けのAppshots・駆動モデルのGPT-5.5への更新が同時に届いた。

実務面で最も大きいのはGoal Modeが実験的提供から正式版へ昇格したことだ。特定のゴールを決めて数時間から数日にわたりCodexを走らせ、その間は別の作業に集中するという使い方が、app・IDE拡張・CLIのいずれからも正式機能として利用できるようになった。あわせてCodexを支える土台モデルがGPT-5.5へ刷新され、長時間タスクをこなす足場そのものが一段更新されている。

とはいえ、すべての機能を一度に使う必要はない。macOSを使うなら別アプリの画面情報をそのまま渡せるAppshotsから、定型の長時間作業を抱えているならGoal Modeから、というように自分の作業に近い入り口をひとつ選ぶのが現実的だ。本記事では各機能が「どの作業をどう楽にするのか」を具体的に示し、最初に触れるべき機能を見極める材料を提供する。

目次 (6)

「新しい Codex」とは何か — 単発の補完から「目標を任せるエージェント」への全面刷新

今回の発表は、個別機能の追加ではなくCodexそのものの位置づけを描き直す全面刷新だ。OpenAIは「Codex for (almost) everything(ほぼあらゆる用途のためのCodex)」というスローガンを掲げ、コードを書く補助ツールから、目標を与えて作業をまるごと任せられるエージェントへとCodexを押し上げた(出典: https://openai.com/index/codex-for-almost-everything/ )。コミュニティ向けの告知でも、この刷新が単なるバージョンアップではなく利用像の更新であることが説明されている(出典: https://community.openai.com/t/introducing-the-new-codex-for-almost-everything/1379125 )。

これまでのCodexは、エディタやターミナルの中で「次の一手」を提案する存在だった。今回のアップデートで前面に出たのは、「ここまで到達してほしい」というゴールを伝えれば、その達成に向けて自走してくれるという働き方だ。短いやり取りを何度も重ねる使い方に加えて、長い時間の作業を一括で委ねる使い方が標準的な選択肢として加わった、と捉えると全体像をつかみやすい。

重要なのは、この刷新が特定の場所に閉じていない点だ。後述するGoal Modeのように、app・IDE拡張・CLIという複数の入り口で同じ機能を使えるようになっている。普段デスクトップアプリを使う人も、エディタの拡張を使う人も、ターミナル中心の人も、それぞれの作業環境を変えずに新しいCodexへ移行できる。


Goal Mode の正式版化 — 数時間〜数日のタスクを「任せて待つ」が正式機能に

今回のアップデートで実務インパクトが最も大きいのがGoal Modeだ。これまで実験的提供という位置づけだった機能が正式版に昇格し、app・IDE拡張・CLIのいずれからも正式機能として使えるようになった(出典: https://developers.openai.com/codex/changelog )。

Goal Modeは、その名のとおり「達成したいゴール」を起点にCodexを動かす仕組みだ。一手ごとに指示を出すのではなく、目的地を伝えてから数時間〜数日という長い時間軸でCodexに作業を進めてもらい、その間は別の仕事に集中できる。たとえば、依存ライブラリの大きめな移行や、複数ファイルにまたがる地道な整理のように「手順は見えているが時間がかかる」種類の作業を、開始時にゴールとして渡しておき、まとまった成果が出た段階で結果を確認するという進め方が取りやすくなる。

実験的提供から正式版への昇格が意味するのは、こうした「任せて待つ」使い方が、一時的なお試し機能ではなく日常運用の前提として組み込める段階に入ったということだ。長時間タスクを任せる以上、何を達成したいかを最初に明確に言語化できるかが成果を左右する。ゴールが曖昧なまま長く走らせるより、「どこまで到達したら完了とみなすか」を決めてから渡すほうが、確認の手戻りを抑えやすい。


macOS の Appshots — 別アプリの画面とテキストを、コピペなしでCodexへ

macOSユーザー向けに追加されたのがAppshotsだ。両方のCommandキーを押すと、最前面にあるアプリのスクリーンショットと、そこから取得できるテキストをまとめてCodexへ渡せる(出典: https://developers.openai.com/codex/changelog )。

この機能が効くのは、「画面に映っている情報をCodexに伝えたいのに、コピペの往復が面倒」という場面だ。たとえば、別アプリに表示されたエラーダイアログの内容や、管理画面に出ている設定値、ドキュメントビューアで開いている仕様の一節を、いちいち選択してコピーし、Codex側に貼り直す——という手間がしばしば発生する。Appshotsを使えば、見ている画面をそのまま素材として渡せるため、状況説明にかかる往復が減り、本題のやり取りに早く入れる。

スクリーンショットだけでなく取得可能なテキストも一緒に渡せる点が実用上のポイントだ。画像として渡すと細かな文字が読み取りにくい場面でも、テキストが添えられていれば内容を正確に共有しやすい。なお、Appshotsは現時点でmacOS向けの機能であり、利用環境がmacOSかどうかが導入可否の前提になる。


GPT-5.5 が Codex を駆動 — 土台モデルの世代交代

機能の追加と並んで押さえておきたいのが、Codexを動かす土台モデルがGPT-5.5へ更新されたことだ。AIエージェントとしてのCodexは、その裏側で動くモデルの性能に支えられている。今回その駆動モデルがGPT-5.5の世代へ切り替わった(出典: https://blogs.nvidia.com/blog/openai-codex-gpt-5-5-ai-agents/ )。

これは個別の操作機能というより、Goal Modeのような長時間タスクやAppshotsで渡した情報の取り扱いを含め、Codex全体の振る舞いを下支えする基盤の更新だと捉えるのが正確だ。土台が更新されたという事実そのものは重要だが、その効果が自分の作業でどう表れるかは、扱うコードベースやタスクの性質によって変わる。ベンチマーク上の評価をそのまま自社環境に当てはめず、実際のタスクで手応えを確かめながら判断するのが堅実なアプローチになる。

ここでは「駆動モデルがGPT-5.5へ刷新された」という一次情報の範囲にとどめ、誇張は避ける。土台が更新されたことを前提に、後述の入り口選びと合わせて、自分の作業で試す価値があるかを見極めていきたい。


Python SDK(ベータ)— 標準的な導入パスが整い始めた

開発者向けには、Python SDKがベータとして提供され始めた。pip install openai-codex という形で、ほかのライブラリと同じ感覚でCodexを導入できる道筋が整いつつある(出典: https://developers.openai.com/codex/changelog )。

ベータという段階のため、仕様の追加・変更は今後も起こり得る。重要な処理に組み込む前には、変更履歴を確認しながら段階的に試すのが安全だ。現時点では「標準的なインストール手順が用意され始めた」という事実を押さえておけば十分で、本格的な作り込みは提供状況の安定を見ながら判断すればよい。


まとめ — 自分はどの機能から触ると得か

新しいCodexは、Goal Modeの正式版化・macOS向けのAppshots・GPT-5.5への土台モデル更新という三本柱で、「目標を任せて待つエージェント」としての性格を一段はっきりさせた。すべてを一度に使い込む必要はなく、自分の作業に最も近い入り口を一つ選ぶのが現実的だ。

定型の長時間作業や、手順は見えているが時間のかかるタスクを抱えているなら、まずGoal Modeから試すのがよい。「どこまで到達したら完了か」をゴールとして明確に渡せるタスクほど、任せて待つ使い方の効果が出やすい。macOSを使っていて、別アプリの画面情報をCodexに伝える場面が多いなら、Appshotsがコピペの往復を減らす入り口になる。コードからCodexを呼び出す自動化を検討しているなら、ベータのPython SDKから小さく試し、提供状況の安定を待ちながら範囲を広げていけばよい。

土台モデルがGPT-5.5へ更新された効果は、扱うコードベースやタスクの性質によって表れ方が変わる。ベンチマークの数値をそのまま結論にせず、自分の手元のタスクで手応えを確かめることが、今回のアップデートを実務に活かす近道になる。次に確認すべきは、各機能の提供範囲の広がりと、Python SDKの安定版到達のタイミングだ。

参考になったら ♡
Codexer Navi 編集部
@codexer_navi

Anthropic の Claude / Claude Code を中心に、日本のエンジニア向けに最新動向と実務 を毎日発信。 運営方針 は メディアについて をご覧ください。