AI Codex とは何か — GPT や Codex CLI との違いと現在の使い方

AI Codex とは何か — GPT や Codex CLI との違いと現在の使い方

「AI Codex」という言葉は、2021年に登場した OpenAI の旧コード生成モデルと、2025年以降に提供が本格化したエージェント型コーディングツールの双方を指す場合があり、混同されやすい。本記事では、AI Codex が何を意味し、GPT や Codex CLI・Codex on Web とどう関係するかを現時点の情報に基づいて整理する。

結論powered by Claude

「AI Codex」は OpenAI が開発したコーディング専用の AI システムの総称として使われているが、その内実は 2021年時点と 2026年時点では大きく異なる。2021年に登場した旧 Codex は GPT-3 をコードで追加学習させたモデルであり、GitHub Copilot の初期バックエンドとして使われた。2023年3月に無償 API が廃止されてモデルとしての Codex は一線を退いたが、OpenAI はその後 Codex というブランドを AI コーディングエージェント全体の名称として再定義した。

現在の AI Codex は、ターミナルで動く Codex CLI と、ブラウザから使える Codex on Web の 2 形態で提供されている。いずれもバックエンドは GPT-5 系モデル(現時点では主に GPT-5.3)だが、GPT との違いは「汎用会話 AI」ではなく「リポジトリ内で実際に作業するエージェント」として設計されている点にある。コードを書くだけでなく、ファイルを読み、テストを実行し、差分を作り、レビュー可能な形に整えるところまで担う。

GitHub Copilot や Cursor と AI Codex の大きな違いは動作の起点と作業単位だ。Copilot はエディタ内でリアルタイムに補完を提供し、Cursor は IDE として AI 機能を統合する。一方 AI Codex はターミナルやブラウザから「このリポジトリのこのバグを直してほしい」とタスク単位で依頼し、エージェントが自律的に調査・修正・テストまで進める。IDE に常駐する補完ツールではなく、委任型の作業代行エージェントとして位置づけると理解しやすい。

目次 (16)

AI Codex の誕生と変遷 — モデルからエージェントへ

OpenAI が最初に「Codex」と名付けたモデルは、2021年8月に公開された GPT-3 ベースのコード生成モデルだ。このモデルは GitHub から収集した大量のコードで追加学習されており、自然言語のコメントからコードを生成する能力を持っていた。GitHub Copilot はこの旧 Codex を API 経由で利用する形でスタートしており、当時は「Copilot のエンジン = Codex」という構図が広く知られていた。旧 Codex は当初、無償でプレビュー提供されていた API 経由での利用が開発者コミュニティで注目を集め、コーディング支援 AI の先駆的な存在として位置づけられていた(出典: https://openai.com/index/openai-codex/)。

旧 Codex モデルの終了と OpenAI による再定義

旧 Codex モデルは 2023年3月に無償 API の提供が終了し、有償でもほぼ使われなくなった。GitHub Copilot も順次 GPT-4 系モデルへ移行したため、旧 Codex としての存在感は急速に薄れた。しかし OpenAI はその後、「Codex」というブランド名をエージェント型コーディングシステム全体の名前として復活させた。2025年から本格展開された Codex CLI と Codex on Web がその実体で、旧モデルとは完全に別のアーキテクチャ・目的で構築されている(出典: https://openai.com/codex/)。単なるコード補完 API から、タスクを受け取って自律的に完結させるエージェントへと、コンセプト自体が刷新されたと理解するのが正確だ。

エージェント型に生まれ変わった理由

GPT-4 から GPT-5 への世代交代は、AI がコードを「生成する」から「作業を完結させる」方向へ進化する転換点でもあった。OpenAI はこの転換に合わせ、単なるコード補完ではなくタスク全体を担うエージェントとして AI Codex を再設計した。具体的には、リポジトリのクローン・ファイル参照・コマンド実行・テスト実行・差分確認までを一つのセッション内で完結させる能力を持つ。「何行目を直して」という指示ではなく「このバグを直してテストを通して」という目的ベースの依頼が使えるのはエージェント設計の恩恵だ。2026年6月時点では Goal Mode が正式機能として提供されており、数時間から数日規模の長期タスクをバックグラウンドで自律的に進める能力も実用段階に入っている(出典: https://openai.com/index/codex/)。


GPT と AI Codex の違いはどこにあるか

GPT(ChatGPT など)と AI Codex はどちらも OpenAI が提供する AI だが、設計目的と作業単位が根本的に異なる。GPT は汎用の言語モデルとして、質問への回答・文章生成・翻訳・要約など幅広い用途をカバーする。コードも書けるが、ファイルシステムへのアクセスやターミナルコマンドの実行は基本的に行わない(Code Interpreter など特定のツール環境を除く)。ユーザーが GPT に「このコードを修正して」と頼んでも、GPT は修正案をチャット画面に出力するところで止まる。変更をファイルに反映する作業は、ユーザー自身が行う必要がある。

AI Codex はコーディングに特化したエージェントとして、リポジトリへのアクセス権を前提に設計されている。サンドボックス上でターミナルコマンドを実行し、ファイルを読み書きし、テストを走らせ、差分を作るところまでを一連の作業として担う。ユーザーが「このバグを修正してほしい」と依頼すると、Codex はリポジトリのコードを参照して原因を特定し、修正を適用し、テストを実行して、レビュー可能な差分として結果を提示する(出典: https://developers.openai.com/codex/app)。

なぜ「Codex」と「GPT」を使い分けるのか

OpenAI が「GPT」と「Codex」を別製品として展開する理由は、使い方の粒度が根本的に違うからだ。GPT はプロンプトを渡して即座に回答を得る「問答型」であるのに対し、AI Codex は「作業を委任して結果を待つ」エージェント型だ。両者は競合ではなく補完関係にあり、設計方針の議論や技術選定には ChatGPT(GPT)を使い、決まった実装の実行は AI Codex に任せるという使い分けが一般的になりつつある。設計フェーズと実装フェーズを意識的に分けると、どちらのツールも最大限に活かせる。


AI Codex の現在の形 — CLI とウェブ版の 2 系統

2026年時点での AI Codex は、使い方の異なる 2 つの形で提供されている。ローカル環境で動く CLI 版と、ブラウザから使えるウェブ版で、用途や作業規模によって使い分けられる。

Codex CLI — ターミナルから使うコーディングエージェント

Codex CLI は npm パッケージ @openai/codex として提供されるターミナル向けのエージェントだ。Node.js 環境があれば npm install -g @openai/codex でインストールでき、インストール後は codex コマンドでリポジトリに対して自然言語の指示を出せる(出典: https://github.com/openai/codex)。Codex CLI はローカルファイルに直接アクセスするため、クラウドにリポジトリをアップロードする必要がなく、プライベートなコードベースや社内システムでも安心して使える点が大きな特徴だ。

Codex CLI の主な特徴は次の通りだ。

  1. Sandbox Mode — デフォルトでコマンド実行に確認を求めるモードが有効になっており、意図しないファイル変更やコマンド実行を防ぐ安全設計になっている。--approval-policy オプションで承認ポリシーを調整できる。
  2. AGENTS.md によるルール伝達 — リポジトリのルートに AGENTS.md を置くと、コーディング規約・禁止事項・テストコマンドを Codex に事前に伝えられる。チームの開発規約を自然文で書いておくほど、毎回の依頼文が短くなる。
  3. サブエージェントのサポート — 1 つのタスクを複数のサブタスクに分割し、並行して作業を進める機能を持つ。大規模なリファクタリングを「ファイル単位のサブエージェント群」に割り振ることができる。
  4. セッション引き継ぎcodex continue-session コマンドで前回のセッション状態を引き継ぎ、サンドボックスの再起動コストを抑えて連続作業できる。

2026年6月時点で CLI の安定版は v0.14.0 系で提供されており、セッション引き継ぎや並行処理の安定性が順次改善されている(出典: https://github.com/openai/codex/releases)。

Codex on Web — ブラウザから使う Codex エージェント

Codex on Web は chatgpt.com/codex からアクセスできるブラウザ版のエージェントで、GitHub リポジトリを接続してタスクを依頼できる(出典: https://developers.openai.com/codex/app)。インストール不要で使い始められる点と、Goal Mode によるバックグラウンド実行が大きな特徴だ。Goal Mode は数時間から数日規模の長期タスクに対応しており、依頼後にパソコンから離れても Codex が処理を進め続け、完了後に通知を受け取れる。スマートフォンの ChatGPT アプリからも進捗の確認と追加指示ができるため、大規模なリファクタリングや長時間の調査タスクに向いている(出典: https://openai.com/index/work-with-codex-from-anywhere/)。複数の「会話(Conversation)」を同時に走らせることができ、並行してタスクを進めることで全体の待機時間を大幅に短縮できる。


GitHub Copilot・Cursor との使い分け

AI コーディングツールが増えた 2026年時点で、AI Codex・GitHub Copilot・Cursor の 3 つをどう使い分けるかは実用上の重要な問いになっている。ツールの性格の違いを理解すると、3 つを組み合わせて使うのが合理的な選択だとわかる。

GitHub Copilot はエディタ内でリアルタイムに補完候補を提示するツールだ。コードを書く手を止めずに候補を受け取れるため、日常的なコーディングのスループットを上げる用途に最も向いている。GitHub Copilot CLI という派生ツールもあるが、核となるのはエディタ補完の体験だ(出典: https://github.com/features/copilot)。コード1行1行を自分で書く作業を加速する「補完パートナー」として機能する。

Cursor は VSCode をベースに AI 機能を統合した IDE で、コードベース全体を参照しながら編集・検索・チャットができる(出典: https://www.cursor.com/)。エディタの操作性を維持しながら AI の支援を受けられる点が特徴で、既存の IDE ワークフローを大きく変えずに AI コーディングを取り入れたい開発者に選ばれることが多い。リポジトリ全体を参照した回答や、コードのインライン編集への AI 介入を得意とする。

AI Codex は上記 2 つと異なり、エディタを介さずにタスク単位で作業を委任するモデルだ。「このバグを直してプルリクエストを作ってほしい」というレベルの指示を受け、リポジトリを自律的に探索して変更を完結させる。日常的な補完よりも、調査・実装・テストをまとめて任せたい場面で威力を発揮する。3 つを同時に使っても矛盾はなく、コーディング中の補完は Copilot、まとまった実装タスクは AI Codex、IDE の統合環境は Cursor という組み合わせは現実的な選択肢だ。


AI Codex を使い始めるための前提条件

AI Codex を試すには、CLI 版とウェブ版でそれぞれ異なる準備が必要だ。

Codex CLI を試す場合

Codex CLI を使うには、まず以下の環境を整える。

  1. Node.js 22 以上をインストールする。公式の nodejs.org からダウンロードするか、nvm などのバージョンマネージャーを使う。
  2. OpenAI API キーplatform.openai.com で取得し、環境変数 OPENAI_API_KEY に設定する。
  3. npm install -g @openai/codex で CLI をインストールする。
  4. 試したいリポジトリのディレクトリに移動し、codex コマンドを実行してタスクを入力する。

API キーには使用量に応じた従量課金が発生する。Codex CLI が呼び出すモデル(GPT-5.3 など)の料金は OpenAI の料金ページ で確認できる(出典: https://openai.com/pricing)。初回利用では無料クレジットが付与される場合があるため、まず小さなタスクで試してから使用量を見積もるのが安全だ。

Codex on Web を試す場合

Codex on Web は ChatGPT のプランに紐づいて提供される。

  1. ChatGPT Plus・Pro・Teams・Enterprise のいずれかのプランに加入する。
  2. chatgpt.com/codex にアクセスしてページを開く。
  3. GitHub アカウントを接続してリポジトリを選択する。
  4. タスクの内容を自然言語で入力して実行を依頼する。

無料プランでは Codex on Web は利用できない点に注意が必要だ(出典: https://help.openai.com/en/articles/11369540-using-codex-with-your-chatgpt-plan)。Plus プランからアクセスできるが、利用可能なタスク数や優先度はプランによって異なる。Pro プラン以上では利用制限が緩和され、Goal Mode の長時間タスクをより多く走らせられる。


AI Codex が向いているタスクと向かないタスク

AI Codex はすべての開発作業を代行できるわけではなく、向き不向きがある。適切なタスクを選んで依頼することが、短い待ち時間で質の高い結果を得るための基本だ。

向いているタスクの代表例を挙げる。

  1. バグ修正と原因調査 — エラーログや再現手順を渡し、原因特定と修正・テスト追加まで一括で依頼できる。原因が不明瞭な場合でも、Codex がコードベースを探索して候補を絞り込む。
  2. リファクタリング — 「この関数を小さく分割し、型注釈をつけて既存テストを通してほしい」という依頼が安定して動く。変更範囲を明示するとより確実だ。
  3. テストコード追加 — カバレッジの低い部分を指定してテストケースを書かせる。対象ファイルと使用するテストフレームワーク、実行コマンドを伝えると精度が上がる。
  4. ドキュメント生成 — コードベースを読んで関数の説明や API 仕様書を生成させる。既存のコメントを整理・統一する用途にも使える。

向かないタスクとその理由

高度な設計判断が必要なアーキテクチャ方針の決定や、複数システムをまたぐ技術選定は、AI Codex よりも ChatGPT(GPT)との議論を先に行って方針を固めてから委任する方が効率的なことが多い。また AI Codex はサンドボックス上での作業を前提としており、本番データベースや稼働中のサービスへの直接操作には適していない。安全を担保するために差分レビューと人間の承認を挟む設計が基本だ。

依頼文に「完了条件」を明示することも重要だ。「このバグを直してほしい」という曖昧な依頼より、「tests/test_auth.py が全件通る状態でバグを修正してほしい、変更してよいのは src/auth/ 以下のみ」と条件を書いた方が、意図通りの差分が返ってくる確率が上がる(出典: https://developers.openai.com/codex/cli)。


まとめ

AI Codex は「コードを書く AI」という初期イメージを超え、リポジトリ内で調査・実装・テスト・レビュー用差分の作成まで担うエージェントへと進化した。GPT との違いは目的の専門性と作業の完結性にあり、GitHub Copilot や Cursor のような補完・IDE ツールとは用途の粒度が異なる。Codex CLI はローカル環境で即座に試せる入口として、Codex on Web は長期・大規模タスクを委任する基盤として使い分けるのが現時点での実践的な活用方法だ。まず小さなバグ修正やテスト追加から試し、「依頼 → 差分確認 → 取り込み」のサイクルを体験することで、AI Codex が得意とする作業の感覚が掴める。

出典

参考になったら ♡
Codexer Navi 編集部
@codexer_navi

Anthropic の Claude / Claude Code を中心に、日本のエンジニア向けに最新動向と実務 を毎日発信。 運営方針 は メディアについて をご覧ください。