Codex の推論レベルを使い分ける model_reasoning_effort

Codexer Navi 編集部 / 最終更新 2026-06-30

Codex に同じ依頼をしても、すぐ返ってくるときと、しばらく考え込んでから精度の高い変更を出してくるときがある。この差を握っているのが、モデルがどれだけ考えてから答えるかを決める model_reasoning_effort だ。モデルが gpt-5.5 や gpt-5.3-codex へ更新され、使用上限の数え方も見直されたいま、この一つの設定を意識的に動かせるかどうかが、速度・精度・消費のバランスを大きく左右する。本記事では五段階の推論レベルの目安と設定方法、タスク別の使い分けを公式情報に沿って整理する（出典: https://developers.openai.com/codex/config-reference）。

結論powered by Claude

model_reasoning_effort は、Codex が答えを返す前にどれだけ内部で考えるかを決める設定だ。値は minimal・low・medium・high・xhigh の五段階で、深くするほど難しい変更での精度は上がるが、その分だけ応答は遅くなり消費も増える。既定はおおむね中庸の medium で、まずはここを基準に、軽い作業は下げ、難所は上げる、という発想で動かすのが扱いやすい（出典: https://developers.openai.com/codex/config-reference）。

設定する場所は一つではない。いつもの既定として固定したいなら ~/.codex/config.toml に model_reasoning_effort を書き、その一回だけ変えたいなら CLI の -c フラグで上書きし、用途ごとに切り替えたいならプロファイルにまとめる。優先順位は CLI フラグが最も高く、次いでプロファイル、利用者設定の順なので、土台を config.toml に置きつつ例外をフラグで足す書き分けが基本になる（出典: https://developers.openai.com/codex/config-basic）。

使い分けの軸は「難しさ」と「予算」の二つだ。定型的な置換や読み取り中心の確認は低めで充分速く返り、設計判断や込み入ったバグ調査は高めにすると失敗が減る。一方で 高いレベルは応答が長くなり使用上限も早く減るため、何でも xhigh にするのは得策ではない。難所だけ一段上げ、終わったら戻す、という運用が結局いちばん消費に見合う（出典: https://developers.openai.com/codex/config-reference）。

目次 (10)

model_reasoning_effort が決めているもの
五段階の推論レベルと使いどころの目安
minimal と low — 速さを優先する軽い作業向け
medium — 迷ったときの標準
high と xhigh — 精度を優先する難所向け
推論レベルを設定する三つの方法
タスク別に推論レベルを使い分ける指針
使用上限・コストとの関係と、いま調整が効く理由
まとめ — 「ここぞで深く」を握れると快適さが変わる
出典

model_reasoning_effort が決めているもの

model_reasoning_effort は、Codex が答えを出力する前に、頭の中でどれだけ筋道を立てて考えるかの度合いを決める設定だ。Codex が土台にしている推論モデルは、回答をそのまま吐き出すのではなく、内部でいったん思考を巡らせてから結論をまとめる。この「巡らせる量」をどれくらい確保するかを指定するのが、この設定の役割になる。深く考えさせれば、複数のファイルにまたがる変更や、前提が入り組んだバグの原因特定のように、一足飛びに答えが出ない問題で精度が上がりやすい。逆に、軽い修正や定型的な作業では、深く考えても結果はほとんど変わらないのに、応答までの待ち時間と消費だけが増えてしまう。つまりこの設定は「賢さのつまみ」ではなく、「どこに思考の予算を割くか」を決めるつまみだと捉えると扱いやすい。値は文字列で指定し、minimal・low・medium・high・xhigh の五段階から選ぶ。既定はおおむね中庸の medium に置かれており、まずはこの基準から、作業の重さに合わせて上下させていくのが現実的だ（出典: https://developers.openai.com/codex/config-reference）。

ここで押さえておきたいのは、推論レベルはモデルそのものの選択（model キー）とは別の軸だということだ。どのモデルを使うかを決めたうえで、そのモデルにどれだけ考えさせるかを model_reasoning_effort で重ねて指定する。だからモデルを上位のものに変えなくても、推論レベルを一段上げるだけで、いまの作業に対する粘り強さを引き上げられる。モデル更新でリリースされた gpt-5.5 や gpt-5.3-codex でも、この設定の考え方は共通している。

五段階の推論レベルと使いどころの目安

推論レベルは五段階あるが、それぞれの境目を厳密な数値で覚える必要はない。大切なのは「どの作業ならどのあたりが釣り合うか」という肌感覚で、これは下から順に、速さ重視・標準・精度重視の三つの帯に分けて捉えると整理しやすい。下の帯は待たずに数をこなしたいとき、真ん中の帯は迷ったときの既定、上の帯は失敗が許されない難所、という対応だ。以下では、五段階を三つの見出しに分けて、それぞれの性格と向いている作業を具体的に示す。実際にはタスクの難しさは連続的なので、まず medium を基準に置き、そこから一段ずつ動かして手応えを確かめるのが、いちばん早く自分の基準を作る方法になる（出典: https://developers.openai.com/codex/config-reference）。

minimal と low — 速さを優先する軽い作業向け

minimal と low は、考える量を抑えて素早く返すことを優先する設定だ。文字列の一括置換、決まった書式へのフォーマット、コメントの追記、単純なファイル生成のように、答えが一通りに定まる作業では、深く考えさせても結果はほとんど変わらず、低めに振るほど待ち時間と消費を節約できる。とくに minimal は思考をほぼ挟まずに動くため、繰り返しの定型処理を数多くこなしたい場面で効く。一方で、判断を伴う変更をこの帯で頼むと、途中の検討が浅くなって取りこぼしが出やすい。あくまで「考えるまでもない作業を手早く片づける」ための帯だと割り切るとよい。

medium — 迷ったときの標準

medium は、速度と精度のどちらにも極端に振らない標準の設定で、多くの作業の出発点になる。日常的な機能追加、ふつうのバグ修正、既存コードの読解と小ぶりな手直しといった、大半の依頼はこの帯で過不足なくこなせる。Codex の既定もこのあたりに置かれているため、特別な理由がなければ、まずは medium のまま使い始めるのが無難だ。そのうえで、応答が遅すぎて手が止まると感じたら下げ、結論が浅くて取りこぼしが目立つと感じたら上げる、という調整の基準点として使うとよい。どのレベルが自分の作業に合うかを探すときの「ものさしのゼロ点」だと考えると位置づけがはっきりする。

high と xhigh — 精度を優先する難所向け

high と xhigh は、時間がかかっても確実さを取りにいく設定だ。複数ファイルにまたがる設計変更、原因が見えにくいバグの調査、仕様の解釈が割れる実装、影響範囲の広いリファクタリングのように、一手の誤りが後を引く作業で効く。とくに xhigh は最も深く考える設定で、難所のなかでも特に慎重さが要る局面に向く。ただし、深く考えるぶん応答は明確に長くなり、後述する使用上限の消費も速くなる。だからこの帯は常用するのではなく、難しい一手のときだけ引き上げ、山を越えたら標準へ戻す、という使い方が釣り合う。「いつも最大」ではなく「ここぞで最大」が、上の帯を活かすコツだ。

推論レベルを設定する三つの方法

推論レベルをどこで指定するかは、その設定をどれくらいの範囲で効かせたいかで選ぶ。いつもの既定にしたいのか、いまの一回だけ変えたいのか、用途ごとにまとめて切り替えたいのかで、書く場所が変わる。Codex はこの三つに対応する手段をそれぞれ用意しており、優先順位は CLI フラグが最も高く、次いでプロファイル、利用者設定の順になる。したがって、土台となる既定を config.toml に置き、用途別の束をプロファイルにまとめ、その場の例外をフラグで上書きする、という三層の書き分けが基本の形だ。以下に、それぞれの方法を順に示す（出典: https://developers.openai.com/codex/config-basic）。

既定として固定する: 利用者ごとの設定ファイル ~/.codex/config.toml に model_reasoning_effort = "medium" のように書く。起動のたびに読み込まれるため、毎回指定し直す手間がなくなる。
その一回だけ上書きする: CLI で codex -c model_reasoning_effort="high" のように -c(--config)フラグを渡す。フラグはそのコマンド一回かぎりで最優先となり、難所のときだけ一時的に深くする用途に向く。
用途ごとに切り替える: config.toml にプロファイルを定義し、codex --profile <名前> で呼び出す。レビュー用・実装用といった束をあらかじめ用意しておける。

プロファイルを使う場合は、次のように [profiles.<名前>] テーブルへ推論レベルを含む一式を書いておく。

[profiles.review]
model_reasoning_effort = "high"
approval_policy = "untrusted"
sandbox_mode = "read-only"

これを codex --profile review で呼び出せば、普段の設定はそのままに、レビューのあいだだけ深い思考に切り替わる。逆に、毎回フラグで同じレベルを指定していることに気づいたら、それは config.toml 側に移して既定にしてしまうほうが手数は減る。設定が反映されないと感じたときは、より優先度の高いフラグやプロファイルで上書きされていないかを先に確認すると原因にたどり着きやすい（出典: https://developers.openai.com/codex/config-reference）。

タスク別に推論レベルを使い分ける指針

レベルの目安と設定方法がわかったら、次は実際の作業への当てはめだ。使い分けの軸は突き詰めると「その作業はどれだけ間違いに弱いか」の一点で、間違えても気づきやすく直しやすい作業は低めで充分速く、間違えると後を引く作業は高めにして粘らせる、というのが基本の対応になる。たとえば、ドキュメントの文面整形や定型的なファイル生成は下の帯で数をこなし、ふつうの機能追加や小さなバグ修正は標準の medium に任せ、設計の分岐を含む変更や原因が読みにくい不具合の調査は上の帯に引き上げる。この「下げて速く・標準で回し・難所で上げる」という三段の運用を一つの作業のなかでも切り替えられると、待ち時間と精度の取り回しがぐっと楽になる。

実務での当てはめは、おおむね次のように考えると迷いにくい。

一括置換・整形・コメント追記など、答えが一通りの定型作業は minimal か low。
通常の機能追加・バグ修正・コード読解は medium を既定にする。
複数ファイルの設計変更・込み入ったバグ調査・広範なリファクタリングは high。
失敗が特に許されない一手や、上を試しても詰まる難所だけ xhigh に上げ、終わったら標準へ戻す。

ここで大事なのは、レベルを上げ下げする操作自体を作業の一部として習慣づけることだ。最初から最適なレベルを当てる必要はなく、medium で始めて手応えが薄ければ一段上げ、明らかに過剰なら一段下げる、という小さな調整を重ねるうちに、自分の作業に対する基準ができてくる。設定を変えたら、まず小さなタスクで意図どおりの粘り具合になっているかを一度確かめておくと安心だ（出典: https://developers.openai.com/codex/config-reference）。

使用上限・コストとの関係と、いま調整が効く理由

推論レベルを「とりあえず高くしておけば安心」と考えないほうがよいのは、深く考えさせるほど応答が長くなり、その分だけ使用上限の消費も速くなるからだ。Codex の利用は一定期間ごとの上限のなかで動いており、上の帯を常用すると、難所でない作業でも上限を早く食いつぶし、肝心なときに余力が残らない、という事態になりやすい。逆に、軽い作業をていねいに下の帯へ振り分けておくと、同じ上限のなかでこなせる作業量が増え、ここぞという難所に予算を回せる。つまり推論レベルの調整は、速度と精度だけでなく、限られた利用枠をどこに配分するかという家計のやりくりでもある。モデルが gpt-5.5 や gpt-5.3-codex へ更新され、使用上限の数え方も見直されたいまは、この配分を意識的に握れるかどうかが、体感の快適さに直結する局面だ（出典: https://developers.openai.com/codex/config-reference）。

実践としては、既定を medium に置いて土台の消費を抑え、難所だけフラグやプロファイルで一段上げる運用がもっとも釣り合う。あわせて、思考の要約をどの程度表示するかを決める model_reasoning_summary(auto・concise・detailed・none)を調整しておくと、深いレベルで考えさせたときに、その検討の道筋を確認しやすくなり、なぜその変更に至ったかを後から追える。深く考えさせること自体が目的ではなく、難しい問題を確実に片づけたうえで、限られた枠を無駄なく使い切ることが目的だと捉えると、レベルの上げ下げに迷いがなくなる。困ったときは、まず medium に戻して基準を取り直し、そこから作業の重さに応じて一段ずつ動かすのが、長く付き合ううえでの安全な構えになる（出典: https://developers.openai.com/codex/config-basic）。

まとめ — 「ここぞで深く」を握れると快適さが変わる

model_reasoning_effort は、Codex が答える前にどれだけ考えるかを決める設定で、minimal・low・medium・high・xhigh の五段階から選ぶ。深くするほど難しい変更での精度は上がるが、応答は遅くなり使用上限の消費も増えるため、何でも最大にするのは得策ではない。標準の medium を基準に、定型作業は下げ、設計判断や込み入った調査といった難所だけ上げて、終わったら戻す。この「下げて速く・標準で回し・難所で上げる」運用が、速度・精度・消費の三つを同時に取り回すいちばんの近道だ。

設定する場所は、既定なら ~/.codex/config.toml、その一回だけなら CLI の -c フラグ、用途別の束ならプロファイル、と優先順位に沿って書き分ければよい。モデルが更新され使用上限の数え方も見直されたいまは、このつまみを意識的に動かせるかどうかが体感を左右する。まずは medium から始め、作業の重さに合わせて一段ずつ動かしながら、自分の基準を育てていくのがおすすめだ。

出典

参考になったら ♡

この記事は役立ちましたか?

ご注意: Codexer Navi は OpenAI / GitHub / 各社の公式情報を直接参照し正確な内容に努めておりますが、本記事の内容に基づく投資判断・契約・利用結果による損害について責任を負いかねます。重要な意思決定の際は、必ず OpenAI 公式・ Codex 公式リポジトリの一次情報をご自身でご確認ください。

Codexer Navi 編集部

@codexer_navi

Anthropic の Claude / Claude Code を中心に、日本のエンジニア向けに最新動向と実務を毎日発信。運営方針はメディアについてをご覧ください。

プロフィール → 副社長コラム → レッスン一覧 →

Codex の推論レベルを使い分ける model_reasoning_effort

model_reasoning_effort が決めているもの

五段階の推論レベルと使いどころの目安

minimal と low — 速さを優先する軽い作業向け

medium — 迷ったときの標準

high と xhigh — 精度を優先する難所向け

推論レベルを設定する三つの方法

タスク別に推論レベルを使い分ける指針

使用上限・コストとの関係と、いま調整が効く理由

まとめ — 「ここぞで深く」を握れると快適さが変わる

出典

関連記事

Codex の設定ファイル config.toml の書き方と推奨設定

Codex のサンドボックス3モードと承認設定の使い分け方

Codex のウェブ検索 — 有効化と cached/live の使い分け

codex.exe とは？Windows 版の実体・場所・インストール方法