
要約 — このレッスンの要点
- コンテキストウィンドウとは「GPT が一度に読める最大テキスト量」のこと。
- GPT-5 系モデルは最大数十万〜数百万トークンのウィンドウを持ち、長文一括処理に対応する。
- 長い PDF・コードベース・会議録を丸ごと貼り付けて質問できるのが強みだ。
- 推論モデル(o3 系)は回答前に内部で深く考えるモード。複雑な推論タスクで特に有効。
- ウィンドウの中央部分ほど GPT の注意が薄れる傾向があるため、重要情報は冒頭か末尾に置く。
コンテキストウィンドウとは
大規模言語モデル(LLM)は「その会話の中で見えているテキスト全体」を読んで回答を生成します。 この「一度に処理できる最大量」を コンテキストウィンドウ と呼びます。 単位はトークン(token)で、日本語のひらがな・カタカナ 1 文字はおおむね 1〜2 トークン、 英単語は 1 語が 1〜2 トークン程度です。
会話が長くなるにつれて「プロンプト + 会話履歴 + 返答」の合計がウィンドウを圧迫します。 ウィンドウを超えると、古い会話部分が見えなくなります。
GPT のウィンドウ規模
OpenAI の GPT 系モデルは、世代を重ねるごとにコンテキストウィンドウが拡大しています。
- ChatGPT(Web UI): モデルとプランにより 8K〜128K トークン以上が目安。
- OpenAI API 経由: GPT-5 / GPT-4o / o3 系で最大数十万〜数百万トークンのウィンドウを利用可能(出典: OpenAI Models)。
- 100 万トークンは A4 用紙約 750 枚分の英語テキスト、または文庫本 4〜5 冊分に相当します。
最新の上限値は OpenAI のモデルカードで都度確認してください。
長文読解への活用
大きなコンテキストウィンドウは以下のようなタスクで威力を発揮します。
- PDF の丸ごと要約: 100 ページを超える報告書・論文をそのまま貼り付けて要約・Q&A ができる。
- コードベースの一括レビュー: 複数ファイルをまとめて貼り付けて、全体の設計を分析させる。
- 会議録・議事録の分析: 数時間分の書き起こしを渡して「誰が何を決めたか」を抽出。
- 長編の一貫性チェック: 小説・マニュアルの全文を通して矛盾を探させる。
効果的な配置のコツ
研究によると、LLM は ウィンドウの中央部分の情報を失念しやすい傾向があります。 これを「Lost in the Middle」問題と呼びます。
実用上の対策:
- 最重要な指示・制約はプロンプトの 冒頭または末尾 に置く。
- 長い資料を貼った後に「この資料をもとに〜してください」と末尾で再度タスクを明示する。
- 複数の資料を渡す場合は、優先度の高いものを最後に置く。
推論モデル(o3 系)で深く考えさせる
OpenAI の o 系モデル(o3 / o3-mini など) は、回答を生成する前に内部で長い思考プロセスを走らせる「reasoning」設計です。 通常の応答より時間がかかりますが、以下のようなタスクで精度が向上します。
- 数学・論理パズルなど段階的な推論が必要な問題
- 複数の制約条件を同時に満たす必要がある計画立案
- コードのバグ特定とリファクタリング提案
ChatGPT の UI ではモデル切替で o3 系を選択、API では model に o3 などを指定して呼び出します。
推論モデルは応答時間と料金が増えるため、用途に応じて GPT-4o と使い分けます。
ウィンドウとトークン料金の関係
API を利用する場合、コンテキストウィンドウのトークン数がそのまま料金に影響します。 大量のテキストを毎回渡すと、コストが急増します。 「Prompt Caching」という仕組みを使うと、繰り返し使う長文の処理コストを削減できます。 これは Level 5「API / SDK」で詳しく扱います。