2025年4月、OpenAIは最新のAIモデル「o3」と「o4-mini」を発表しました。
これらのモデルは、これまでの言語処理能力を超え、画像の理解や生成、ウェブ検索、ファイル解析など、より高度な推論とツールの統合を実現しています。本記事では、これらのモデルの特徴や性能、利用方法について詳しく解説します。
OpenAI o3:最先端の推論能力
「o3」は、OpenAIがこれまでに開発した中で最も高度な推論モデルです。このモデルは、複雑な問題解決や多面的な分析が求められるタスクにおいて、特に優れた性能を発揮します。
主な特徴
- 多様なツールの統合:ウェブ検索、Pythonによるデータ解析、画像の理解と生成、ファイルの解釈など、ChatGPT内のすべてのツールを統合的に活用できます。
- 画像を用いた推論:画像、図表、グラフなどの視覚情報を分析し、より深い理解と回答を提供します。
- 高精度な回答:外部専門家の評価によれば、o3は従来のモデル(o1)と比較して、難易度の高い実世界のタスクにおいて重大なエラーが20%少ないとされています。
ベンチマークでの成果
o3は、以下のようなベンチマークで新たな基準を打ち立てています。
- Codeforces:競技プログラミングの分野で、OpenAIの社員を超えるスコアを記録。
- AIME 2024:アメリカ数学選抜試験で96.7%の正答率を達成。
- GPQA Diamond:博士号レベルの科学問題で87.7%の正答率を記録。
- ARC-AGI:AGI(汎用人工知能)の進歩を測るベンチマークで、人間の平均スコアを上回る87.5%のスコアを達成。
OpenAI o4-mini:効率と性能の両立
「o4-mini」は、o3の高性能を維持しつつ、より軽量でコスト効率の高いモデルとして設計されています。特に数学、コーディング、視覚タスクにおいて優れた性能を発揮します。
主な特徴
- 高速かつ低コスト:小型ながら高い推論能力を持ち、迅速な応答が可能です。
- 幅広いタスクへの対応:STEM分野だけでなく、データサイエンスや非STEMタスクでも高いパフォーマンスを示します。
- 高い使用制限:効率性により、o3よりも高い使用制限をサポートし、大量の質問に対応可能です。
利用方法とアクセス
これらのモデルは、ChatGPTの各種プランで利用可能です。
- ChatGPT Plus、Pro、Teamユーザー:o3、o4-mini、o4-mini-highモデルにアクセス可能。
- 無料ユーザー:チャット画面で「理由(Reason)」を選択することで、o3-miniを利用可能。
また、API経由でも利用でき、開発者はニーズに応じてモデルの推論能力(low、medium、high)を選択できます。
OpenAI 今後の展望
OpenAIのCEOであるSam Altman氏は、GPT-5の開発が進行中であり、数カ月以内にリリース予定であると述べています。また、モデルの名称が複雑で分かりにくいとの指摘に対し、今後の改善を約束しています。
以上、「o3」と「o4-mini」の特徴や性能、利用方法でした。