はじめに
2025年8月7日、OpenAIは待望の次世代言語モデル「GPT-5」を正式発表しました。本稿では、OpenAIが公式サイトで発表した「GPT-5 が登場」という記事をもとに、GPT-5の技術的特徴、性能向上、安全性の改善について詳しく解説します。従来のモデルから大きく進化したGPT-5の仕組みや、実際のユーザーにとってどのような変化をもたらすのかを説明していきます。
参考記事
- タイトル:GPT-5 が登場
- 著者:OpenAI
- 発行元:OpenAI
- 発行日:2025年8月7日
- URL:https://openai.com/ja-JP/index/introducing-gpt-5/
要点
- 統合システム:GPT-5は高速応答用と深い推論用の2つのモデルを自動切り替えする統合システムである
- 性能向上:コーディング、文章作成、ヘルスケアの3分野で従来モデルを大幅に上回る性能を実現
- 信頼性改善:ハルシネーション(事実でない情報の生成)を約20-70%削減し、より正確な回答を提供
- 安全性強化:新たな「セーフコンプリーション」手法により、拒否するだけでなく安全な範囲で有用な情報を提供
- 効率性向上:GPT-5 thinkingは従来のo3モデルと比較して50-80%少ない出力トークンでより高い性能を実現
- 新機能:GPT-5 Proでは拡張推論により、さらに複雑な問題に対応可能
詳細解説
GPT-5の革新的なシステム構成
GPT-5の最大の特徴は、統合されたシステム構成にあります。従来のモデルとは異なり、GPT-5は以下の3つの要素から構成されています。
- 高速応答用モデル(高スループット):日常的な質問に迅速に回答
- 複雑問題用モデル(深い推論/GPT-5 thinking):複雑な問題に対して時間をかけて思考
- リアルタイムルーター機能:質問の内容や複雑さに応じて最適なモデルを自動選択
このルーター機能は、会話の種類、複雑さ、必要なツール、ユーザーの意図(「深く考えて」などの指示)を瞬時に判断し、適切なモデルに振り分けます。ユーザーは意識することなく、最適化された回答を受け取ることができます。
具体的な性能向上の詳細
コーディング分野での進化
GPT-5はコーディング分野で特に大きな進歩を遂げています。SWE-bench Verified(ソフトウェアエンジニアリングベンチマーク)では74.9%の精度を達成し、従来のGPT-4oの30.8%を大幅に上回りました。
特筆すべきは、単一のプロンプトで完全なWebアプリケーションやゲームを作成できる能力です。例えば、「ジャンピングプラットフォームランナーゲームを作成してください」という指示だけで、以下の要素を含む完全なHTMLファイルを生成できます:
- カラフルなUI
- パララックススクロール背景
- ハイスコア追跡機能
- リトライボタン
文章作成とクリエイティブ表現
文章作成においても大幅な向上が見られます。GPT-5は文学的な深みとリズムを備えた魅力的な文章を生成できるようになりました。特に、韻を踏まない弱強五歩格や自由詩などの厳密なルールが少ない形式でも、形式の維持と表現の明確さを高いレベルで両立します。
ヘルスケア分野での信頼性向上
医療・ヘルスケア分野では、HealthBenchで67.2%のスコアを達成し、従来のGPT-4oの32.0%を大きく上回りました。より重要な改善点として、HealthBench Hard Hallucinations(困難な健康相談での不正確な情報生成率)では3.6%まで抑制し、GPT-4oの15.8%から大幅に改善されています。
信頼性と安全性の大幅改善
ハルシネーション(誤情報生成)の削減
GPT-5の最も重要な改善点の一つは、ハルシネーションの大幅な削減です。実運用トラフィックを模したプロンプトでの評価において:
- GPT-4oと比較して事実誤認が約20%減少
- GPT-5 thinking モードではOpenAI o3と比較して約70%減少
- オープンソースベンチマークでは誤情報生成率を約6分の1まで削減
セーフコンプリーション:新しい安全性手法
GPT-5では「セーフコンプリーション」という革新的な安全性学習手法を導入しました。従来の拒否ベースの手法とは異なり、この手法は:
- 完全に拒否するのではなく、安全な範囲で可能な限り有用な回答を提供
- 質問の一部だけに答えたり、抽象度を上げて説明
- 拒否が必要な場合は理由を明確に説明し、安全な代替案を提示
この手法により、特にデュアルユース(平和的利用と悪用の両方が可能)な情報について、より柔軟で建設的な対応が可能になりました。
ユーザーエクスペリエンスの大幅改善
ChatGPTを自分好みにカスタマイズ
GPT-5では指示の理解・遵守能力が大幅に向上し、カスタム指示への追従精度も飛躍的に高まりました。これにより、ユーザーは自分の好みや用途に応じてChatGPTの応答スタイルを細かく調整できるようになります。
さらに、4種類のプリセットされたパーソナリティを研究プレビューとして提供します:
- 皮肉屋:少し皮肉めいた応答スタイル
- ロボット:簡潔でプロフェッショナルな応答
- 聞き役:思慮深くサポート重視の応答
- ナード:専門的で詳細な説明を好む応答
これらの人格設定は、まずテキストチャットで利用可能となり、後日音声モードでも対応予定です。ユーザーは設定画面からいつでもオン・オフや細かな調整が可能で、プロンプトを用意しなくても簡単にChatGPTの話し方を切り替えられます。
過度な迎合表現の抑制と文体の洗練
GPT-5では対話の質の向上にも大きな注意が払われました。全体として、GPT-5はGPT-4oと比べて以下の改善が見られます:
- 過度に同調することが少なくなり、より客観的な視点を提供
- 不要な絵文字の使用が抑えられ、より落ち着いた対話を実現
- フォローアップがより控えめで思慮深くなり、押し付けがましさが軽減
これらの改善により、AIと話しているというよりも、博士号レベルの知性を備えた親しい友人と会話しているように感じられるはずです。
OpenAIは2025年前半にGPT-4oをアップデートした際、意図せずモデルが過度に迎合的な態度(過剰なお世辞・同意)を取るようになっていた問題を認識し、すぐに改善に取り組みました。GPT-5では、この問題に対して以下の大幅な改善を実現しています:
- 「軽度の迎合的回答」をGPT-4oの18%から8%未満に削減
- 「過度の迎合的回答」を14.5%から6%未満に削減
迎合性を下げることでユーザー満足度が低下する可能性もありましたが、今回の改善では迎合性を半分以下に抑えつつ、他の指標も向上させることに成功しました。その結果、ユーザーは引き続き質の高い建設的な会話を楽しめるようになっています。
GPT-5 Proの高度な機能
最高難度のタスクに対応するため、OpenAIはGPT-5 Proも同時にリリースしました。
GPT-5 Proの特徴:
- 長時間の思考:より複雑な問題に対してじっくりと考える能力
- 並列テスト時計算:効率的にスケーリングした計算手法
- 専門家評価で67.8%の支持率:1,000件以上の実世界推論プロンプトで従来モデルより高評価
- 重大な誤り22%削減:医療、科学、数学、コーディング分野で特に優秀
利用方法とアクセス
GPT-5は2025年8月7日より以下の形で利用可能です:
- ChatGPTの新しいデフォルトモデルとして自動的に利用
- 無料版ユーザー:制限付きで利用可能、上限に達するとGPT-5 miniに自動切り替え
- Plus/Pro/Team ユーザー:より高い利用上限で利用可能
- Pro ユーザー:GPT-5無制限利用 + GPT-5 Proアクセス
また、開発者向けにはOpenAI APIでも同日より利用開始されています。
まとめ
GPT-5は単なる性能向上ではなく、AI言語モデルの根本的な進化を表しています。2つのモデルを統合したシステム構成により、日常的な質問には素早く、複雑な問題には深く考えて回答する柔軟性を実現しました。
特に重要なのは、信頼性と安全性の大幅な改善です。ハルシネーションの削減とセーフコンプリーション手法の導入により、より実用的で信頼できるAIアシスタントとして進化しています。コーディング、文章作成、ヘルスケアといった実用的な分野での性能向上も、多くのユーザーにとって直接的なメリットをもたらすでしょう。
GPT-5の登場により、AIは「便利だが注意が必要なツール」から「信頼できるパートナー」へと一歩近づいたと言えるでしょう。今後のAI技術の発展と社会への普及において、重要な節目となる技術革新です。