はじめに
本稿では、Anthropic社が発表した次世代AIモデル「Claude 4」について、同社の公式ブログ記事「Introducing Claude 4」を基に、詳しく解説していきます。
引用元記事
- タイトル: Introducing Claude 4
- 発行元: Anthropic
- 発行日: 2025年5月23日
- URL: https://www.anthropic.com/news/claude-4
・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。
要点
- Anthropic社は、次世代AIモデルとしてClaude Opus 4とClaude Sonnet 4を発表した。
- Claude Opus 4は、特にコーディングにおいて世界最高レベルの性能を誇り、複雑で長時間のタスクやAIエージェントのワークフローに持続的なパフォーマンスを発揮する。
- Claude Sonnet 4は、従来のSonnet 3.7から大幅にアップグレードされ、コーディングと推論能力が向上し、指示への応答精度も高まった。
- 両モデルとも、ウェブ検索などのツールを思考プロセス中に利用できる「拡張思考(extended thinking with tool use)」機能(ベータ版)を搭載し、応答品質を向上させる。
- ツールの並列実行、より正確な指示追従、ローカルファイルへのアクセスによる大幅な記憶能力向上など、新たなモデル機能が追加された。
- Claude Codeが一般利用可能となり、GitHub Actions経由のバックグラウンドタスクや、VS Code、JetBrainsとのネイティブ統合により、開発者との連携が強化された。
- APIにも新機能(コード実行ツール、MCPコネクタ、Files API、プロンプトキャッシュ機能)が追加され、より強力なAIエージェント開発が可能になった。
- 両モデルは、ほぼ瞬時の応答と、より深い推論のための拡張思考の2つのモードを提供するハイブリッドモデルである。
- 価格は従来のOpusおよびSonnetモデルと同等に維持される。
詳細解説
Claude 4ファミリーの登場:Opus 4 と Sonnet 4
今回発表されたClaude 4ファミリーは、2つの主要モデルから構成されています。Claude Opus 4とClaude Sonnet 4です。これらは、AIの能力を新たな次元へと引き上げる可能性を秘めています。
まず、Claude Opus 4は、現時点でAnthropic社が提供する最も強力なモデルであり、特にプログラミング(コーディング)の分野で世界最高水準の性能を達成していると報告されています。これは、ソフトウェア開発におけるベンチマークテストであるSWE-benchで72.5%、Terminal-benchで43.2%という高いスコアを記録していることからも裏付けられています。SWE-benchは、実際のソフトウェアエンジニアリングのタスクにおける性能を測る指標であり、Terminal-benchはターミナル操作を通じたタスク実行能力を評価するものです。Opus 4は、数千ステップを要するような複雑で長時間のタスクにおいても、数時間にわたり継続的に高いパフォーマンスを維持できるとされており、これは従来のSonnetモデルを大幅に凌駕し、AIエージェントが達成できることの範囲を大きく広げるものです。
例えば、Cursor社はOpus 4を「コーディングにおいて最先端であり、複雑なコードベースの理解において飛躍的な進歩」と評価しています。また、楽天は、7時間にわたるオープンソースのコードリファクタリング(コードの整理・改善作業)をOpus 4が独立して実行し、持続的な性能を示したことを検証しています。これは、AIが単なるコード生成だけでなく、既存の複雑なソフトウェアの保守や改善にも貢献できる可能性を示唆しています。
一方、Claude Sonnet 4は、既存のSonnet 3.7モデルから大幅なアップグレードが施されています。こちらもコーディング能力に優れており、SWE-benchでは72.7%という高いスコアを記録しています。Opus 4ほどの超高性能ではないものの、性能と効率のバランスが良く、より広範なユースケースに対応できるように設計されています。特に、指示への追従性が向上し、開発者が意図した通りにAIを動作させやすくなっている点が特徴です。GitHub社は、GitHub Copilotの新しいコーディングエージェントにSonnet 4を採用すると発表しており、これはSonnet 4の実用性と信頼性の高さを物語っています。


革新的な新機能:拡張思考とツール利用
Claude 4モデルの大きな特徴の一つが、「拡張思考(extended thinking)」と「ツール利用(tool use)」の導入です。これは、AIが単に学習済みデータに基づいて応答するだけでなく、必要に応じて外部のツール(例えばウェブ検索など)を自律的に利用し、情報を収集・分析しながら、より深く、より正確な回答を生成する能力です。
従来のAIは、学習データに含まれない最新情報や、特定の専門分野の非常に詳細な情報については、正確な応答が難しい場合がありました。しかし、この新機能により、Claude 4は思考の途中で「この情報が不足しているからウェブで検索しよう」といった判断を下し、実際に検索を実行して得られた情報を基に、さらに思考を深めることができます。これにより、AIは推論とツール利用を交互に行いながら、応答の質を大幅に向上させることが可能になります。これは、AIがより能動的に問題解決に取り組む「AIエージェント」としての能力を大きく高めるものです。
モデル能力のさらなる進化
拡張思考とツール利用に加えて、Claude 4モデルには以下のような重要な機能向上が図られています。
- ツールの並列実行: 複数のツールを同時に利用できるため、より複雑なタスクを効率的に処理できます。例えば、ウェブ検索をしながら、同時に計算ツールを実行するといったことが可能になります。
- 指示追従性の向上: ユーザーや開発者からの指示を、より正確に理解し、実行する能力が向上しました。これにより、AIの振る舞いを細かく制御しやすくなります。
- 記憶能力の大幅な向上: 開発者がローカルファイルへのアクセスを許可することで、Claude 4は重要な情報を記憶し、タスクの継続性を維持し、時間をかけて暗黙知(経験から得られる知識)を構築する能力が大幅に向上しました。記事では、Opus 4がポケモンをプレイしながら「ナビゲーションガイド」を作成した例が挙げられており、これはAIが長期的な文脈を理解し、学習していく能力を示しています。
- ショートカット行動の低減: AIがタスクを完了するために近道や抜け道を使おうとする行動が、Sonnet 3.7と比較して65%削減されました。これにより、より信頼性の高いAIエージェントの構築が期待できます。
- 思考サマリーの導入: Claude 4モデルが複雑な思考プロセスを経た場合、その思考過程をより小さなモデルを使って要約して提示する機能が導入されました。これにより、ユーザーはAIの思考プロセスを理解しやすくなります。
Claude Code:開発者との連携を強化
以前からプレビュー版が提供されていたClaude Codeが、ついに一般利用可能になりました。Claude Codeは、開発者のワークフローのより多くの部分でClaudeの能力を活用できるようにするものです。
- IDE(統合開発環境)との連携: VS CodeやJetBrainsといった主要なIDE向けの新しいベータ版拡張機能が提供され、Claude CodeがIDEに直接統合されます。これにより、Claudeが提案するコードの編集内容がファイル内にインラインで表示され、使い慣れたエディタインターフェース内でレビューや追跡が容易になります。
- Claude Code SDK: 開発者が独自のAIエージェントやアプリケーションを構築するための、拡張可能なClaude Code SDK(ソフトウェア開発キット)がリリースされました。
- GitHubとの連携(ベータ版): Claude Code on GitHubがベータ版としてリリースされ、プルリクエスト(コード変更の提案)に対してレビュアーのフィードバックに応答したり、CI(継続的インテグレーション)エラーを修正したり、コードを修正したりするために、Claude Codeをタグ付けできるようになります。
これらの機能強化により、開発者はAIとよりシームレスにペアプログラミングを行ったり、反復的な作業を自動化したりすることが可能になり、開発効率の大幅な向上が期待できます。
APIの機能拡張:より強力なAIエージェント開発へ
開発者がClaude 4の能力を最大限に活用し、より強力なAIエージェントを構築できるように、Anthropic APIにも以下の4つの新機能が追加されました。
- コード実行ツール: AIが生成したコードを安全な環境で実行し、その結果を評価する機能。
- MCPコネクタ (MCP connector): 詳細な説明は記事にありませんが、おそらく外部システムやサービスとの連携を強化するためのコネクタだと思われます。「MCP」が何かの略称である可能性が高いですが、現時点では不明です。
- Files API: AIがファイルを扱えるようにするためのAPI。これにより、ドキュメントの分析、データの処理、ファイルの生成などがより柔軟に行えるようになります。
- プロンプトキャッシュ機能: 最大1時間、プロンプト(AIへの指示)をキャッシュ(一時保存)する機能。これにより、同様の指示を繰り返し送信する際の応答速度の向上や、APIコストの削減が期待できます。
利用可能性と価格
Claude Opus 4とSonnet 4は、ほぼ瞬時の応答モードと、より深い推論のための拡張思考モードの2つを提供するハイブリッドモデルです。Pro、Max、Team、Enterpriseといった有料プランでは両方のモデルと拡張思考機能が利用可能で、Sonnet 4は無料ユーザーにも提供されます。
これらのモデルは、Anthropic API、Amazon Bedrock、Google CloudのVertex AIといったプラットフォームで利用可能です。価格については、従来のOpusモデル(入力100万トークンあたり15ドル、出力100万トークンあたり75ドル)およびSonnetモデル(入力100万トークンあたり3ドル、出力100万トークンあたり15ドル)と同等の価格設定が維持されるとのことです。
安全性への取り組み
Anthropic社は、これらの強力なモデルを開発するにあたり、リスクを最小限に抑え、安全性を最大限に高めるための広範なテストと評価を実施していると述べています。これには、ASL-3(AI Safety Levelsのレベル3)のような、より高度なAI安全レベルのための対策の実施も含まれています。AI技術の進化とともに、その倫理的・社会的な側面への配慮もますます重要になっており、こうした取り組みは評価されるべき点です。
まとめ
本稿では、Anthropic社が発表した次世代AIモデル「Claude Opus 4」と「Claude Sonnet 4」について、その主な特徴と日本の読者にとっての意義を解説しました。 Claude 4ファミリーは、特にコーディング能力と高度な推論能力において大きな進化を遂げ、ウェブ検索などの外部ツールを自律的に利用する「拡張思考」機能によって、AIの応用範囲を飛躍的に広げる可能性を秘めています。 また、Claude Codeの一般提供開始やAPIの機能強化は、開発者がこれらの高度なAIをより容易に活用し、革新的なアプリケーションやサービスを生み出すことを後押しするでしょう。