はじめに
本稿では、AIの安全性と研究に取り組むAnthropic社が2025年9月30日に発表した、新しい大規模言語モデル「Claude Sonnet 4.5」について紹介します。この新モデルは、特にコーディング、複雑なAIエージェントの構築、コンピュータの操作といった分野で高い能力を示しており、同時に開発者が自身のエージェントを構築するためのツールキット「Claude Agent SDK」も公開されました。
参考記事
- タイトル: Introducing Claude Sonnet 4.5
- 発行元: Anthropic
- 発行日: 2025年9月30日
- URL: https://www.anthropic.com/news/claude-sonnet-4-5?subjects=announcements
・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。
要点
- Anthropicが新モデルClaude Sonnet 4.5を公開した。
- コーディング、複雑なAIエージェントの構築、コンピュータ操作の能力において、既存のモデルを上回る性能を達成している。
- 開発者が自身のエージェントを構築するための「Claude Agent SDK」が公開された。
- 安全性とアライメント(AIが人間の意図に沿って動作すること)が大幅に向上し、プロンプトインジェクション攻撃への耐性も強化されている。
- APIでの利用価格は既存のClaude Sonnet 4から据え置きで、すぐに利用可能となっている。
詳細解説
Claude Sonnet 4.5の性能向上
Claude Sonnet 4.5は、複数の重要なベンチマークで最高水準の性能を記録しています。
一つは、実世界のソフトウェア開発能力を測定する「SWE-bench Verified」です。この評価において、Sonnet 4.5は最先端の77.2%のスコアを達成しました。これは、単にコードを断片的に生成するだけでなく、複雑な要件を理解し、既存のコードベースを修正するといった、より実践的な開発タスクを高いレベルでこなせることを意味します。Anthropicによれば、このモデルは30時間以上にわたる複雑な多段階タスクに集中力を維持できることが観察されています。
評価では、簡単なスキャフォールド(足場となる基本構造)と2つのツール(bashとファイル編集用の文字列置換)のみを使用し、10回の試行の平均値として77.2%を報告しています。さらに高度な計算設定では、82.0%のスコアを達成しています。

また、OS上での実世界のコンピュータタスクをテストする「OSWorld」ベンチマークでは、61.4%というスコアを記録しました。これは、4ヶ月前のSonnet 4が記録した42.2%から大きく向上しており、AIが自律的にPCを操作してタスクを実行する能力が向上したことを示しています。

この能力は、Chrome拡張機能「Claude for Chrome」で実用化されており、ブラウザ内で直接作業し、サイトを操作し、スプレッドシートを埋め、タスクを完了できます。
これらの能力向上に加え、数学や論理的推論、さらには金融、法律、医療といった専門分野の知識においても、旧モデルであるOpus 4.1を含む既存モデルより優れた結果を示しています。
新機能と製品アップデート
今回の発表は、モデルの性能向上だけではありません。関連製品にも複数の重要なアップデートが行われました。
- Claude Code: コーディング支援ツールです。作業の進捗を保存し、いつでも前の状態に戻せるチェックポイント機能が追加されました。また、ターミナル画面のデザインが更新され、新たにVS Codeのネイティブ拡張機能も提供されます。
- Claude API: AIエージェントがより長く、より複雑なタスクを実行できるように、コンテキスト編集機能とメモリツールが追加されました。
- Claude Apps: 対話の中で直接、スプレッドシートやスライド、ドキュメントといったファイルを生成したり、コードを実行したりする機能が追加されました。
開発者向けの大きな一歩:「Claude Agent SDK」
今回の発表で特に注目すべきは、「Claude Agent SDK」の公開です。SDKとはSoftware Development Kitの略で、開発者が特定の機能を持つアプリケーションを効率的に作るためのツールセットを指します。
このClaude Agent SDKは、Anthropicが自社の「Claude Code」を開発するために使用している基盤そのものです。これを利用することで、開発者は自社の課題を解決するための独自のAIエージェントを構築できます。例えば、特定の社内システムを操作するエージェントや、専門的なリサーチを自動で行うエージェントなど、その応用範囲は多岐にわたります。これは、AIを単なる対話相手として使う段階から、能動的にタスクをこなすパートナーとして活用する段階への移行を促す重要な一歩と言えるでしょう。
安全性とアライメントの向上
AIの能力が向上するにつれて、その安全性を確保することはより重要になります。Anthropicは、Claude Sonnet 4.5がこれまでで最もアライメントが取れたフロンティアモデルであると述べています。

AIがユーザーに媚びへつらう(sycophancy)、ユーザーを欺く(deception)、権力を求める(power-seeking)といった、望ましくない振る舞いが大幅に低減されました。また、悪意のあるユーザーが指示(プロンプト)によってAIの安全機能を回避しようとする「プロンプトインジェクション攻撃」に対する防御も強化されています。
これらの安全対策の一環として、モデルの能力に応じた安全策を講じるフレームワークに基づき、危険な入力や出力を検知するフィルターが導入されています。
利用方法と価格
Claude Sonnet 4.5は、APIを通じてすぐに利用を開始できます。APIモデル名は claude-sonnet-4-5 です。
価格は、従来のClaude Sonnet 4と同じく、入力100万トークンあたり3ドル、出力100万トークンあたり15ドルに設定されています。性能が向上しながらも価格が据え置かれているため、既存ユーザーはコストを増やすことなく、より高性能なモデルへ移行できます。
ボーナスリサーチプレビュー
Claude Sonnet 4.5 と同時に、「 Imagine with Claude 」と呼ばれる一時的な研究プレビューを公開します。この実験では、クロードがリアルタイムでソフトウェアを生成しており、事前に決められた機能やコードは一切ないのが特徴です。リアルタイムでソフトウェアを作成し、ユーザーの操作に応じてリクエストに応答し、適応していく様子が確認できます。
これは、Claude Sonnet 4.5 の機能を紹介するデモンストレーションであり、優れたモデルと適切なインフラストラクチャを組み合わせると何が可能になるかを確認するためのものです。「Imagine with Claude」は、Max会員の方のみ今後5日間ご利用いただけます。
まとめ
今回発表されたClaude Sonnet 4.5は、単なる性能向上にとどまらず、AIエージェントの開発と実用化を大きく前進させる可能性を秘めています。特に、開発者向けにClaude Agent SDKが提供されたことは、多くの企業や個人が独自のAIソリューションを構築する扉を開くものであり、今後のAI活用のあり方に影響を与えるでしょう。安全性への配慮も強化されており、より安心して高度なAI技術を利用できる環境が整いつつあります。