はじめに
Anthropicが2025年10月16日、小型モデル「Claude Haiku 4.5」を全ユーザー向けに公開しました。わずか5ヶ月前に最先端だったClaude Sonnet 4と同等のコーディング性能を、1/3のコスト、2倍以上の速度で実現したとのことです。本稿では、発表内容をもとに、Claude Haiku 4.5の性能と安全性、実用上の可能性について解説します。
参考記事
- タイトル: Introducing Claude Haiku 4.5
- 発行元: Anthropic
- 発行日: 2025年10月16日
- URL: https://www.anthropic.com/news/claude-haiku-4-5?subjects=announcements
・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。
要点
- Claude Haiku 4.5は、5ヶ月前の最先端モデルClaude Sonnet 4と同等のコーディング性能を1/3のコスト、2倍以上の速度で実現した小型モデルである
- コンピュータ操作などの特定タスクではClaude Sonnet 4を上回る性能を示し、Sonnet 4.5が複雑な問題を分解し、複数のHaiku 4.5が並列処理する協調動作が可能である
- 安全性評価では前世代のHaiku 3.5より大幅に改善し、Sonnet 4.5やOpus 4.1よりも問題行動の発生率が低く、AnthropicのASL-2基準で公開された
- API価格は入力トークン100万あたり1ドル、出力トークン100万あたり5ドルで、Claude API、Amazon Bedrock、Google Cloud’s Vertex AIで利用可能である
詳細解説
フロンティア性能の低コスト化
公式発表によれば、Claude Haiku 4.5は2025年5月に発表されたClaude Sonnet 4と同等のコーディング性能を持ちながら、コストは1/3、速度は2倍以上を実現しています。実世界のコーディングタスクを測定するSWE-bench Verifiedベンチマークでは、Haiku 4.5が73.3%のスコアを記録しました。

興味深いのは、特定のタスクにおいてはHaiku 4.5がSonnet 4を上回る点です。公式ブログでは、コンピュータ操作タスクでその優位性が確認されたとされており、この進展により「Claude for Chrome」などのアプリケーションがより高速で実用的になったと説明されています。

多層的なモデル活用戦略
Anthropicは、2週間前に公開したClaude Sonnet 4.5を「フロンティアモデル」かつ「世界最高のコーディングモデル」と位置づけています。Haiku 4.5は、フロンティアに近い性能を大幅なコスト効率で実現する選択肢として提供されます。
特に注目すべきは、複数モデルの協調利用です。公式発表によれば、Sonnet 4.5が複雑な問題を多段階の計画に分解し、複数のHaiku 4.5が並列にサブタスクを完了する、というチーム編成が可能になったとのことです。Claude Codeのユーザーは、複数エージェントプロジェクトから迅速なプロトタイピングまで、より応答性の高いコーディング体験ができるようになります。
ベンチマーク性能
公式発表では、複数のベンチマークでHaiku 4.5の性能が示されています。Terminal-Benchでは40.98%、τ2-benchでは84.20%、AIME(数学問題)では67.30%、OSWorldでは31.50%、MMLLUでは84.00%を記録しました。
評価方法については、SWE-bench Verifiedでは50回の試行の平均値が報告されており、128Kの思考バジェット、デフォルトのサンプリングパラメータが使用されています。公式ブログでは、「できるだけ多くツールを使用すべき、理想的には100回以上」というプロンプト追加が行われたことも明記されています。
安全性評価とASL分類
Anthropicは、Claude Haiku 4.5に対して詳細な安全性とアライメント評価を実施しました。公式発表によれば、Haiku 4.5は前世代のHaiku 3.5と比較して大幅にアライメントが改善されています。
自動アライメント評価では、Haiku 4.5はSonnet 4.5およびOpus 4.1の両方と比較して、統計的に有意に低い不整合行動の発生率を示しました。公式ブログでは、この指標において「これまでで最も安全なモデル」と述べられています。
化学、生物、放射線、核兵器(CBRN)の製造に関するリスク評価では、Haiku 4.5は限定的なリスクしか示しませんでした。その結果、Sonnet 4.5やOpus 4.1のASL-3よりも制約の少ないASL-2基準で公開されています。完全な分類根拠と安全性テストの詳細は、Claude Haiku 4.5システムカードで公開されています。
利用可能性と価格
Claude Haiku 4.5は、2025年10月16日より以下で利用可能です:
- Claude Code
- Claudeアプリ
- Claude API(モデル名:claude-haiku-4-5)
- Amazon Bedrock
- Google Cloud’s Vertex AI
API価格は、入力トークン100万あたり1ドル、出力トークン100万あたり5ドルに設定されています。公式発表では、これがAnthropicの「最も経済的な価格帯」であり、Haiku 3.5とSonnet 4のドロップイン置き換えとして機能すると説明されています。
まとめ
Claude Haiku 4.5は、5ヶ月前のフロンティアモデルと同等の性能を1/3のコスト、2倍以上の速度で実現した小型モデルです。安全性評価でも優れた結果を示し、ASL-2基準で公開されました。複数モデルの協調利用が可能になった点も含め、AI活用の実用性と経済性が高まる可能性を感じます。