はじめに
本稿では、中国のAI開発企業DeepSeekが発表した低コストなAIモデルとして話題になったR1の実際の開発費用が29万ドルであったことが明らかになったこと、そしてその影響について解説します。
参考記事
- タイトル: China’s DeepSeek says its hit AI model cost just $294,000 to train
- 発行元: Reuters
- 発行日: 2025年9月18日
- URL: https://www.reuters.com/world/china/chinas-deepseek-says-its-hit-ai-model-cost-just-294000-train-2025-09-18/
要点
- 中国のAI開発企業DeepSeekが、同社のAIモデル「R1」のトレーニング費用がわずか29万4000ドルであったと学術誌「Nature」で発表した。
- このコストは、米国の主要なAI企業が費やしているとされる数千万〜1億ドル規模の費用と比較して、著しく低いものである。
- トレーニングには、米国の輸出規制に対応してNvidiaが中国市場向けに設計した「H800」チップが512個使用された。
- 同社は、より高性能で輸出が規制されている「A100」チップを、開発の準備段階で使用したことも初めて認めた。
- この発表は、AI開発におけるコスト効率という新たな競争軸と、米国の対中半導体輸出規制の有効性について、重要な問題を提起している。
詳細解説
DeepSeekが発表した衝撃的な「低コスト」
今回注目を集めているのは、DeepSeekが学術誌「Nature」に掲載した論文で、自社の推論に特化したAIモデル「R1」のトレーニング費用を明らかにした点です。その額は29万4000ドル(約4,100万円 ※1ドル140円換算)とされています。
この金額を評価するために、競合であるOpenAIのサム・アルトマンCEOが2023年に行った発言が参考になります。彼は、基盤モデルのトレーニングに「1億ドルをはるかに超える」費用がかかったと述べています。具体的なモデル名は明かされていませんが、AI開発、特に大規模言語モデル(LLM)のトレーニングには、膨大な計算資源と時間が必要であり、数千万ドルから数億ドルのコストがかかるのが業界の常識とされてきました。
DeepSeekが発表したコストは、この常識を覆すほど低いものです。このニュースは、AI開発のコスト効率に関する議論を活発化させるとともに、AI分野における中国企業の技術力を示すものとして再注目されています。
なぜAIモデルの開発にコストがかかるのか?
ここで、AIモデルの「トレーニング」になぜ莫大な費用がかかるのか、前提知識を補足します。AIモデル、特にLLMは、インターネット上の膨大なテキストやコードといったデータを学習することで、人間のような知的な応答を生成する能力を獲得します。
この学習プロセスには、高性能な半導体チップ(GPU)を数千個単位でクラスター化し、数週間から数ヶ月にわたって稼働させ続ける必要があります。GPUの購入費用やリース費用、そしてそれを動かすための電力コストが、開発費用の大部分を占めるのです。したがって、より少ない計算資源で、あるいはより短時間でモデルをトレーニングできれば、開発コストを劇的に削減できます。
技術的背景:Nvidia製GPU「H800」と「A100」の存在
DeepSeekの発表で技術的に重要なのは、使用されたGPUの種類です。論文によると、R1モデルのトレーニングにはNvidia製の「H800」チップが512個用いられ、80時間で完了したとされています。
- H100/A100チップ: Nvidiaが開発した最高性能のAI向けGPU。米国政府は安全保障上の懸念から、これらの高性能チップの中国への輸出を2022年10月以降、厳しく規制しています。
- H800チップ: 上記の輸出規制を受けて、Nvidiaが中国市場向けに性能を一部調整(ダウングレード)して開発したチップです。規制の範囲内で輸出が許可されています。
今回の発表でさらに注目すべきは、DeepSeekが論文の補足情報の中で、規制対象である「A100」チップを所有しており、R1開発の準備段階(より小規模なモデルでの実験)で使用したことを初めて公式に認めた点です。
これは、研究開発の初期段階では高性能なA100を利用して効率的に実験を進め、実際のモデルの本格的なトレーニングには、規制に対応したH800のクラスターを使用した、という分業を示唆しています。この事実は、米国の輸出規制が中国のAI開発の足かせとなりつつも、中国企業が利用可能な資源を工夫して活用し、研究開発を進めている実態を浮き彫りにしています。
米中技術覇権争いへの影響
本件は、単なる一企業のコスト削減のニュースにとどまりません。米中間の技術覇権争いの文脈で非常に重要な意味を持ちます。
米国政府の狙いは、高性能半導体の供給を断つことで、中国の先端AI開発のスピードを鈍化させることにあります。しかし、DeepSeekが比較的性能の低いH800を使い、これほどの低コストでモデルを開発できたとすれば、規制の有効性に疑問符がつく可能性があります。
一方で、米国当局者は以前からDeepSeekが規制後にH100チップを不正に調達していると指摘しており、情報の透明性や信憑性を巡る議論も続いています。今回の発表は、そうした疑いに対するDeepSeek側からの応答という側面も持っているのかもしれません。
まとめ
中国のAI企業DeepSeekが発表した低コストでのAIモデル開発は、AI業界に大きなインパクトを与えました。今回、その金額や利用した設備が明らかになったことで再び注目されています。
今後も、米国の規制強化と、それに対応しようとする中国企業の技術開発の動向は、世界のテクノロジー情勢を占う上で極めて重要な要素となります。DeepSeekの事例は、その最前線で起きている事象の一つとして、引き続き注目していく必要があります。