はじめに
本稿では、米国のニュース専門放送局CNBCが報じた「OpenAI is winding down its work with Scale AI, whose founder is joining Meta」という記事を基に、AI業界の巨人たちの間で今まさに起きている大きな地殻変動について解説します。
引用元記事
- タイトル: OpenAI is winding down its work with Scale AI, whose founder is joining Meta
- 著者: Ashley Capoot
- 発行元: CNBC
- 発行日: 2025年6月18日
- URL: https://www.cnbc.com/2025/06/18/openai-is-winding-down-its-work-with-scale-ai-founder-is-joining-meta.html

要点
- OpenAIは、AIの訓練データ作成を支援する大手スタートアップ「Scale AI」との協業を、過去6ヶ月から1年をかけて段階的に縮小・終了する方針である。
- この動きは、Meta(旧Facebook)がScale AIに対して143億ドルという巨額の投資を行い、同社の創業者であるAlexandr Wang氏がMetaに移籍した直後に明らかになったものである。
- OpenAIは、今回の決定がMetaの動きに影響されたものではなく、「最新AIモデルの進化に対応できる、より革新的な他のデータプロバイダーを求めた結果」であると説明している。
- この一連の出来事は、AI開発の競争がモデルそのものだけでなく、その性能を根底から支える「高品質なデータ」の確保を巡る戦略的な戦いにシフトしていることを象徴している。
詳細解説
そもそも「Scale AI」と「データアノテーション」とは?
今回のニュースを理解する上で、まず鍵となる企業「Scale AI」と、その主要事業である「データアノテーション」についてご説明します。
AI、特にChatGPTのような大規模言語モデル(LLM)は、魔法のように賢くなったわけではありません。その裏側には、人間が用意した膨大な量の「教師データ」による学習が存在します。データアノテーションとは、この教師データを作成する作業のことです。
例えば、AIに猫の画像を認識させるためには、「この画像に写っているのは猫です」という正解ラベルを付けた大量の画像データが必要です。文章であれば、「この文章は肯定的な意見です」といったラベルを付けます。この地道で膨大なラベル付け作業がデータアノテーションであり、AIの性能や精度を決定づける極めて重要な工程なのです。「Garbage In, Garbage Out(ゴミを入れればゴミしか出てこない)」という言葉があるように、データの質こそがAIの質を左右します。
Scale AIは、このデータアノテーション作業を専門に行う企業として急成長したスタートアップです。OpenAIをはじめとする多くのテック企業が、自社のAIモデルを訓練するためにScale AIのサービスを利用してきました。
OpenAIはなぜScale AIから離れるのか?
記事によれば、OpenAIがScale AIとの協業を終了する理由は、Metaとの提携が直接の原因ではないとされています。OpenAIの広報担当者は、「イノベーションに追随し、最新モデルが必要とするものを理解している他のデータプロバイダーを探している」と述べています。
これは非常に重要なポイントです。AIモデルがGPT-3.5からGPT-4、そしてGPT-4oへと進化するにつれて、求められるデータの質や複雑さも劇的に変化しています。単純なラベル付けだけでなく、より高度な文脈の理解や、人間の微妙なニュアンスを反映した、質の高いデータが必要不可欠になっています。
つまりOpenAIは、自社の最先端モデルの進化スピードに、Scale AIの提供するデータ作成能力が追い付いていない、あるいは最適ではないと判断した可能性があります。より専門的で、より高度な要求に応えられるパートナーシップを模索するというのは、AI開発の最前線を走る企業として自然な戦略的判断と言えるでしょう。
Metaの巨額投資と創業者引き抜きの意味
一方で、Metaの動きも見逃せません。Metaは自社のAIモデル「Llama」シリーズの開発に注力しており、OpenAIやGoogleに対抗しようと莫大な投資を続けています。
そのMetaが、Scale AIに143億ドル(日本円で約2兆2000億円以上)を投資し、49%の株式を取得、さらにその創業者であるAlexandr Wang氏を自社のAI開発チームに引き入れたのです。これは、AI開発の根幹を支えるデータ作成能力を、外部委託ではなく自社グループ内に強力に取り込もうとする、非常に強い意志の表れです。AI開発のサプライチェーンを垂直統合し、競争優位を築こうとする明確な戦略です。
AI業界全体への影響
この一件は、AI業界のサプライチェーンにおける力学の変化を示唆しています。記事では、GoogleもまたScale AIとの関係を断つと報じられています。
これは、巨大テック企業が、競合他社(今回はMeta)と強く結びついたサプライヤーを利用することのリスクを避ける「デリスキング(リスク回避)」の動きと見ることができます。特定の企業に依存するのではなく、自社の管理下に置くか、複数のパートナーと協力する体制を築くことが、今後のAI開発競争において重要になっているのです。
まとめ
本稿で解説したCNBCの記事は、単なる企業間の一取引の終了を報じたものではありません。AI業界の競争の主戦場が、モデル開発そのものから、その性能を左右する「データ戦略」へとシフトしていることを示す象徴的な出来事です。
OpenAIは最先端のモデルに見合う最高のデータを求め、Metaはデータ作成能力そのものを内製化しようと動いています。この動きは、AIの精度や能力が、今後どのようなデータに基づいて向上していくのかを占う上で、非常に重要な意味を持ちます。AIの進化の裏側で繰り広げられる、巨大企業たちの熾烈なデータ獲得競争から、今後も目が離せません。