はじめに
OpenAIが作家らとの著作権侵害訴訟において、重要な証拠開示命令で敗訴しました。The Hollywood Reporterが2025年11月26日に報じたところによれば、裁判所はOpenAIに対し、海賊版書籍データセット削除に関する社内コミュニケーションの開示を命じました。本稿では、この判決の内容と、OpenAIが直面する法的リスクについて解説します。
参考記事
- タイトル: OpenAI Loses Key Discovery Battle as It Cedes Ground to Authors in AI Lawsuits
- 著者: Winston Cho
- 発行元: The Hollywood Reporter
- 発行日: 2025年11月26日
- URL: https://www.hollywoodreporter.com/business/business-news/openai-loses-key-discovery-battle-why-deleted-library-of-pirated-books-1236436363/
・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。
要点
- OpenAIは「books 1」「books 2」と呼ばれる海賊版書籍データセットを2022年に削除したが、削除の動機に関する社内コミュニケーションの開示を命じられた
- 「故意の侵害(willful infringement)」が認められた場合、1作品あたり最大15万ドルの損害賠償が発生し、総額は数億ドルから数十億ドルに達する可能性がある
- OpenAIは当初「不使用のため削除した」と主張したが、後に特権保護を理由に証言を撤回しようとし、裁判所から特権の放棄と判断された
- Anthropicは類似の訴訟で15億ドルの和解金を支払っており、OpenAIも同様の責任を問われる可能性がある
詳細解説
証拠開示命令の背景と経緯
The Hollywood Reporterによれば、この訴訟では「books 1」「books 2」と呼ばれる2つの大規模な海賊版書籍データセットの削除を巡り、OpenAIの従業員間のSlackメッセージなど社内コミュニケーションへのアクセスが争点となってきました。作家と出版社側は、これらのデータセットがシャドウライブラリ(違法コピーを集めたオンライン図書館)から入手されたものであり、OpenAIがそれを認識していたことを示す証拠を求めていました。
OpenAIは当初、弁護士・依頼者間の秘匿特権を理由に開示を拒否しましたが、後に一部の情報は開示すると表明しました。しかし、その後「不使用のため削除した」という以前の説明を撤回しようとし、削除に関するすべての証拠は特権で保護されていると主張を変更しました。
この一連の対応について、Ona Wang連邦地裁判事は「OpenAIは特権主張を移動目標にすることで特権を放棄した」と判断しました。裁判所は、OpenAIが削除の「理由」を開示した時点で、その理由に関する特権保護を主張することはできないと指摘しています。
「故意の侵害」認定のリスク
この証拠開示命令が重要な理由は、著作権法における「故意の侵害(willful infringement)」の認定に直結するためです。通常の著作権侵害では実損害額に基づく賠償となりますが、故意の侵害が認められると、法定損害賠償として1作品あたり最大15万ドルが課される可能性があります。
The Hollywood Reporterの報道では、OpenAIがこの訴訟で数億ドルから数十億ドルの賠償責任を負う可能性があると指摘されています。これは、訓練データに含まれていた作品数が膨大であることを考えると、現実的な数字と言えます。
さらに重要なのは、証拠隠滅の認定リスクです。裁判所は、もしOpenAIが訴訟を見越してデータセットを削除したと判断した場合、後の陪審裁判において「削除された証拠はOpenAIに不利な内容だった」と推定するよう陪審員に指示できると述べています。これは「証拠隠滅の推定(spoliation inference)」と呼ばれる法理で、訴訟戦略上、極めて不利な状況を生み出します。
著作権侵害理論の進化
AI訴訟における著作権侵害の理論も進化しています。当初、作家側の弁護士は、海賊版書籍のダウンロードとAIモデルの訓練を一体の行為として主張していました。しかし、その後、理論を分離し、「訓練に使用したかどうかに関係なく、違法にダウンロードして保存する行為自体が著作権侵害を構成する」と主張するようになりました。
この理論転換は、実際の訴訟で成果を上げています。作家Andrea BartzがAnthropicを訴えた訴訟では、裁判所の多くの判断はAnthropic側に有利でしたが、「数百万冊の書籍を違法にダウンロードして中央ライブラリに保存した行為」については、裁判で審理すべき問題として認められました。William Alsup連邦地裁判事は「Anthropicが後からインターネットから盗んだ書籍のコピーを購入したとしても、盗んだ行為の責任を免れることはない」と述べています。
この判決を受けて、Anthropicは15億ドルの和解金を支払うことで合意しました。この和解事例は、OpenAIの訴訟における賠償額の参考指標となる可能性があります。
OpenAIの法的防御における課題
「故意の侵害」認定を避けるためには、OpenAIは自社の行為が問題ないという誠実な信念(good faith belief)を持っていたことを示す必要があります。しかし、裁判所は、被告が弁護士・依頼者間の秘匿特権を主張して意図に関する証拠開示を拒否する状況には「根本的な矛盾」があると強調しています。
つまり、「悪意はなかった」と主張しながら、その証拠となる内部コミュニケーションの開示は拒否するという姿勢は、法的に一貫性を欠くと判断されたのです。
OpenAIは引き続き、故意に著作権を侵害していないと主張していますが、11月26日には証拠開示義務の執行停止を申し立てました。これは上級審への上訴を準備しつつ、証拠開示の時間稼ぎをする戦術と考えられます。
今後の展開と業界への影響
この判決は、AI企業の訓練データ取得慣行に対する司法の厳しい姿勢を示すものと言えます。特に、データの出所に関する記録保持と透明性が、今後のAI開発において重要な法的リスク管理事項となることを示唆しています。
OpenAIのような主要AI企業が大規模な賠償責任を負う可能性が現実味を帯びてきたことで、業界全体で訓練データの適法性に対する意識が高まると予想されます。一方で、既に開発されたモデルの訓練データの出所を遡及的に検証することは技術的に困難な場合も多く、多くのAI企業が同様のリスクを抱えている可能性があります。
まとめ
OpenAIが証拠開示命令で敗訴したことで、著作権侵害訴訟において極めて不利な状況に立たされました。海賊版データセット削除に関する社内コミュニケーションの開示により、「故意の侵害」が認定されるリスクが高まり、数十億ドル規模の賠償責任を負う可能性が現実味を帯びています。Anthropicの15億ドル和解を考えると、OpenAIも同様の決断を迫られる可能性があり、AI業界全体の訓練データ慣行に大きな影響を与える事例となりそうです。
