AI学習データの著作権訴訟が激化——2026年の法的バトルと「フェアユース」の行方

ニューヨーク・タイムズ（NYT）がOpenAIとMicrosoftを相手取り数十億ドル規模の損害賠償を求めた訴訟は、提訴から2年以上が経過した2026年現在も決着がついていない。それどころか、Getty ImagesとStability AIの画像著作権訴訟、ユニバーサルミュージックらメジャーレーベル3社によるAI音楽生成企業への提訴など、AI学習データをめぐる法的バトルは雪だるま式に膨れ上がっている。

2026年2月に完全施行されたEU AI Actは、AI企業に対して学習データの開示義務を課す世界初の包括的規制となった。一方で日本は著作権法30条の4により「情報解析」目的のデータ利用を広く認めており、国際的に見ても最も寛容なスタンスを維持している。

本記事では、主要な著作権訴訟の最新状況、「フェアユース」論争の核心、コンテンツライセンス取引の急成長、そして各国規制の温度差を包括的に解説する。

主要訴訟の最新状況

NYT vs OpenAI / Microsoft——メディア業界最大の戦い

OpenAI側は「学習目的の使用はフェアユースに該当する」と反論しているが、2025年後半の審理でNYTが提出した証拠——ChatGPTが有料記事の内容をほぼそのまま再現するスクリーンショット——は裁判所に強い印象を与えたとされる。2026年3月時点で、連邦裁判所はサマリージャッジメント（略式判決）の段階に入っており、年内にも重要な判断が下される可能性がある。

Getty Images vs Stability AI——画像生成AIの根幹を問う

英国とアメリカで並行して進むこの訴訟では、Stability AIがGetty Imagesの約1,200万枚の画像を無断でStable Diffusionの学習に使用したと主張されている。特に注目されたのは、AI生成画像の中にGettyの透かし（ウォーターマーク）が歪んだ形で出現した事例だ。これは学習データにGetty画像が含まれていた直接的な証拠とみなされている。

2025年に英国の裁判所はStability AIに対して一部不利な中間判断を下しており、完全勝訴は難しい状況だ。ただし、Stability AI側は2025年後半にライセンス済みデータのみで学習した新モデルへの移行を発表し、将来的なリスク軽減を図っている。

音楽業界 vs AI企業——メジャーレーベル連合の攻勢

ユニバーサルミュージック、ソニーミュージック、ワーナーミュージックの3大レーベルは、2024年6月にSuno AIとUdio AIを著作権侵害で提訴した。AIが楽曲を「聴いて」学習し、酷似した楽曲を生成する行為が著作権侵害にあたるかが争点だ。

2026年に入り、この訴訟はさらに拡大。AI音楽生成企業だけでなく、楽曲をAI学習データとして無断提供したとされるデータブローカーにも訴訟の矛先が向けられている。音楽業界は年間120億ドル以上の著作権ライセンス収入を守るべく、徹底抗戦の構えだ。

以下の図は、2026年時点の主要AI著作権訴訟とその関連要素の全体像を示しています。

AI著作権訴訟の主要ケース。NYT vs OpenAI、Getty vs Stability AI、音楽業界 vs AI企業の3大訴訟と、フェアユース論争、ライセンス契約、各国規制の関係を一覧表示

この図が示すとおり、訴訟は個別の事件にとどまらず、フェアユースの法的解釈、ライセンス市場の形成、各国の規制アプローチという3つの大きな潮流につながっている。

「フェアユース」論争の核心

フェアユースとは何か

米国著作権法第107条に定められた「フェアユース」は、一定の条件下で著作物の無許諾使用を認める法理だ。裁判所は以下の4要素を総合的に判断する。

使用の目的と性質（商用か非営利か、変容的利用か）
著作物の性質（創作的か事実的か）
使用された部分の量と実質性
原著作物の市場への影響

AI学習におけるフェアユースの最大の争点は、第1要素の「変容的利用（transformative use）」だ。AI企業側は「学習は単なるコピーではなく、パターンの抽出という新たな目的のために変容的に利用している」と主張する。一方、著作権者側は「学習によって生成された出力物が原著作物と市場で競合する」として第4要素での不利を指摘する。

判例の方向性

2025年のThomson Reuters対ROSS Intelligence事件では、法律文書のAI学習がフェアユースに該当しないとの判決が出された。この判決はAI著作権訴訟における重要な先例となりつつある。一方、同年のAndersen v. Stability AI（アーティストによる集団訴訟）では、裁判所がフェアユースの判断を留保し、審理を継続させている。

法律専門家の間では、「AI学習そのものは合法だが、出力物が原著作物に類似する場合は侵害となる」というハイブリッドな結論に落ち着くとの見方が有力だ。ただし、連邦最高裁が最終判断を下すまでには数年かかる可能性があり、法的不確実性は当面続く。

コンテンツライセンス市場の急成長

主要ライセンス契約一覧

訴訟リスクを回避する動きとして、AI企業とコンテンツ提供者の間でライセンス契約が急増している。

契約当事者	締結時期	推定金額	対象コンテンツ
OpenAI × AP通信	2023年7月	非公開	ニュース記事アーカイブ
Google × Reddit	2024年2月	年間$60M（約90億円）	Redditの投稿データ
OpenAI × Axel Springer	2024年1月	推定年間$20M以上	Politico, Business Insider等
Apple × 複数出版社	2025年3月	推定$50M以上	Apple Intelligence学習用
OpenAI × Le Monde / Prisa	2025年後半	非公開	フランス語・スペイン語ニュース
Meta × Shutterstock	2025年4月	推定$100M以上	画像・動画ライセンス

ライセンスの構造的課題

ライセンス契約の急増は一見すると健全な市場形成に見えるが、構造的な問題もはらんでいる。

価格の不透明性: ライセンス料の多くは非公開であり、適正価格の基準が存在しない。同じ種類のコンテンツでも、交渉力によって10倍以上の価格差が生じているとの報道もある。

オプトアウトの限界: 多くのAI企業がrobots.txtやAI学習拒否のメタタグに対応する姿勢を見せているが、過去に既に学習済みのデータを「忘れさせる」技術的手段は確立されていない。

Adobe Fireflyの「安全」アプローチ

AI企業のデータ調達戦略の中で、Adobeは異色の存在だ。Adobe Fireflyはライセンス済みデータのみで学習しており、学習データは以下の3つに限定されている。

Adobe Stock: 数億点の画像・動画・イラスト（コントリビューターが学習許諾に同意済み）
パブリックドメイン: 著作権の期限が切れた作品
Adobe独自のデータ: 社内で作成された教師データ

このアプローチの結果、Fireflyは訴訟リスクがほぼゼロであり、企業利用における法的安全性を最大のセールスポイントとしている。実際、Fortune 500企業の約70%がFireflyを選択しているとAdobeは主張する。商用利用時の著作権侵害補償（IP indemnity）を提供できるのもFireflyの強みだ。

ただし、このアプローチにはトレードオフもある。学習データの多様性が限定されるため、最先端モデルと比較して生成品質や多様性でやや劣るとの評価もある。Adobeはこの課題に対し、コントリビューターへのAI学習ボーナス制度を導入し、質の高いデータの収集を加速させている。

以下の図は、各AI企業のデータ調達アプローチと訴訟リスクの比較を示しています。

AI企業の学習データ調達アプローチ比較表。OpenAI、Google、Stability AI、Adobe、Metaの5社について、データ調達方法、訴訟リスク、ライセンス契約状況を比較

この比較が示すように、Adobeの「安全型」アプローチと、OpenAI/Googleの「混合型」アプローチは、それぞれ異なるリスク・リターンのバランスを取っている。

EU AI Actの影響——世界初の包括的規制

2026年2月に完全施行されたEU AI Actは、AI著作権問題に直接的な影響を与える規制だ。特に重要なのは以下の条項である。

学習データの開示義務（第52条）

汎用AIモデル（GPT、Gemini等）を提供する企業は、**学習に使用した著作物の「十分に詳細な要約」**をEU当局に提出する義務を負う。何をもって「十分に詳細」とするかのガイドラインは2026年後半に発表予定だが、従来のブラックボックス的なアプローチは許されなくなる。

著作権者のオプトアウト権

EU著作権指令に基づき、著作権者はAI学習からのオプトアウトを機械可読な形式で表明できる。AI企業はこの意思表示を尊重する義務がある。違反した場合、**最大3,500万ユーロ（約56億円）または全世界年間売上高の7%**のいずれか高い方が制裁金として課される。

企業への影響

EU AI Actへの対応コストは大手AI企業にとっても無視できない規模だ。OpenAIはEUコンプライアンスチームを50名以上に拡充し、学習データの監査システムを構築中と報じられている。一方、中小AI企業にとってはコンプライアンスコストが参入障壁となり、市場の寡占化を加速させるとの懸念もある。

日本の立場——世界で最も寛容な著作権法

著作権法30条の4の規定

日本の著作権法30条の4は、著作物に表現された思想または感情の享受を目的としない利用、具体的には情報解析（データマイニング）目的の利用を、著作権者の許諾なく認めている。この規定は2018年の法改正で拡充されたもので、AI学習を明示的に想定した世界でも希少な条文だ。

文化庁の2024年ガイドラインでは、「AI学習のために著作物をコンピュータに入力する行為は、原則として30条の4の適用対象となる」との解釈が示されている。これにより、日本国内でのAI学習行為は米国よりも明確に合法と位置づけられている。

ただし出力物は別問題

重要なのは、この寛容さはあくまで「学習段階」に限定されることだ。AIが生成した出力物が既存の著作物に類似する場合、その出力物の利用は通常の著作権侵害として扱われる。つまり、「学習はOK、でもパクリ出力はNG」という二層構造になっている。

日本のクリエイター側の反発

法制度は寛容でも、日本のクリエイターコミュニティからの反発は強い。2024年には漫画家やイラストレーターを中心に**「AI学習NO」宣言**が広がり、SNS上で大きな運動となった。文化庁は2025年にクリエイター保護の追加ガイドラインを検討する会議を設置したが、法改正には至っていない。

2026年現在、日本はAI産業振興とクリエイター保護のバランスという難題に直面している。政府はAI開発の国際競争力を維持したいが、クリエイターの不満を放置すれば文化産業への悪影響が懸念される。今後の政策動向は、日本のAI産業の方向性を大きく左右するだろう。

今後の展望——2026年後半の注目ポイント

米国連邦裁判所の判断

NYT vs OpenAI訴訟のサマリージャッジメントが2026年後半に予想されており、ここでの判断はAI業界全体に波及する。フェアユースが認められれば、AI企業は安堵するが、認められなければ数千億円規模の損害賠償と業界慣行の根本的見直しを迫られる。

著作権料の標準化

現在バラバラなライセンス料の体系を統一する動きが出始めている。報道機関連合やクリエイター団体が「AI学習ライセンスの集団管理」を模索しており、音楽業界のJASRACのような仕組みがデジタルコンテンツ全般に広がる可能性がある。

技術的解決策の登場

「AIが何を学習したか」を事後的に検証する技術（データプロベナンス）や、学習データから特定の著作物の影響を除去する「機械忘却（machine unlearning）」技術の研究が進んでいる。これらの技術が実用化されれば、法的紛争の一部は技術的に解決できるようになるかもしれない。

まとめ——クリエイターとAI企業はどう共存するか

AI学習データの著作権問題は、テクノロジーと法律のフロンティアで起きている21世紀最大の知財バトルだ。2026年は、複数の重要判決とEU AI Actの本格運用により、この問題の方向性が大きく定まる年となるだろう。

具体的なアクションステップとしては以下が挙げられる。

クリエイター: 自身の著作物のAI学習に関するポリシーを明文化し、robots.txtやメタタグでオプトアウトの意思を機械可読な形で示す
AI企業の利用者: 生成物の商用利用時には、利用するAIサービスのデータ調達ポリシーとIP補償の有無を確認する。法的安全性を重視するならAdobe Fireflyのようなライセンス済みモデルを選択する
開発者・事業者: EU AI Actのコンプライアンス要件を早期に把握し、学習データの記録・追跡体制を構築する。特にEU市場を視野に入れる場合は、データプロベナンスツールの導入を検討する

AI技術の進歩と著作権保護のバランスは、一朝一夕には解決しない。しかし、ライセンス市場の形成、規制の整備、技術的解決策の進展という3つの軸で、少しずつ「共存のルール」が形作られつつある。今後の判決と規制動向を注視しつつ、自身のポジションに応じた対策を講じることが重要だ。