AMAZON でお買物

「700 万冊の海賊版で学習していた」ChatGPT ライバルAIに衝撃の判決

AI

「AIって、どこまで人間の知識を学べるの?」
こんな問いを持ったことはありませんか?

私たちが日々使っているAI、たとえば文章を要約したり、質問に答えてくれたりするようなツール。
これらは膨大なテキストデータを学習して賢くなっています。

でも、その”学習素材”がもし、許可なくコピーされた本だったとしたら……。
AIの進化の裏にある「知られざる現実」に、いま大きな注目が集まっています。

“Claude”というAIと、知られざる学習材料

話題の中心にいるのは、ChatGPT のライバルともいわれるAI「Claude」を開発している企業・Anthropic(アンソロピック)。
この企業が、700 万冊以上もの海賊版書籍でAIを訓練していたことが、カリフォルニア州北部地区のウィリアム・アルサップ判事による裁判で明らかになりました。

Anthropic は「数百万ドル」を費やして中古の印刷本を大量購入し、製本を剥がし、ページを切断してスキャンしてデジタル化していました。
さらに、共同創設者のベン・マンが 2021 年に Library Genesis から少なくとも 500 万冊、2022 年には Pirate Library Mirror から少なくとも 200 万冊の海賊版書籍をダウンロードしていたのです。

なぜ”海賊本”がAIに使われたのか?

AIにとって、本というのは「最良の先生」のようなもの。
一冊の本には、洗練された文章、深い論理、豊かな語彙が詰まっています。
AIが人間らしく考えたり、自然な文章を生成したりするには、そうした良質な文章が不可欠です。

だからこそ、多くの企業が良質なテキストデータを求めていました。
しかし、著作権のある書籍は自由に使えるわけではありません。
判事によると、Anthropic の CEO ダリオ・アモデイは「法的・実務的・ビジネス上の面倒」を避けるために本を「盗む」ことを好んだとされています。
そこで、開発者たちはインターネット上に無断でアップロードされた”非公式な書籍データ”に手を伸ばしてしまったのです。

裁判所の判断:購入した本は「フェアユース」、海賊版は違法

この問題に対して、アルサップ判事は興味深い判断を下しました。
Anthropic が購入した書籍をデジタル化してAI訓練に使用することは「極めて変革的」であり「フェアユース」(著作権法の下で許可される使用)に該当するとしました。

判事は「Anthropic の大規模言語モデルは、作家志望の読者のように、作品を複製したり置き換えたりするためではなく、全く異なる何かを創造するために学習した」と述べています。

しかし、海賊版書籍の使用については厳しい判断を示しました。
「Anthropic には海賊版を使用する権利はなかった。恒久的で汎用的なライブラリを作成することは、海賊行為を正当化するフェアユースではない」と明確に断罪しています。

AIの未来と、著作権のこれから

この問題は、私たちにいくつかの大切な問いを投げかけています。
「創作されたものは、誰のものなのか?」
「AIの進化と人間の権利、どちらを優先すべきか?」
そして「便利さの裏で、誰かが不利益を被っていないか?」という根本的な疑問です。

たとえば、あなたが苦労して書いた小説が、知らないうちにAIの”教師”になっていたとしたら……きっと複雑な気持ちになるはずです。

まとめ:AI著作権問題の新たな判例

AIがどんどん賢くなる時代。
その進化のスピードに私たちは驚かされるばかりですが、だからこそ「どうやって学んでいるか」も、しっかりと見ていく必要があります。

今回のアルサップ判事の判決は、AI著作権問題における重要な判例の一つとなりました。
適法に購入した書籍での学習は認められる一方で、海賊版の使用は明確に違法とされたのです。
これは、創作する人、学ぶAI、そしてそれを使う私たち全員がどう共存していくか──そんな未来の形を考える重要な指針となるでしょう。

次にAIと会話するとき、ふとその”学びの背景”に思いを馳せてみてください。
そこには、誰かの知恵と、法的な境界線が静かに息づいているかもしれません。

参考:Anthropic cut up millions of used books to train Claude — and downloaded over 7 million pirated ones too, a judge said

コメント

タイトルとURLをコピーしました