OpenAI、作家から訴えられる–「ChatGPT」の訓練における作品の無断使用で
今回は「OpenAI、作家から訴えられる–「ChatGPT」の訓練における作品の無断使用で」についてご紹介します。
関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
2人の作家が「ChatGPT」の開発元であるOpenAIを提訴した。Reutersによると、原告側は自らのフィクション作品が、同チャットボットの人工知能(AI)を支える機械学習(ML)の訓練に使われたと主張しているという。
著作権にまつわるこの訴訟は、SFおよびホラー作家のPaul Tremblayさんと、小説家のMona Awadさんを原告とするものであり、米国時間6月28日にサンフランシスコの連邦地方裁判所に訴状が提出された。ChatGPTはこの作家らの作品を用いて訓練した場合にしかできない的確な要約を生成できることから、同チャットボットが使用しているMLモデルにそうした作品が入力されたと判断するのは理にかなっている。
Reutersがアップロードした訴状によると、集団訴訟の形態をとっている今回の訴訟で原告側は、OpenAIがこれら作家の「同意を得ず、また著作権を認めることなく、対価を支払わずに」作品を用いてChatGPTを訓練したと主張している。
また訴状では、ChatGPTを支える大規模言語モデル(LLM)である「GPT-3」を紹介するOpenAIの2020年の論文中で、訓練データとして言及されたオンライン上の2組の書籍データセットの中にも原告側の作品が含まれているとも主張されている。Bloomberg Lawによると、原告らはこういったデータセットが、Torrentシステムを用いて著作物を違法に公開している「Library Genesis」や「Sci-Hub」といった「シャドーライブラリー」から得た作品を用いていると主張しているという。
訴状には「こうした明らかに違法なシャドーライブラリーは、AIの訓練を実施するコミュニティーから長年にわたり関心を集めている」と記されている。
OpenAIにコメントを求めたが、すぐには回答を得られなかった。
2022年に複数のAIツールが登場し始めた直後から、こうしたツールが何を用いて訓練され、そしてどのように用いられるのかという点にまでさかのぼって異議を申し立てる訴訟がなされるようになった。
Getty Imagesは2022年9月、AIによって生成された画像を禁止し、2023年2月にはAIによる画像生成サービス「Stable Diffusion」を手掛けるStability AIに対して、Getty Imagesのデータベースに保管されている1200万枚以上の画像を許可も得ず、また対価を支払うこともなく複製したと主張し、提訴している。
The Vergeによると、Stability AIは1月、この件とは別に3人の芸術家からも提訴されている。この訴えは、画像生成サービスを手掛けるMidjourneyと、画像生成サービス「DreamUp」を提供するDevianArtが、AIモデルを訓練するためにこの芸術家らの作品を許諾や対価もなく使用しているというものであり、「数多くの芸術家ら」も同様の被害を受けているという。
こうした中、ソフトウェア開発を手掛けるAdobeは3月、生成型AIを活用したツールセットである「Adobe Firefly」を発表した。Fireflyは、Adobeが独自に蓄積、所有している画像を用いているため、芸術家らの作品を違法に利用するという心配なしに画像を生成できる。