生成系AIとは–注目を集める背景や問題点

今回は「生成系AIとは–注目を集める背景や問題点」についてご紹介します。

関連ワード（ソフトウェア等）についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。

　生成系AIと聞くと、難解な印象を受けるが、実際には分かりやすい概念である。生成系AIとは、自らの訓練に使用されたデータを基に、テキストや写真、動画、コード、データ、3D画像などの出力を生成または作成するAIアルゴリズムのことだ。データの分析や自動運転車の制御など、ほかの目的に使用されるほかの形式のAIと違って、生成系AIの前提はコンテンツを作成することだ。

　生成系AIという用語が話題になっているのは、OpenAIの「ChatGPT」や「DALL-E」といった生成系AIプログラムの人気が高まっているからだ。会話型チャットボットのChatGPTと画像生成AIツールのDALL-Eはどちらも生成系AIを使用して、コンピューターコードやエッセイ、電子メール、ソーシャルメディアのキャプション、画像、詩、ラップなどの新しいコンテンツを数秒で作成できることから、人々の注目を集めている。

　ChatGPTは爆発的な人気を博しており、公開から1週間で100万人以上のユーザーを獲得した。ChatGPTの成功を受けて、Google、Microsoftの「Bing」、Operaなど、ほかの多くの企業も生成系AIの分野に参入することを決めている。さらに多くの企業が参入して、新しいユースケースを見つける中で、生成系AIがさらに大きな話題になることは間違いないだろう。

　機械学習は、AIの小区分であり、自らの訓練に使用されたデータを基に予測を行うことをシステムに教える。DALL-Eがユーザーの入力したプロンプトの実際の意味を識別することで、そのプロンプトに基づいた画像を作成できることも、この種の予測の一例だ。したがって、生成系AIは機械学習フレームワークである。

　生成系AIは、AIを利用して全く新しいものを出力するアルゴリズム／モデルで使用される。現在、最も有名な例は、ChatGPTとDALL-E、そして、それらの代替サービスだ。まだ一般公開されていないが、テキストから音楽を生成するGoogleの「MusicLM」も、生成系AIを使用するシステムの一例だ。さらに、Googleには、「Bard」という現在開発中のプロジェクトもある。

　生成系AIアートは、既存のアートで訓練されたAIモデルによって作成される。このモデルは、インターネット上にある何十億もの画像を使って訓練される。そして、このデータを使用して、さまざまな写真のスタイルを学習する。ユーザーがテキストプロンプトを入力すると、このモデルは学習で得た洞察を使用して、新しいアートを生成する。

　生成系アートで人気が高いのはDALL-Eだが、市場にはほかにも多くの画像生成AIツールがある。それらのツールもDALL-Eと同じように機能し、さまざまなニーズに対応する。Googleには、「Imagen」という未公開の画像生成AIツールがあるが、このツールはまだ研究段階にある。

　AIアートを作成するには、インターネット上にある何十億もの画像で、これらのモデルを訓練する必要がある。多くの場合、これらの画像は、特定のアーティストによって作成された芸術作品だ。AIはそれらの作品を再構築して転用することによって、画像を生成する。

　その新しい画像は元の作品と同じではないが、アーティストの原作のさまざまな要素が含まれている。そのため、AIが原作者に知らせたり、承認を得たりすることなく、そのアーティストに固有の独特なスタイルを複製し、新しい画像の生成に利用する可能性もある。AIによって生成されたアートは本当に「新しい」ものなのか、そして、そもそも「アート」なのか、ということについての議論は、おそらく今後何年も続くだろう。

　生成系AIモデルは、インターネットから膨大な量のコンテンツを取得した後、自らの訓練に使用された情報に基づいて予測を行い、ユーザーが入力したプロンプトにふさわしい出力を作成する。これらの予測はデータに基づいているが、予測が正しいという保証はない。モデルがインターネットから取り込むコンテンツには偏見も含まれるため、そうした偏見が応答に反映される可能性もあるが、多くの場合、それを知る方法はない。

　これらのモデルは、自分の生成する情報の正確性を必ずしも認識しているとは限らない。その情報はどこからもたらされたのか、そして、その情報がアルゴリズムによってどのように処理されてコンテンツが生成されたのかということを、私たちが知る方法はほとんどない。これらのボットが誤った情報を提供した事例や、答えを生成するために情報をでっち上げた事例はたくさんある。生成系AIの出力は興味深く、娯楽性もあるが、生成系AIによって作成された情報やコンテンツに依存することは、少なくとも短期的には、絶対に避けるべきだろう。

元記事： https://japan.zdnet.com/article/35200143/

IT関連 #ソフトウェア