グーグル、テキストから画像を生成するAIシステム「Imagen」

今回は「グーグル、テキストから画像を生成するAIシステム「Imagen」」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Googleは、人工知能(AI)を使ってテキストから画像を生成する新たな拡散モデルを開発している。類似するAIモデルより優れたものだとしている。

 このモデル「Imagen」は、例えば「カウボーイハットと赤いシャツを身に着け、ビーチでギターを弾いているペルシア猫の写真」といったテキストが入力されると、その画像を出力する。写真のようにリアルな画像も、芸術作品のように加工された画像も生成できるようだ。

 同じようにテキストから画像を生成するAIとして、「DALL・E」「VQGAN+CLIP」「Latent Diffusion Models」などがある。そうした他のAIモデルとImagenが生成する画像との比較について、Googleは、正確さと画像の忠実度で自社のモデルが優れていることが明らかになったとしている。

 Imagenのウェブサイトで、指示するテキストとこのAIで作成された結果画像の例がいくつか紹介されている。「寿司でできた家に住むかわいいコーギー」のような例もある。これらは、生成された中で特に優れた結果であるかもしれない。Googleは米CNETの取材にコメントしなかった。

 テキストから画像を生成するモデルは、機械学習システムが持つポテンシャルを示している。Imagenがあれば、抽象的な画像を作成するために、「Photoshop」のような専門的なソフトウェアの使い方を学ぶ必要がなくなるかもしれない。Googleは5月の開発者向け年次会議「Google I/O」で、AIシステムは「アンビエントコンピューティング」という未来像に近づく上で役立てられると述べていた。アンビエントコンピューティングは、いずれ人々が特別なシステムやコードの知識を必要とせず、直感的にコンピューターを利用できるようになるといったアイデアだ。

 ただし、テキストから画像を生成するAIの影響力はGoogleも認識している。同社は現時点で、Imagenを一般向けにリリースしないことにした。Imagenはインターネットから情報を集め、学習して画像を生成する。インターネットには、ステレオタイプと偏見があふれている場合もあり、Imagenが生成する画像に反映されてしまう懸念もある。またGoogleは、Imagenが悪意ある何者かがネガティブな使い方をするリスクも懸念している。

 Googleが公開したホワイトペーパーによると、「ジェネレーティブな手法は、ハラスメントや偽情報の拡散などの悪質な目的で利用される恐れがあり、社会的、文化的排除やバイアスに関する多くの懸念をもたらす可能性がある」という。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
生成AIの利用経験者が3カ月で2倍に、半数以上が「ほぼ使わない」など課題も–GMOリサーチ
IT関連
2024-03-24 03:04
Discord、一部のサーバーでフォーラム、新MODツール、ホットな話題を表示するホームページをテスト中
IT関連
2022-02-07 05:40
エンジニアの客観的な評価に貢献–「New Relic」を導入したディップ
IT関連
2023-01-28 13:23
三井不動産、商業施設運営の大規模基幹システムをクラウド化
IT関連
2022-04-14 09:25
ヒカキンがVTuberデビュー チャンネル登録者数1000万人目指す
企業・業界動向
2021-08-04 15:36
「NP後払い」のネットプロテクションズがJCBと資本提携、約60億円の調達とともに事業連携を強化
フィンテック
2021-02-26 01:13
Facebook版Clubhouse「Live Audio Rooms」とPodcast、米国で始動
アプリ・Web
2021-06-23 14:17
数年間で1億ドルを日本に投資–キンドリルが国内の事業戦略を明らかに
IT関連
2023-10-14 01:15
ヘッドレスブラウザ+Puppeteerが使える「Cloudflare Workers Browser Rendering API」がオープンベータに
Cloudflare
2023-05-22 08:34
NGINXのコア開発者がF5の経営陣に反発、NGINXをフォークし「FreeNginx」を立ち上げ。F5の経営陣がポリシーや開発者の立場を無視したと
HTTP
2024-02-17 09:24
第四北越銀行、「FutureBANK」ベースの営業融資支援システムを導入
IT関連
2023-03-02 04:38
「ChatGPT」の成功がAIに与える非オープン化の弊害、第一人者のベンジオ氏が警告
IT関連
2023-03-19 19:07
Facebook、脳からの神経信号を読み取るリストバンドを披露 ARメガネの入力用
製品動向
2021-03-20 12:20
Bun 1.1.5でクロスコンパイルが可能に。LinuxでWindows対応の実行ファイルなどビルド
Bun
2024-05-02 14:53