グーグル、テキストから画像を生成するAIシステム「Imagen」

今回は「グーグル、テキストから画像を生成するAIシステム「Imagen」」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Googleは、人工知能(AI)を使ってテキストから画像を生成する新たな拡散モデルを開発している。類似するAIモデルより優れたものだとしている。

 このモデル「Imagen」は、例えば「カウボーイハットと赤いシャツを身に着け、ビーチでギターを弾いているペルシア猫の写真」といったテキストが入力されると、その画像を出力する。写真のようにリアルな画像も、芸術作品のように加工された画像も生成できるようだ。

 同じようにテキストから画像を生成するAIとして、「DALL・E」「VQGAN+CLIP」「Latent Diffusion Models」などがある。そうした他のAIモデルとImagenが生成する画像との比較について、Googleは、正確さと画像の忠実度で自社のモデルが優れていることが明らかになったとしている。

 Imagenのウェブサイトで、指示するテキストとこのAIで作成された結果画像の例がいくつか紹介されている。「寿司でできた家に住むかわいいコーギー」のような例もある。これらは、生成された中で特に優れた結果であるかもしれない。Googleは米CNETの取材にコメントしなかった。

 テキストから画像を生成するモデルは、機械学習システムが持つポテンシャルを示している。Imagenがあれば、抽象的な画像を作成するために、「Photoshop」のような専門的なソフトウェアの使い方を学ぶ必要がなくなるかもしれない。Googleは5月の開発者向け年次会議「Google I/O」で、AIシステムは「アンビエントコンピューティング」という未来像に近づく上で役立てられると述べていた。アンビエントコンピューティングは、いずれ人々が特別なシステムやコードの知識を必要とせず、直感的にコンピューターを利用できるようになるといったアイデアだ。

 ただし、テキストから画像を生成するAIの影響力はGoogleも認識している。同社は現時点で、Imagenを一般向けにリリースしないことにした。Imagenはインターネットから情報を集め、学習して画像を生成する。インターネットには、ステレオタイプと偏見があふれている場合もあり、Imagenが生成する画像に反映されてしまう懸念もある。またGoogleは、Imagenが悪意ある何者かがネガティブな使い方をするリスクも懸念している。

 Googleが公開したホワイトペーパーによると、「ジェネレーティブな手法は、ハラスメントや偽情報の拡散などの悪質な目的で利用される恐れがあり、社会的、文化的排除やバイアスに関する多くの懸念をもたらす可能性がある」という。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
東急、管理会計システム構築に経営管理システム基盤「fusion_place」を採用
IT関連
2022-10-08 21:56
「kintoneの脆弱性ではない」 東京都医療者向けワクチン予約サイトの個人情報問題でサイボウズが見解
クラウドユーザー
2021-04-28 05:38
ダイヤル式金庫の仕組みを再現 カプセルトイ「マジで破れる金庫」発売
くらテク
2021-02-16 04:19
F5、「F5 Distributed Cloud CDN」を国内提供–分散型アプリケーションの展開を強化
IT関連
2023-08-11 09:38
サイバネットら3社、XR技術を活用した都市設計ツールを開発–市民参加型のワークショップ実施
IT関連
2023-04-27 16:24
2020年に目立ったのは不正侵入を狙う攻撃–トレンドマイクロが総括
IT関連
2021-03-19 06:35
Clubhouseで楽しさを知った会話の「輪」はさらに広がる 「音声」の重要性を改めて考えてみた (1/2 ページ)
くわしく
2021-02-26 05:40
ノートンライフロックがアバストと合併–取引規模は1兆円近く
IT関連
2021-08-12 00:24
気が散らないメッセージングアプリ「Quill」、どこからともなく現れSlackに迫る勢い
ネットサービス
2021-03-19 07:14
EAがロシアとベラルーシでのゲーム・コンテンツ販売を停止、Origin、EA Appでの購入不可に
IT関連
2022-03-08 19:16
第2回:メタバースで広がる経済圏–日本企業の飛躍にも期待
IT関連
2022-02-18 23:17
オラクル、MySQLのインメモリーサービスに運用自動化機能を追加
IT関連
2021-08-12 08:51
Webブラウザ上でGPUプログラミングを可能にする「WebGPU」、Chrome 113で正式版に。3Dレンダリングや機械学習など高速処理
Chrome
2023-04-10 02:04
スピアフィッシング攻撃の新たなトレンド–バラクーダ、調査結果を公開
IT関連
2022-04-15 09:33