グーグル、新しい動画生成モデル「Veo 2」を発表

今回は「グーグル、新しい動画生成モデル「Veo 2」を発表」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Googleは米国時間12月16日、テキストから動画を生成する「Veo 2」を公開した。現実世界の物理をより正確に反映でき、より詳細で現実感のある動画を人工知能(AI)で生成できるなど、前モデルから大幅に改良されたとGoogleは説明している。

 Googleによると、生成できる動画の最大解像度は4Kで、指の数が多いといったハルシネーションなど、動画生成AIのよくある問題に対処できる。人間の投票による評価では、「Sora Turbo」「Kiling v1.5」「Meta Movie Gen」といった主要動画生成モデルと比較して、Veo 2が全体のパフォーマンスとプロンプトへの忠実度で最高の評価を得た。

 Veo 2は、具体的なジャンル、レンズ、アングルなど映画撮影技術の用語も理解する。例えば、「shallow depth of field(被写界深度を浅くする)」と指示されたVeo 2は、被写体の背景をぼかしてその効果を生み出すのだと理解する。次の動画は「35mmレンズを使い、Kodakのフィルム『PORTRA 400』で撮影」と具体的に指示した場面から作成されたものだ。

 Veo 2は一般公開されており、「Google Labs」内の「VideoFX」で利用できる。早期利用の順番待ちリストへの登録フォームでは、年齢、氏名、居住地、関連する作品、どのようにして知ったかなどを入力する。Googleによると、申請は申込み順に審査していくという。

 Googleは今回、「より鮮やかで構図がいい」画像を生成するという画像生成モデル「Imagen 3」の改良版も発表した。Googleによると、改良モデルはこれまでよりも多様なスタイルの生成に対応しており、出力画像のプロンプトへの忠実度と、細部とテクスチャーの豊かさが向上している。

 改良されたImagen 3は、12月16日からGoogle Labsの「ImageFX」経由で順次公開されている。VideoFXと異なり、こちらは順番待ちリストへの登録が必要ない。Imagen 3はこれまでのバージョンもすでに非常に能力が高く、米ZDNETの2024年のまとめでは、最も優秀な画像生成AIと評価された。

 最後になるが、Googleは今回、新たな試みである「Whisk」も発表した。同じくGoogle Labsから利用できる。Whiskは、画像を作成して(あるいは自作の画像を入力して)から、ぬいぐるみ、ピンバッジ、ステッカーなど、スタイルを指定して新たな画像に作りかえることができる。Imagen 3と「Gemini」が使われており、Geminiで画像の詳細なキャプションを作成し、それをImagen 3に読み込ませて最終的な画像を生成する。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
グーグルとiCAD、AIを使った乳がん検査で協業を拡大
IT関連
2023-08-16 21:16
日立、運用管理ソフト「JP1 V12.5」を販売–SaaS型「JP1 Cloud Service」も提供へ
IT関連
2021-01-22 04:39
3Dプリント、ロボッティクス、自動化で手頃な価格の家を建てるMighty Buildingsが約42億円調達
ハードウェア
2021-02-16 11:07
“情報システム部門も知らない資産”がサイバー攻撃の標的に 「CyCognito」で隠れたリスクを洗い出せ!
PR
2021-03-19 01:47
ローソン銀行、エヴァとコラボ シンジ、アスカ、ミサトの音声がATM操作を案内
-
2021-01-19 15:49
LINE上でGoogle Play ギフトコードの購入が可能に LINEポイントで支払い可
ネットトピック
2021-06-26 15:18
「Raspberry Pi 5」を使ってみた–気になるパフォーマンスや発熱をチェック
IT関連
2023-12-03 02:05
楽天モバイル、20GBまで1980円の新プラン 1GBまで無料の段階制
企業・業界動向
2021-01-30 18:46
温泉地の地域活性化、「温泉むすめ」とNFTで 暗号通貨活用も
企業・業界動向
2021-05-13 10:11
日本の要件に対応した機能を強化–「Oracle NetSuite」事業戦略を発表
IT関連
2023-11-15 22:51
ライオン、Salesforceの新機能でデータドリブンな営業プロセスを確立
IT関連
2025-01-10 20:28
過去番組表から「TVer」動画を直接再生、フナイの4Kテレビから ただし地域限定
くらテク
2021-05-20 00:40
Slackで使える「ソフトウェアテスト関係者くらいしか使わない絵文字」第二弾をMagicPodが公開。「9割できてます」「運用でカバー」など50種類
おもしろ
2024-03-22 00:06
日立とSAPジャパン、製造業の生産計画と実績の差異をリアルタイムに可視化
IT関連
2024-08-02 20:17