ザッカーバーグ氏、音声コマンドでバーチャルワールドを作るデモを披露
今回は「ザッカーバーグ氏、音声コマンドでバーチャルワールドを作るデモを披露」についてご紹介します。
関連ワード (木々、草原、資金等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、TechCrunch様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
Meta(メタ、旧Facebook)は、音声コマンドだけでバーチャルワールドでモノをつくったり、持ち込んだりできるAIシステムのプロトタイプを披露した。同社は「Builder Bot(ビルダー・ボット)」と呼ばれるそのツールを、メタバースの中で新しい世界を作るAIの可能性を見せるための「実験的コンセプト」だと考えている。MetaのCEOであるMark Zuckerberg(マーク・ザッカーバーグ)氏は、米国時間2月23日に行われたイベント「Meta AI:Inside the Lab(メタ・エーアイ:インサイド・ザ・ラボ)」で、事前録画されたデモを通じてそのプロトタイプを紹介した。
動画内でザッカーバーグ氏は、バーチャルワールドのパーツを組み立てるプロセスを、実際にやりながら説明した。彼は「let’s go to a park(公園へ行こう)」というプロンプトから始めた。するとボットが、緑の草原と樹木のある公園の3D風景を作る。ザッカーバーグが「actually, let’s go to the beach(では、砂浜に行ってみよう)」というと、ボットは現在の風景を砂と水からなる新しい風景に置き換える。次に同氏は雲を追加したいと述べ、すべてAIが生成していると説明した。そしてザッカーバーグ氏は、ひつじ雲のほうがいい、と言って風景を変えた。これはボイスコマンドが具体的な指示を出せることを示すためだ。
彼が海の上の特定の場所を指して「あそこに島を作ろう」というとボットが島を作った。続いてザッカーバーグ氏は、木々とレジャーシートを追加するなどいくつかのコマンドを発した。さらにカモメとクジラの音も加えた。ある時彼は、水中翼船まで追加した(彼のお気に入りのホビーの1つで、流行語にもなった)。
ビデオ全体を通じて、Builder Botはボイスコマンドを使って3Dオブジェクトを作り、風景に配置しているように見えた。Metaはプロトタイプを発表したブログ投稿で、このツールは「メタバースの創造性を加速します」というが、技術の詳細は明らかにしていない。
画像クレジット:Meta
この技術が成功すれば、他のVRワールドやプラットフォームにも影響を与える可能性がある。例えばゲームプラットフォームのRoblox(ロブロックス)は、 最近音声機能のテストを開始し、独自の開発プラットフォームを提供している。いつかこうした会社が、Metaのプロトタイプで見られたようなテクノロジーを導入して、世界を創造する同じような体験を実現すればおもしろい。
しかし現段階は、Builder Botの作る世界は、外観も機能もかなりシンプルだ。また、コマンドを声に出してオブジェクトを呼び出すのは最初は楽しいかもしれないが、もっと複雑な3D環境を作る方法としてスケーラブルな方法とはいえない。どちらかといえば、子どもがバーチャルワールドを作る入門レベルの練習場所として楽しいかもしれない(しかし、残念ながらMetaはすでに、同社のバーチャル環境が子どもにとって安全な場所ではないかもしれないことを証明している)。
Metaによるこのプロトタイプの発表は、同社がメタバースに数十億ドル(数千億円)を投資している中の出来事だ。2022年2月初め、MetaはReality Labs(リアリティー・ラボ)部門の財務状況を初めて発表し、2021年100億ドル(約1兆1500億円)以上の赤字だったことを明かした。2022年も損失は増えるばかりと予測していると同社が述べているところを見ると、Metaにはメタバースを作るためにつぎ込む無限の資金があるようで、他の小さな会社より先に成功する時間は十分あるに違いない。同社のメタバースへの莫大な投資は、今後も我々はメタバースを宣伝するためのプロトタイプをたくさん見るであろうことも示唆している。
真の「メタバース」は未だに存在していないが、このバズワードはザッカーバーグ氏とMetaによってこの1年間数多く使われ、2021年の企業ブランド変更のきっかけにもなった。ザッカーバーグ氏は以前、メタバースについて投資家に次のように説明した。「デジタル空間で人々とともにいられるバーチャル環境です。それは見ているだけではなく自分がその中にいる、一種の具現化されたインターネットのようなものです」。
Metaは同日のイベントで他にもいくつか発表を行った。AIを利用したチャットボット、AIシステムカードツール、および and a 万能音声翻訳機だ。この翻訳機は話し言葉が主のものを含むあらゆる言語の同時通訳を行うもので、既存の翻訳システムを超えるだろうと同社は言っている。Metaによると、世界人口の20%は、既存の翻訳ツールが対応していない言語を話しており、同社は新しい機械学習技術を駆使してこれを解決する計画だ。
画像クレジット:Meta
【原文】
Meta, formerly known as Facebook, today showed off a prototype of an AI system that enables people to generate or import things into a virtual world just by using voice commands. The company sees the tool, which is called “Builder Bot,” as an “exploratory concept” that shows AI’s potential for creating new worlds in the metaverse. Meta CEO Mark Zuckerberg showed off the prototype at the Meta AI: Inside the Lab event on Wednesday in a pre-recorded demo video.
In the video, Zuckerberg explained the process of building parts of a virtual world by describing them. He begins with the prompt, “let’s go to a park.” The bot then creates a 3D landscape of a park with green grass and trees. Zuckerberg then says “actually, let’s go to the beach,” after which the bot replaces the current landscape with a new one of sand and water. He then says he wants to add clouds and notes that everything is AI-generated. Zuckerberg then changes up the landscape by saying he’d rather have altocumulus clouds, which is meant to demonstrate how specific the voice commands can be.
He then points to a specific area of the water and says “let’s add an island over there,” and then the bot creates one. Zuckerberg then issues several other voice commands, such as adding trees and a picnic blanket. He also adds the sound of seagulls and whales. At one point, he even adds a hydrofoil — a nod to one of his favorite hobbies, which later turned into a meme.
Throughout the video, the Builder Bot appears to be using voice commands to create 3D objects and placing them onto the landscape. In the blog post that announced the prototype, Meta said the tool will “fuel creativity in the metaverse,” but didn’t offer technical details.
Image Credits: Meta
The technology, if successful, could have implications for other VR worlds and platforms. For instance, game platform Roblox has begun testing voice features in recent months and it offers its own developer platform. It’s interesting to imagine how a company like this could one day adopt the type of technology displayed in Meta’s prototype for a similar world-building experience.
However, in its present form, the world that Builder Bot created is fairly simple in terms of its looks and functionality. And while it may be fun at first to speak commands to have objects appear, it’s not a scalable way to build more complex 3D environments. If anything, it could be a fun kids’ playground for an entry-level experience in virtual world creation. (Unfortunately, though, Meta is already proving that its virtual environment may not be a safe place for children.)
Meta’s unveiling of its prototype comes as the company is spending billions on the metaverse. Earlier this month, Meta released financials for its Reality Labs division for the first time and revealed that it lost more than $10 billion last year. The company said it expects the losses will only get bigger this year, which indicates that Meta has seemingly endless money to spend on building out the metaverse and likely has quite a bit of time to pull it off ahead of other smaller companies. The company’s deep investments into the metaverse also suggest we’ll see more prototypes that are designed to advance the metaverse.
Although a true “metaverse” may not yet exist, the buzzword is being used by Zuckerberg and Meta a lot over the past year and even fueled its recent corporate branding change. Zuckerberg previously described the metaverse to investors as a “virtual environment where you can be present with people in digital spaces. You can kind of think of this as an embodied internet that you’re inside of rather than just looking at.”
Meta made a few other announcements at its event today, including its plans for AI-powered chatbots, an AI system card tool, and a Universal Speech Translator. The company says the latter could provide instantaneous speech-to-speech translation across all languages, including those that are mostly spoken, which would be a leap over existing translation systems. Meta noted that 20% of the world’s population does not speak languages covered by current translation tools and that it plans to overcome this by deploying new machine learning techniques.
(文:Aisha Malik、翻訳:Nob Takahashi / facebook )