AIのためのリアルなバーチャルトレーニング環境をフェイスブックとMatterportが共同開発

今回は「AIのためのリアルなバーチャルトレーニング環境をフェイスブックとMatterportが共同開発」についてご紹介します。

関連ワード (Facebook、Matterport、トレーニング等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、TechCrunch様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


ロボットが家の中を移動できるように訓練するには、何軒もの本物の家で、実際に何時間も訓練する、何軒もの仮想の家で、仮想的に時間をかける、という2つの選択肢があるが、後者の方が便利なのはいうまでもない。FacebookとMatterport(マーターポート)は共同で、研究者および学習過程にあり、データを必要としているAIに、何千ものバーチャルかつインタラクティブな、本物の家のデジタルツイン(仮想空間で再現されたリアル空間)を提供する。

Facebook側の大きな進歩は、新しいトレーニング環境「Habitat 2.0」と、それを可能にするために作成されたデータセットの2つだ。数年前に公開されたHabitatを覚えているだろうか。当時Facebookは「身体性を有するAI」と呼ばれる現実世界と相互作用するAIモデルを開発するために、AIが動き回ることのできる、写真のようにリアルに描写された仮想環境を大量に構築していた。

関連記事:Facebookがロボットを学習させるための本物そっくりな仮想の家を提供

これまで、たくさんのロボットやAIが、現実よりもゲームに近い、理想的かつ非現実的な空間で、動作や物体認識などの学習を行ってきた。現実のリビングルームは、バーチャルに再現されたものとはまったく異なる。現実に近い空間で動きを学習したAIのナレッジがあれば、家庭用ロボットなどへの実際の適用も実現しやすくなるだろう。

しかし結局のところ、バーチャル環境にはポリゴンの厚みしかなく、相互作用は最小限で、物理的にリアルなシミュレーションもない。ロボットがテーブルにぶつかっても、倒れて物をそこら中にこぼしたりすることもなく、台所で冷蔵庫を開けたり、流し台から物を持ち上げたりすることもできなかった。今回、Habitat 2.0および新しいReplicaCADのデータセットは、相互作用性を改善し、単に3Dの表面をなぞるのではなく、3Dオブジェクトを増やすことで、この問題を解決する。

シミュレートされたロボットは、これまでと同様に新しい住戸単位の環境を動き回るが、あるオブジェクトに到達すると、そのオブジェクトに対して実際にアクションすることができる。あるロボットのタスクが「ダイニングテーブルからフォークを拾ってシンクに置く」ことだと考えてみよう。数年前までは、フォークを適切にシミュレートできなかったので、フォークを持ち上げたり下ろしたりすることだけが想定されていた。Habitat 2.0では、フォークが置かれているテーブルやシンクなどが物理的にシミュレートされる。そのため、計算量は増加するが、格段に有意義なシミュレーションとなる。

この分野は急速に進歩しており、新しいシステムが登場するたびに新機能が追加され、同時に次の大きな改善点やチャンスが示される。この場合、Habitat 2.0の最も近い競争相手は、住戸単位の環境と物理的なオブジェクトのシミュレーションを組み合わせたAI2(エーアイツー)の「ManipulaTHOR」だろう。

Habitat 2.0はスピードでManipulaTHORに勝る。論文によると、シミュレーターの実行速度はManipulaTHORと比較しておよそ50~100倍。つまり、ロボットは1秒あたり50~100倍多くのトレーニングを実行することができる(これは厳密な比較ではなく、2つのシステムは他にも異なる点がある)。

ここで使用されるデータセットはReplicaCADと呼ばれ、基本的にはオリジナルの部屋のスキャンをカスタム3Dモデルで再現したものである。面倒な手作業であり、Facebookはスケールアップの方法を検討していると認めているが、非常に有用な結果を提供する。

オリジナルの部屋のスキャン(上)とReplicaCADによる3D再現(下)

基本的なオブジェクトや動き、ロボットの存在などはサポートされているが、現段階ではスピードを優先したため、再現性は失われている。そのため、より詳細でより多くの種類の物理シミュレーションが計画されている。

また、Matterportは、Facebookとの提携でも大きな動きを見せている。ここ数年でプラットフォームを大幅に拡大したMatterportは、3Dスキャンした建物の膨大なコレクションを持つ。これまでも研究者との共同研究を行ってきたMatterportだが、そのコレクションの大部分をコミュニティで利用できるようにする時が来たと判断した。

CEOのRJ Pittman(アールジェー・ピットマン)氏は次のように話す。「私たちは、現存するあらゆる種類の物理的構造物、構造物のようなものに対し、3Dデータを作成しました。住宅、高層ビル、病院、オフィス空間、クルーズ船、ジェット機、マクドナルド……。デジタルツインに含まれる情報すべてが、研究には非常に重要です」「これらの3Dデータはコンピュータビジョン、ロボット工学、家庭内オブジェクトの識別など、あらゆる分野に影響すると確信していました。Facebookに事細かに説明する必要はありませんでした。Habitatや身体性を有するAIにとっては、あきらかに重要なデータだからです」。

Matterportが、不動産を閲覧する人が目にするような住宅のスキャンから企業や公共スペースまで、1000点ものインテリアを極めて詳細に3Dキャプチャーしたデータセット、HM3Dを作成したのはこれが目的だ。HM3Dは、一般公開されているコレクションとしては最大となる。

画像クレジット:Matterport

正確なデジタルツインでトレーニングされたAIがスキャンし、読み取った環境は、スケール的に非常に正確で、例えば窓の表面積やクローゼットの総容積の正確な数値が計算できる。これは、AIモデルにとって有益でリアルな遊び場で、出来上がったデータセットは(まだ)インタラクティブではないものの、現実世界のあらゆる不変性を非常によく反映している(Facebookのインタラクティブデータセットとは異なるが、拡張の基盤となる可能性がある)。

ピットマン氏は「(HM3Dは)極めて多様性の大きなデータセットです」「 私たちは、さまざまな実世界の環境を、豊富に、確実に集めたいと考えていました。AIやロボットのトレーニングで最大限の効果を得るには、このような多様なデータが必要なのです」と話す。

すべてのデータはその空間の所有者から提供されたもので、(極めて小さい文字で印刷された契約書の細則を使って)非倫理的に集められたという心配はない。同氏の説明によると「最終的には、より大きく、よりパラメータ化されたデータセット、すなわちサービスとしての現実的な仮想空間を作成し、APIでアクセスできるようにしたい」とのことだ。

ピットマン氏は語る。「米国風のB&B(ベッドアンドブレックファスト、比較的低価格で利用できる宿泊施設)での利用を想定したおもてなしロボットを作っているとしましょう。B&Bのデータが1000個あればすばらしいと思いませんか?」「この最初のデータセットでどこまでのことが可能かを確認し、学び、研究コミュニティや自社の開発者と協力して、さらに進化させていきたいと考えています。私たちにとって重要な出発点です」。

ReplicaCADとHM3Dはどちらも公開され、世界中の研究者が利用できるようになる予定だ。

関連記事
・Googleの研究でロボット犬の小走りが簡単に
・VRで事前学習してから作業する公共トイレ用掃除ロボ

画像クレジット:Facebook


【原文】

To train a robot to navigate a house, you either need to give it a lot of real time in a lot of real houses, or a lot of virtual time in a lot of virtual houses. The latter is definitely the better option, and Facebook and Matterport are working together to make thousands of virtual, interactive digital twins of real spaces available for researchers and their voracious young AIs.

On Facebook’s side the big advance is in two parts: the new Habitat 2.0 training environment and the dataset they created to enable it. You may remember Habitat from a couple years back; in the pursuit of what it calls “embodied AI,” which is to say AI models that interact with the real world, Facebook assembled a number of passably photorealistic virtual environments for them to navigate.

Many robots and AIs have learned things like movement and object recognition in idealized, unrealistic spaces that resemble games more than reality. A real-world living room is a very different thing from a reconstructed one. By learning to move about in something that looks like reality, an AI’s knowledge will transfer more readily to real-world applications like home robotics.

But ultimately these environments were only polygon-deep, with minimal interaction and no real physical simulation — if a robot bumps into a table, it doesn’t fall over and spill items everywhere. The robot could go to the kitchen, but it couldn’t open the fridge or pull something out of the sink. Habitat 2.0 and the new ReplicaCAD dataset change that with increased interactivity and 3D objects instead of simply interpreted 3D surfaces.

Simulated robots in these new apartment-scale environments can roll around like before, but when they arrive at an object, they can actually do something with it. For instance if a robot’s task is to pick up a fork from the dining room table and go place it in the sink, a couple years ago picking up and putting down the fork would just be assumed, since you couldn’t actually simulate it effectively. In the new Habitat system the fork is physically simulated, as is the table it’s on, the sink it’s going to, and so on. That makes it more computationally intense, but also way more useful.

They’re not the first to get to this stage by a long shot, but the whole field is moving along at a rapid clip and each time a new system comes out it leapfrogs the others in some ways and points at the next big bottleneck or opportunity. In this case Habitat 2.0’s nearest competition is probably AI2’s ManipulaTHOR, which combines room-scale environments with physical object simulation.

Where Habitat has it beat is in speed: according to the paper describing it, the simulator can run roughly 50-100 times faster, which means a robot can get that much more training done per second of computation. (The comparisons aren’t exact by any means and the systems are distinct in other ways.)

The dataset used for it is called ReplicaCAD, and it’s essentially the original room-level scans recreated with custom 3D models. This is a painstaking manual process, Facebook admitted, and they’re looking into ways of scaling it, but it provides a very useful end product.

The original scanned room, above, and ReplicaCAD 3D recreation, below.

More detail and more types of physical simulation are on the roadmap — basic objects, movements, and robotic presences are supported, but fidelity had to give way for speed at this stage.

Matterport is also making some big moves in partnership with Facebook. After making a huge platform expansion over the last couple years, the company has assembled an enormous collection of 3D-scanned buildings. Though it has worked with researchers before, the company decided it was time to make a larger part of its trove available to the community.

“We’ve Matterported every type of physical structure in existence, or close to it. Homes, high-rises, hospitals, office spaces, cruise ships, jets, Taco Bells, McDonalds… and all the info that is contained in a digital twin is very important to research,” CEO RJ Pittman told me. “We thought for sure this would have implications for everything from doing computer vision to robotics to identifying household objects. Facebook didn’t need any convincing… for Habitat and embodied AI it is right down the center of the fairway.”

To that end it created a dataset, HM3D, of a thousand meticulously 3D-captured interiors, from the home scans that real estate browsers may recognize to businesses and public spaces. It’s the largest such collection that has been made widely available.

Image Credits: Matterport

The environments, which are scanned an interpreted by an AI trained on precise digital twins, are dimensionally accurate to the point where, for example, exact numbers for window surface area or total closet volume can be calculated. It’s a helpfully realistic playground for AI models, and while the resulting dataset isn’t interactive (yet) it is very reflective of the real world in all its variance. (It’s distinct from the Facebook interactive dataset but could form the basis for an expansion.)

“It is specifically a diversified dataset,” said Pittman. “We wanted to be sure we had a rich grouping of different real world environments — you need that diversity of data if you want to get the most mileage out of it training an AI or robot.”

All the data was volunteered by the owners of the spaces, so don’t worry that it’s been sucked up unethically by some small print. Ultimately, Pittman explained, the company wants to create a larger, more parameterized dataset that can be accessed by API — realistic virtual spaces as a service, basically.

“Maybe you’re building a hospitality robot, for bed and breakfasts of a certain style in the U.S — wouldn’t it be great to be able to get a thousand of those?” he mused. “We want to see how far we can push advancements with this first dataset, get those learnings, then continue to work with the research community and our own developers and go from there. This is an important launching point for us.”

Both datasets will be open and available for researchers everywhere to use.

(文:Devin Coldewey、翻訳:Dragonfly)

Facebook - Log In or Sign Up

Facebookアカウントを作成するか、ログインしてください。友達や家族と写真や動画、近況をシェアしたり、メッセージをやり取りしましょう。 ... Facebookを使うと、友達や同僚、同級生、仲間たちとつながりを深められます。ケータイ ...

COMMENTS


49270:
2021-07-12 23:06

❴ iHerb割引クーポン ❵ お会計時にご入力いただくと、 どなたでも割引になります 良かったら使ってください プロモコード  ♡【 AFZ9811 】♡ ♡【 AFZ9811 】♡ 免疫、969131y、タンパク質と食…

49263:
2021-07-12 21:48

❴ iHerb割引クーポン ❵ お会計時にご入力いただくと、 どなたでも割引になります 良かったら使ってください プロモコード  ♡【 AFZ9811 】♡ ♡【 AFZ9811 】♡ 免疫、タンパク質と食事、抗酸化サプリ…

49268:
2021-07-12 20:48

今日はお友達に誘ってもらって、安藤美姫さんが一般の人向けに行っているトレーニングに行きました うわあ本物だあ…というミーハーな気持ちが終始耐えなかったことは置いておいて、 運動して汗かいて今とても気持ちがよいです トレーニングは全てを解決する 悩…

49267:
2021-07-12 18:34

お菓子とジュースをやめると口が寂しくなります、そんな時は、 トレーニングをしましょう! 一石二鳥です!

49264:
2021-07-12 18:22

❴ iHerb割引クーポン ❵ お会計時にご入力いただくと、 どなたでも割引になります 良かったら使ってください プロモコード  ♡【 AFZ9811 】♡ ♡【 AFZ9811 】♡ 免疫、76443y、タンパク質と食事…

49266:
2021-07-12 18:16

夏間近なので、暇あれば一日に何回もやってる腹筋追い込みトレーニング?‍♀️休まず全部通しで行うんだけど泣けるほどしんどい!!!!

49269:
2021-07-12 12:36

トレーニング終了30分までが ゴールデンタイムと言われている。 その時間にタンパク質を吸収すると 筋肉の成長が上がります! 私も30分以内にプロテイン(タンパク質) を摂るようにしています。

49265:
2021-07-12 00:00

紹介コード『AFZ9811』を入れると、5%割引になります iHerb クーポンコード(プロモコード) . . リピーター 5%割引 初回 $5割引 【 AFZ9811 】 抗酸化サプリメントと化粧品、Bcaa、プロテイン…

Recommended

TITLE
CATEGORY
DATE
高額なクラウドコストをどう捉えるか–コスト管理を考えるためのヒント
IT関連
2021-07-14 22:10
「ChatGPT」など生成AIツールがセキュリティの大きな懸念材料に
IT関連
2023-03-16 15:31
「ピカチュウジェット」沖縄の空へ ポケモン社全面協力 版権使用料なしで観光支援
くらテク
2021-06-22 16:48
北九州市と日本IBMが連携–「IBM地域DXセンター」を新設
IT関連
2022-08-06 15:18
困難なグリーンテック推進、成功の鍵は–ITリーダーに聞く
IT関連
2023-03-11 03:22
アップルの新しい暗号化ブラウジング機能は中国、サウジアラビアなどでは利用できない
セキュリティ
2021-06-09 04:51
マカフィーが法人向け事業を約4370億円で売却、消費者向けビジネスに専念
セキュリティ
2021-03-10 02:24
イオン銀行、日立のソリューション活用で共通アプリケーション基盤構築
IT関連
2023-12-02 16:29
自社オリジナルで行こう–変革進めるイトーキに聞く、DX人材育成の勘所
IT関連
2023-11-28 04:31
「kintone」ガバナンスガイドライン、無料公開–企業ごとの「ガバナンスマップ」を
IT関連
2022-07-17 20:09
KDDIら、空間のメディア化ソリューション提供へ–都市空間に広告やコンテンツを配信
IT関連
2022-01-30 18:19
シャア専用色の江戸川コナンと赤井秀一カラーのシャア専用ザクがプラモデルに 映画公開記念コラボで 「声優ネタ」と話題に
くらテク
2021-06-16 05:48
編集者の嗅覚を守りたい–戦略子会社トップに聞く、KADOKAWA出版事業のDX
IT関連
2023-12-01 13:29
IBMのオープンソース日本語フォント「IBM Plex Sans JP」の実力をデザイナーが検証してみた :デジタルネイティブのためのフォントとデザイン(1/4 ページ)
イラスト・デザイン
2021-07-31 16:24