グーグル「Gemini」とは–新しいマルチモーダル生成AIモデルを知る

今回は「グーグル「Gemini」とは–新しいマルチモーダル生成AIモデルを知る」についてご紹介します。

関連ワード (CIO/経営、生成AIの台頭等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Geminiは、Googleの新しい強力な人工知能モデルで、テキストだけでなく画像や動画、音声も理解することができる。マルチモーダルモデルなので、数学や物理学などの分野の複雑なタスクを完了できるだけでなく、さまざまなプログラミング言語で高品質のコードを理解および生成することも可能だと説明されている。

 Geminiは現在、「Google Bard」および「Pixel 8」との統合を通して利用可能だが、今後、Googleのほかのサービスにも徐々に組み込まれていく予定だ。

 Alphabet傘下のDeepMindの最高経営責任者(CEO)兼共同創設者であるDennis Hassabis氏によると、「Geminiは、Google Researchの同僚たちを含むGoogleのさまざまなチームによる大規模な共同作業の成果である」という。「Geminiは最初からマルチモーダルモデルとして構築されたので、テキストやコード、音声、画像、動画など、さまざまな種類の情報を一般化してシームレスに理解したり、操作したり、組み合わせたりすることが可能だ」

 Geminiは、Googleと親会社のAlphabetによって開発され、これまでで最も先進的なGoogleのAIモデルとしてリリースされた。DeepMindもGeminiの開発に多大な貢献をした。

 GoogleはGeminiについて、Googleのデータセンターからモバイルデバイスまで、あらゆる場所で実行できる柔軟なモデルだと説明している。この拡張性を実現するため、Geminiは、「Gemini Nano」「Gemini Pro」「Gemini Ultra」の3種類のバージョンが用意されている。

 Geminiは現在、Pixel 8スマートフォン(Gemini Nano)とBardチャットボット(Gemini Pro)で利用できる。Googleは今後、検索や広告、「Chrome」、そのほかのサービスにGeminiを統合していく計画だ。

 開発者と企業顧客は、米国時間12月13日より、Googleの「AI Studio」と「Google Cloud Vertex AI」のGemini APIを通して、Gemini Proにアクセスできるようになる。「Android」開発者は、早期プレビューにサインアップすると、「AI Core」を通してGemini Nanoにアクセスできるようになる。

 Googleの新しいGeminiモデルは、これまでで最も大規模かつ先進的なAIモデルの1つであるようだが、Ultraモデルがリリースされるまで、それが事実なのかどうかは確かめようがない。現在、さまざまなAIチャットボットで使用されているほかの人気モデルと比べて、Geminiが際立っているのは、最初からマルチモーダルモデルとして構築されたことだ。「GPT-4」など、ほかのモデルはプラグインや統合を通して、真のマルチモーダル性を獲得している。

 主にテキストベースのモデルであるGPT-4と比較すると、Geminiはマルチモーダルタスクを簡単にネイティブで実行できる。GPT-4は、コンテンツ作成や複雑なテキスト分析などの言語関連タスクをネイティブで処理するのが得意だが、画像分析とウェブアクセスにはOpenAIのプラグインを使用し、画像の生成と音声の処理には、それぞれ「DALL-E 3」と「Whisper」を利用する。

 GoogleのGeminiは、現在利用可能なほかのモデルよりも製品に重点を置いているようだ。BardとPixel 8の両方に搭載されているように、Geminiは同社のエコシステムにすでに統合されているか、あるいは、今後統合される予定だ。GPT-4やMetaの「Llama」など、ほかのモデルは、よりサービス指向であり、さまざまなサードパーティーのアプリケーションやツール、サービスの開発者に公開されている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
柔軟なレイアウト機能を備えたスライドデッキ制作ツール「Tome」が一般公開
IT関連
2022-03-25 04:22
世界の電子部品サプライチェーンに安定化の兆し–Supplyframe
IT関連
2022-08-19 03:39
在宅フィットネスのPelotonが配達短縮のためにロジスティックへ約105億円投資
ヘルステック
2021-02-06 14:24
RubyのWebAssembly/WASIへの移植が実現、プレリリース版のバイナリ公開。RubyGemsにも対応
Ruby
2022-04-04 20:03
「kintoneの脆弱性ではない」 東京都医療者向けワクチン予約サイトの個人情報問題でサイボウズが見解
クラウドユーザー
2021-04-28 05:38
Rent the RunwayのiOSチームがアプリのリリースサイクルを管理するRunwayを開発
ソフトウェア
2021-03-13 08:16
NTTデータが提案する「マルチクラウドによるデジタルガバメント」の姿とは
IT関連
2021-02-19 01:44
五輪期間中のTwitter投稿から見た“開催への賛否” 転機は開会式 JX通信社が分析
社会とIT
2021-08-20 13:03
ラック社長が語った「経営視点でのゼロトラストセキュリティ対策」
IT関連
2021-03-19 16:33
取引先ITベンダーのリスク、事業継続などの対策進まず–ガートナー調査
IT関連
2022-08-23 19:17
次期「.NET 8」プレビューリリース初公開。ネイティブコンパイラ改善で生成バイナリが約半分に、「Blazor United」登場など
.NET
2023-02-24 23:46
イオンのCTOが巨大企業の変革プロセスを解説、集英社が認証基盤統合を語る。情シス有志による「BTCONJP 2024」開催[PR]
PR
2024-09-13 11:51
ベタ塗りの落書きがリアルな風景画になる「NVIDIA Canvas」の実力 “美術2”の記者でも絶景は描けるか (1/2 ページ)
イラスト・デザイン
2021-06-30 17:54
ハードウェアベンダーは製品のエネルギー効率をもっと前面に押し出せ
IT関連
2024-07-12 16:31