マスク氏のxAIが発表した新モデル「Grok 3」は期待以上–チャットボットランキングでも急上昇

今回は「マスク氏のxAIが発表した新モデル「Grok 3」は期待以上–チャットボットランキングでも急上昇」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Elon Musk氏は、2015年にOpenAIが設立された際に出資者の一人だった。しかしその後、同氏は同社との関係を完全に断ち切り、OpenAIが当初の非営利活動から逸脱したと主張している。そして現在、同氏は自身のAI企業xAIを設立し、「Grok」と呼ばれる大規模言語モデル(LLM)を開発している。そのxAIが発表した新モデル「Grok 3」は、チャットボットのリーダーボードでトップに急上昇している。

 先日、Musk氏はライブ配信を開催し、xAIの最新AIモデル群であるGrok 3を発表した。Grok 3の開発には、xAIがテネシー州メンフィスに構築した20万個のGPUを擁する独自のデータセンターを活用し、前モデル「Grok 2」と比べて10倍のトレーニングを実施した。

 「Grok 3を発表できることをとてもうれしく思う。Grok 2よりもはるかに優れた能力を持つと確信している」と、Musk氏はライブ配信で語った。

 このモデルファミリーには、Grok 3を基盤とする推論モデルも含まれている。OpenAIの「o1」や「o3」モデルなど、市場に出回っている他の推論モデルと同様に、「Grok 3 Reasoning」のベータ版は、より質の高い結果を出力するために、思考時間を長めに取る設計となっている。

 全てのGrok 3モデルは、主要なモデルとの競合を目標に開発されている。Grok 3はOpenAIの「GPT-4o」やGoogleの「Gemini」と競合し、Grok 3 Reasoningは「03-mini(high)」、o1、「Deepseek-R1」などと競合する。市場に登場してから24時間も経たないうちに、xAIの製品はベンチマークとリーダーボードを独占するほどの勢いを見せている。

 Grok 3の事前トレーニングは1月初旬に終了しており、現在もトレーニング中ではあるが、既に幾つかのAIベンチマークで主要なモデルを上回るパフォーマンスを発揮している。具体的には、数学的推論をテストする「AIME ’24」、科学(特に生物学、物理学、化学)の習熟度をテストする「GPQA」、コーディング能力をテストする「LCB Oct-Feb」などで優れた結果を出している。

 Grok 3と「Grok 3 mini」の推論モデルは現在も開発中だが、xAIがライブ配信中に共有した結果によると、両モデルのベータ版は、AIME、GPQA、LCBの分野において、03-mini(high)、o1、DeepSeek-R1、「Gemini-2 Flash Thinking」と比較しても遜色ないパフォーマンスを示している。

 技術ベンチマーク以外でも、Grok 3はChatbot Arenaのランキングでも急上昇した。Chatbot Arenaは、ユーザーが2つのLLMと並行してチャットを行い、モデル名を知らなくてもそれぞれの応答を比較することでLLMを評価するプラットフォームである。

 Grok 3の公式リリースに先立ち、初期バージョンのモデルが「chocolate」という名前でChatbot Arenaで実行され、Gemini、GPT-4o、DeepSeek-R1などと比較して全てのカテゴリーで1位を獲得した。また、Chatbot Arenaで1400点以上のスコアを記録した最初のモデルとなった。

 エージェント機能への需要に応えるため、xAIはOpenAIやGoogleのディープリサーチ機能と同様の「DeepSearch」も立ち上げた。DeepSearchでは、ユーザーが質問をすると、Grokがそれを分析し、ウェブを検索し、思考のプロセスを随時アウトプットしながら、必要に応じてデータや表とともに最終的な回答を生成する。つまり、あるトピックの調査を依頼し、10分後に戻ってくると、その作業は完了しているというイメージだ。

 特筆すべきは「Grokの思考を読み取る」ことができ、最終的な回答にたどり着くまでの過程を理解できることである。これにより、Grokの操縦性が向上し、結果をより深く理解できるようになる。

 一部のGrokモデルがベータ版として利用可能になっている。Grok 3は有料プランの「X Premium+」で利用でき、最新機能や利用制限の増加、DeepSearchへのアクセス、「Think」または「Big Brain」オプションをクリックして高度な推論モードを利用できる。

 TechCrunchが指摘するように、X Premium+のサブスクリプション料金は発表当時の22ドルから値上がりして月額40ドルとなった。

 xAIはまた、最も先進的な機能にいち早くアクセスしたいヘビーユーザー向けに、「ChatGPT Pro」と似た新しいサブスクリプションプラン「SuperGrok」を発表した。同プランの料金はまだ発表されていないが、ChatGPT Proが月額200ドルであることから、かなりの金額になることが予想される。

 最も洗練されたバージョンについて、Musk氏はユーザーに1週間待つよう勧めている。それまでには、新しい音声統合機能が展開できる状態になっている見込みだという。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
オラクルとSAP、ロシアでの事業停止を発表–ウクライナの要請を受け
IT関連
2022-03-05 11:23
中国が世界の"オペレーティングシステム"の主導権を握る恐れ–英GCHQ長官
IT関連
2021-04-29 12:10
JPCERT/CC、インシデント被害組織や1次対応組織の相談窓口を開設
IT関連
2024-03-23 18:57
レッドハット、「Red Hat Device Edge」の利用シーン拡大–JR東海情報システムが先行導入
IT関連
2023-11-17 16:34
農業機械大手ジョンディアが自動運転トラクター開発Bear Flag Roboticsを約276億円で買収、労働力不足解決を目指す
ロボティクス
2021-08-10 14:33
AI言語モデルは今–精度の進化、倫理、管理のあり方
IT関連
2022-05-13 20:06
マイクロストラテジー、「MicroStrategy Autoボット」を発表–社内全体でのデータ活用を支援
IT関連
2024-06-19 02:00
グーグル、医療支援アルゴリズムを開発へ–米大手病院チェーンと提携
IT関連
2021-05-27 06:47
Splunk、「Observability Cloud」発表–オブザーバビリティーとは何か?
IT関連
2021-05-17 05:45
「心地よく揺れる」在宅ワーク用チェア、コクヨが発売 ダイニングテーブルにも合う
くらテク
2021-03-04 04:19
Dropbox、AI搭載型ユニバーサル検索ツール「Dropbox Dash」のベータ版を公開
IT関連
2023-06-27 17:39
Twitter、有料サービス立ち上げに向け広告非表示ツールのScrollを買収
企業・業界動向
2021-05-06 05:01
約8割の雇用主がAI人材育成プログラムへの知識不足を実感–AWS、AIスキル意識調査
IT関連
2024-06-21 02:17
オラクルがOracle Autonomous Data Warehouseを強化。SQLを知らないビジネスユーザーでもデータ分析を容易にする自動化とUIなど追加
BI
2021-03-19 04:29