マスク氏のxAIが発表した新モデル「Grok 3」は期待以上–チャットボットランキングでも急上昇

今回は「マスク氏のxAIが発表した新モデル「Grok 3」は期待以上–チャットボットランキングでも急上昇」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Elon Musk氏は、2015年にOpenAIが設立された際に出資者の一人だった。しかしその後、同氏は同社との関係を完全に断ち切り、OpenAIが当初の非営利活動から逸脱したと主張している。そして現在、同氏は自身のAI企業xAIを設立し、「Grok」と呼ばれる大規模言語モデル(LLM)を開発している。そのxAIが発表した新モデル「Grok 3」は、チャットボットのリーダーボードでトップに急上昇している。

 先日、Musk氏はライブ配信を開催し、xAIの最新AIモデル群であるGrok 3を発表した。Grok 3の開発には、xAIがテネシー州メンフィスに構築した20万個のGPUを擁する独自のデータセンターを活用し、前モデル「Grok 2」と比べて10倍のトレーニングを実施した。

 「Grok 3を発表できることをとてもうれしく思う。Grok 2よりもはるかに優れた能力を持つと確信している」と、Musk氏はライブ配信で語った。

 このモデルファミリーには、Grok 3を基盤とする推論モデルも含まれている。OpenAIの「o1」や「o3」モデルなど、市場に出回っている他の推論モデルと同様に、「Grok 3 Reasoning」のベータ版は、より質の高い結果を出力するために、思考時間を長めに取る設計となっている。

 全てのGrok 3モデルは、主要なモデルとの競合を目標に開発されている。Grok 3はOpenAIの「GPT-4o」やGoogleの「Gemini」と競合し、Grok 3 Reasoningは「03-mini(high)」、o1、「Deepseek-R1」などと競合する。市場に登場してから24時間も経たないうちに、xAIの製品はベンチマークとリーダーボードを独占するほどの勢いを見せている。

 Grok 3の事前トレーニングは1月初旬に終了しており、現在もトレーニング中ではあるが、既に幾つかのAIベンチマークで主要なモデルを上回るパフォーマンスを発揮している。具体的には、数学的推論をテストする「AIME ’24」、科学(特に生物学、物理学、化学)の習熟度をテストする「GPQA」、コーディング能力をテストする「LCB Oct-Feb」などで優れた結果を出している。

 Grok 3と「Grok 3 mini」の推論モデルは現在も開発中だが、xAIがライブ配信中に共有した結果によると、両モデルのベータ版は、AIME、GPQA、LCBの分野において、03-mini(high)、o1、DeepSeek-R1、「Gemini-2 Flash Thinking」と比較しても遜色ないパフォーマンスを示している。

 技術ベンチマーク以外でも、Grok 3はChatbot Arenaのランキングでも急上昇した。Chatbot Arenaは、ユーザーが2つのLLMと並行してチャットを行い、モデル名を知らなくてもそれぞれの応答を比較することでLLMを評価するプラットフォームである。

 Grok 3の公式リリースに先立ち、初期バージョンのモデルが「chocolate」という名前でChatbot Arenaで実行され、Gemini、GPT-4o、DeepSeek-R1などと比較して全てのカテゴリーで1位を獲得した。また、Chatbot Arenaで1400点以上のスコアを記録した最初のモデルとなった。

 エージェント機能への需要に応えるため、xAIはOpenAIやGoogleのディープリサーチ機能と同様の「DeepSearch」も立ち上げた。DeepSearchでは、ユーザーが質問をすると、Grokがそれを分析し、ウェブを検索し、思考のプロセスを随時アウトプットしながら、必要に応じてデータや表とともに最終的な回答を生成する。つまり、あるトピックの調査を依頼し、10分後に戻ってくると、その作業は完了しているというイメージだ。

 特筆すべきは「Grokの思考を読み取る」ことができ、最終的な回答にたどり着くまでの過程を理解できることである。これにより、Grokの操縦性が向上し、結果をより深く理解できるようになる。

 一部のGrokモデルがベータ版として利用可能になっている。Grok 3は有料プランの「X Premium+」で利用でき、最新機能や利用制限の増加、DeepSearchへのアクセス、「Think」または「Big Brain」オプションをクリックして高度な推論モードを利用できる。

 TechCrunchが指摘するように、X Premium+のサブスクリプション料金は発表当時の22ドルから値上がりして月額40ドルとなった。

 xAIはまた、最も先進的な機能にいち早くアクセスしたいヘビーユーザー向けに、「ChatGPT Pro」と似た新しいサブスクリプションプラン「SuperGrok」を発表した。同プランの料金はまだ発表されていないが、ChatGPT Proが月額200ドルであることから、かなりの金額になることが予想される。

 最も洗練されたバージョンについて、Musk氏はユーザーに1週間待つよう勧めている。それまでには、新しい音声統合機能が展開できる状態になっている見込みだという。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ウエルシア薬局、新規出店時の売上予測精度向上に向けてAIサービス導入へ
IT関連
2025-02-18 16:54
ポケモンGOで「ポカブ」大量発生 3日午前11時から 色違い新規実装に捕獲時のすな3倍
くらテク
2021-07-03 09:05
ServiceNowはエンタープライズソフトウェア市場で「先頭集団」に食い込めるか
IT関連
2023-10-13 12:03
バーナーズ・リー氏のソースコード、NFTとして競売に
IT関連
2021-06-16 07:40
米債務危機の悪夢再び?–夏秋の「株安アノマリー」は投資の好機か
IT関連
2021-07-30 11:53
現状のままだと負担増–freee新サービスに見る「インボイス制度」対応の複雑さ
IT関連
2022-08-26 05:40
雑誌「DIME」付録に「LEDリングライト」 ビデオ会議や動画配信で顔を明るく
くらテク
2021-07-16 17:58
Snyk、AI型アプリケーションセキュリティ管理の「AppRisk Pro」を発表
IT関連
2024-05-03 01:49
Denoが大幅な方針変更を発表。3カ月以内にnpmパッケージへの対応を実現、最速のJavaScriptランタイムを目指しHTTPサーバを刷新
Deno
2022-08-18 11:50
AI戦略の推進には強固なデータ基盤が不可欠–Snowflake米国幹部が強調
IT関連
2024-03-22 11:42
ワークデイ、従業員エンゲージメント向上を支援する新プラットフォームを国内提供
IT関連
2023-06-27 17:51
[速報]Google、再生可能エネルギー活用のためデータセンター間で動的にタスクを移動できるようにしたと発表。Google I/O 2021
Google
2021-05-19 17:30
BIからAIベンダーになったクリックCEOが強調した「強み」とは
IT関連
2024-11-23 08:50
あいおいニッセイ同和損保、横断型DX組織を設立–照会応答業務の自立的な問題解決を促進
IT関連
2023-01-19 05:45