「Claude 3 Opus」が「GPT-4」を抜き1位に–Chatbot Arenaランキングで

今回は「「Claude 3 Opus」が「GPT-4」を抜き1位に–Chatbot Arenaランキングで」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)スタートアップのAnthropicが提供する大規模言語モデル(LLM)「Claude 3 Opus」が米国時間3月26日、AIチャットボットの能力を比較できる「Chatbot Arena」のランキングで、OpenAIの「GPT-4」を抜いて、首位に輝いた。

 Chatbot Arenaは、さまざまなAIモデルの有効性をテストし、比較できるサイトだ。カリフォルニア大学バークレー校の学生と教授陣らによる、オープンな研究組織Large Model Systems Organization(LMSYS Org)が、2023年5月に立ち上げた。Claudeは今回初めて、同サイトのリーダーボード(順位表)でGPT-4モデルを2位に押しやり、トップに立った。

 Claude 3 Opusは開発者向けAPIとClaude 3ウェブサイトで利用できる。Claude 3の3つのモデルの1つで、ほかに「Sonnet」と「Haiku」がある。同社によると、Claude 3は従来の「Claude 2」「Claude 2.1」と同程度のスピードだが、その知識ははるかに高度だという。

 Chatbot Arenaはクラウドソーシングの手法を用いており、誰でも利用できる。チャットページでは、Claude、「GPT-3.5」、GPT-4のほか、Googleの「Gemini」、Metaの「Llama 2」など、32種類のAIモデルの中から、2つのモデルの回答が表示される。プロンプトを入力すると、2つの回答は「モデルA」および「モデルB」として提供され、どのAIモデルによる回答なのかは知らされない。

 ユーザーはそれぞれの回答を読んだ後に、AとBのどちらを好むか、あるいは同等だと見なすかを選択する。評価を送信して初めて、2つのAIモデルが明かされるようになっている。

 LMYSY Orgはユーザーの投票を基に、相対評価で実力を示すイロ(Elo)レーティングを用いて、LLMランキングを決定する。最新のリーダーボードでは、Claude 3 Opusが1253のスコアを獲得して首位に立ち、「GPT-4-1106-preview」がスコア1251で2位となった。

 最新ランキングで評価が高かったその他のLLMには、「GPT-4-0125-preview」、Googleの「Gemini Pro」、「Claude 3 Sonnet」「GPT-4-0314」「Claude 3 Haiku」などがある。トップ10に、Anthropicの最新のClaude 3モデルがすべてランクインしているのは、注目に値するだろう。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
はんこ産地、山梨県も電子申請を推進 「押印の省略はオンライン化と無関係」
IT関連
2021-03-16 05:49
技術者がいなくても文書処理をAI化できるノーコードプラットフォームのLang.aiがシードで2.1億円調達
人工知能・AI
2021-02-12 09:53
ジュニパーネットワークス、HPEによる買収合意を正式発表、約2兆円で
HPE
2024-01-11 17:03
バイデン政権、重要インフラのサイバーセキュリティ強化に向け対策求める
IT関連
2021-07-30 19:39
Salesforce、簡単に導入できて安価な「Salesforce Easy」発表。セールス、サービス、マーケティング、コマースなどオールインワン
SaaS
2022-08-24 13:39
わずか8分でストレスを軽減できるTrippのサイケデリックVR瞑想アプリ
VR / AR / MR
2021-06-27 08:37
Razer、N95マスク「Project Hazel」プロジェクト発表(もちろん光る)
製品動向
2021-01-14 16:24
AmazonのCEO、生成AIがクラウド以来の最大の技術革新になる可能性を指摘
IT関連
2024-04-13 13:24
次世代いす型モビリティを手がけるLIFEHUBが1億円調達、進行方向を向いたままエスカレーターを利用可能など目指す
IT関連
2022-03-05 09:28
サーバーワークス、新会社設立でGoogle Cloud事業に参入
IT関連
2021-08-18 13:20
IBMとSAP、消費財・小売業界向けAIソリューションの開発に着手
IT関連
2024-01-21 23:48
出社率低下も、76.3%の企業でインターネットトラフィックが増加–IDC
IT関連
2022-05-11 02:15
東京大学に量子ネイティブ人材を育成する「量子ソフトウェア」寄付講座が開設、2021年6月1日~2024年5月31日の3年間
EdTech
2021-05-26 22:01
「macOS」で使える音楽プレーヤー4選
IT関連
2024-04-07 01:08