「Claude 3 Opus」が「GPT-4」を抜き1位に–Chatbot Arenaランキングで

今回は「「Claude 3 Opus」が「GPT-4」を抜き1位に–Chatbot Arenaランキングで」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)スタートアップのAnthropicが提供する大規模言語モデル(LLM)「Claude 3 Opus」が米国時間3月26日、AIチャットボットの能力を比較できる「Chatbot Arena」のランキングで、OpenAIの「GPT-4」を抜いて、首位に輝いた。

 Chatbot Arenaは、さまざまなAIモデルの有効性をテストし、比較できるサイトだ。カリフォルニア大学バークレー校の学生と教授陣らによる、オープンな研究組織Large Model Systems Organization(LMSYS Org)が、2023年5月に立ち上げた。Claudeは今回初めて、同サイトのリーダーボード(順位表)でGPT-4モデルを2位に押しやり、トップに立った。

 Claude 3 Opusは開発者向けAPIとClaude 3ウェブサイトで利用できる。Claude 3の3つのモデルの1つで、ほかに「Sonnet」と「Haiku」がある。同社によると、Claude 3は従来の「Claude 2」「Claude 2.1」と同程度のスピードだが、その知識ははるかに高度だという。

 Chatbot Arenaはクラウドソーシングの手法を用いており、誰でも利用できる。チャットページでは、Claude、「GPT-3.5」、GPT-4のほか、Googleの「Gemini」、Metaの「Llama 2」など、32種類のAIモデルの中から、2つのモデルの回答が表示される。プロンプトを入力すると、2つの回答は「モデルA」および「モデルB」として提供され、どのAIモデルによる回答なのかは知らされない。

 ユーザーはそれぞれの回答を読んだ後に、AとBのどちらを好むか、あるいは同等だと見なすかを選択する。評価を送信して初めて、2つのAIモデルが明かされるようになっている。

 LMYSY Orgはユーザーの投票を基に、相対評価で実力を示すイロ(Elo)レーティングを用いて、LLMランキングを決定する。最新のリーダーボードでは、Claude 3 Opusが1253のスコアを獲得して首位に立ち、「GPT-4-1106-preview」がスコア1251で2位となった。

 最新ランキングで評価が高かったその他のLLMには、「GPT-4-0125-preview」、Googleの「Gemini Pro」、「Claude 3 Sonnet」「GPT-4-0314」「Claude 3 Haiku」などがある。トップ10に、Anthropicの最新のClaude 3モデルがすべてランクインしているのは、注目に値するだろう。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
Ridgelinez、生成AI活用をPoCから実運用へ進めるための2つの要素
IT関連
2024-10-04 03:42
クリックテック、「Connector Factory」を発表–企業のデータ活用を推進
IT関連
2023-03-10 04:16
「Linux」で「Guake」トップダウンターミナルを使用するには–作業効率を向上
IT関連
2023-09-01 15:59
オンラインレンタカー会社のBooking Group、「IBM Cloud」採用–価格や在庫の柔軟な調整に向け
IT関連
2021-03-23 22:59
講談社の漫画家約1000人やアシスタントなど対象のオンライン医療相談サービスをMediplatが提供開始
ヘルステック
2021-05-13 04:24
LGが「webOS」を他社にも提供へ Android TVの対抗馬となるか
ライフ
2021-02-26 09:19
ドローンのオープンソフトウェアプラットフォームが火星探査支える技術企業と提携–業界変える動力へ
IT関連
2021-05-27 04:45
品川区、戸籍専門書籍のAI検索サービスを導入–戸籍事務の業務効率化と正確性を向上
IT関連
2022-08-28 03:58
ContractS、「ContractS CLM」で「Slack」からの契約作成依頼・相談を可能に
IT関連
2024-02-07 22:56
「山奥で車のドアが開閉不能に」──トヨタの無人レンタカーでトラブル、“その場に置き去り”仕様に物議 トヨタ「案内ミスだった」
ネットトピック
2021-08-05 03:59
バイデン政権の大規模インフラ法案の「悲惨な」修正提案を暗号資産コミュニティが非難
ブロックチェーン
2021-08-10 19:25
“AI石川遼”がゴルフ場で出迎え 来場者の名前呼び掛け
ロボット・AI
2021-04-16 10:47
マッチングアプリ「Tinder」で里親募集中のペットとデート!? ドイツの動物保護団体が15匹のプロフィールを登録
パブリック / ダイバーシティ
2021-08-13 22:40
「新たな領域の開拓で日本での存在感を強めていきたい」–ペガジャパンの福島新社長
IT関連
2021-07-01 14:16