「Claude 3 Opus」が「GPT-4」を抜き1位に–Chatbot Arenaランキングで

今回は「「Claude 3 Opus」が「GPT-4」を抜き1位に–Chatbot Arenaランキングで」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)スタートアップのAnthropicが提供する大規模言語モデル(LLM)「Claude 3 Opus」が米国時間3月26日、AIチャットボットの能力を比較できる「Chatbot Arena」のランキングで、OpenAIの「GPT-4」を抜いて、首位に輝いた。

 Chatbot Arenaは、さまざまなAIモデルの有効性をテストし、比較できるサイトだ。カリフォルニア大学バークレー校の学生と教授陣らによる、オープンな研究組織Large Model Systems Organization(LMSYS Org)が、2023年5月に立ち上げた。Claudeは今回初めて、同サイトのリーダーボード(順位表)でGPT-4モデルを2位に押しやり、トップに立った。

 Claude 3 Opusは開発者向けAPIとClaude 3ウェブサイトで利用できる。Claude 3の3つのモデルの1つで、ほかに「Sonnet」と「Haiku」がある。同社によると、Claude 3は従来の「Claude 2」「Claude 2.1」と同程度のスピードだが、その知識ははるかに高度だという。

 Chatbot Arenaはクラウドソーシングの手法を用いており、誰でも利用できる。チャットページでは、Claude、「GPT-3.5」、GPT-4のほか、Googleの「Gemini」、Metaの「Llama 2」など、32種類のAIモデルの中から、2つのモデルの回答が表示される。プロンプトを入力すると、2つの回答は「モデルA」および「モデルB」として提供され、どのAIモデルによる回答なのかは知らされない。

 ユーザーはそれぞれの回答を読んだ後に、AとBのどちらを好むか、あるいは同等だと見なすかを選択する。評価を送信して初めて、2つのAIモデルが明かされるようになっている。

 LMYSY Orgはユーザーの投票を基に、相対評価で実力を示すイロ(Elo)レーティングを用いて、LLMランキングを決定する。最新のリーダーボードでは、Claude 3 Opusが1253のスコアを獲得して首位に立ち、「GPT-4-1106-preview」がスコア1251で2位となった。

 最新ランキングで評価が高かったその他のLLMには、「GPT-4-0125-preview」、Googleの「Gemini Pro」、「Claude 3 Sonnet」「GPT-4-0314」「Claude 3 Haiku」などがある。トップ10に、Anthropicの最新のClaude 3モデルがすべてランクインしているのは、注目に値するだろう。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ネットから取得した「Office」ファイル、VBAマクロをデフォルトでブロックへ
IT関連
2022-02-09 07:16
登大遊氏、日本は「超正統派」のICT人材を育成すべき。そのために、自由な試行錯誤を許容するインチキネットワークの普及に取り組む(中編)。JaSST'22 Tokyo
働き方 / 給与 / 学び
2022-03-17 21:39
amplified ai、特許文献を基にした推論や提案を行う機能を提供
IT関連
2023-07-06 22:37
東武鉄道と日立製作所、生体認証用いたデジタルIDの共通基盤を構築へ
IT関連
2023-08-31 18:49
小泉今日子が音声配信サービスに挑戦 「心の扉をノックしたい」 
IT関連
2021-04-20 20:05
「SparkyLinux」–時代遅れのマシンを延命できる高速なLinuxディストロ
IT関連
2024-02-28 03:43
Instagram、悪い大人から若者を守る複数の新機能 「保護者のためのガイド」も
アプリ・Web
2021-03-18 05:53
霞が関でFAX廃止へ 河野大臣「テレワークの阻害要因」
DX
2021-04-15 06:20
組織ごとのセキュリティ対策では困難な時代に–トレンドマイクロが総括
IT関連
2024-01-11 23:59
星野リゾート、クラウド型のCRM/BIツールを導入–来館予約のキャンセルを半減
IT関連
2021-03-27 05:20
ジョルダン、地域活性化プラットフォームを構築–街のにぎわい創出図る
IT関連
2022-06-19 14:54
キンドリルジャパン新社長が語った「キンドリルの魅力」とは
IT関連
2024-04-19 11:13
ノッチ縮小が期待のiPhone 13、製造台数は最大2割増し? ワクチン接種開始で需要増見込む
IT関連
2021-07-16 13:43
ロシア、YouTubeに「反ロシア」広告を止めるよう警告
IT関連
2022-03-20 18:48