Perplexity、独自モデル「Sonar」の最新版を提供–検索回答の可読性と正確性を向上

今回は「Perplexity、独自モデル「Sonar」の最新版を提供–検索回答の可読性と正確性を向上」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Perplexityは米国時間2月11日、独自モデル「Sonar」の最新版を発表した。Metaのオープンソースモデル「Llama 3.3 70B」をベースにしており、「回答の質とユーザー体験の最適化」を目指している。同社によると、検索モードでの回答の可読性と正確性を向上させるように訓練されているという。

 同社は、Sonarが「GPT-4o mini」や「Claude」よりも事実性と可読性の点で高いスコアを獲得したと主張している。同社は事実性を「検索結果に裏付けられた事実を用いて質問に回答できるモデルの能力、そして矛盾する情報や欠落した情報を解決する能力」の尺度と定義している。ただし、これを測定する外部機関のベンチマークは存在しない。

 その代わりに、Perplexityは、Sonarと「GPT-4o」「Claude 3.5 Sonnet」などの競合モデルの回答を並べたスクリーンショットを幾つか示している。筆者の考えでは、それらは率直さ、情報の完全さ、読みやすさに違いがあり、多くの場合、Sonarの整理されたフォーマット(これは主観的な好みだが)と引用の多さが好まれる。ただし、これは情報源の質ではなく、量についてのみ言及している。チャットボットが引用する情報源は、PerplexityとOpenAIがそれぞれの親会社の出版社やメディアパートナーとの契約にも影響される。

 さらに重要なのは、これらの例にはクエリー自体が含まれておらず、回答のみが表示されていることだ。また、Perplexityは回答をどのように取得したか、または回答をどのように評価したかという方法については明示しておらず、クエリーの違いや実行したクエリーの数についても明らかにしていない。「違いが分かる」かどうかの比較は個人の判断に任されている。

 米ZDNETはPerplexityにコメントを求めたところ、Perplexityは、オンラインA/Bテストの結果、ユーザーがGPT-4o mini、「Claude 3.5 Haiku」、Claude 3.5 SonnetよりもSonarに対してより高い満足度を示し、興味を持っていることが分かったと述べた。しかしながら、具体的な結果の詳細については明らかにしなかった。

 「Sonarは、GPT-4o miniやClaude 3.5 Haikuといった同クラスのモデルを大きく上回る性能を示し、さらにGPT-4oやClaude 3.5 Sonnetのような最先端モデルと同等かそれ以上のユーザー満足度を達成している」と、Perplexityは発表している。

 同社によると、Sonarは1秒当たり1200トークンの速度でクエリーに回答し、「Gemini 2.0 Flash」の10倍の速度で動作するという。テストでは、SonarがGPT-4o miniとClaude 3.5 Haikuを「大幅に」上回ったことが示されたが、同社はそのテストの詳細を明らかにしていない。同社はまた、Sonarがより高価な最先端モデルであるClaude 3.5 Sonnetを上回りつつ、「GPT-4oの性能に近づいている」と述べている。

 最新版のSonarは、「Perplexity Pro」のユーザーが利用でき、デフォルトのモデルとして設定したり、「Sonar API」を通じてアクセスしたりできる。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
JR東日本、千葉・松戸駅のエキナカにeスポーツ施設をオープン
企業・業界動向
2021-01-16 12:36
映画「ゆるキャン△」、22年全国で公開
くらテク
2021-04-02 21:58
困難な時代にこそ必要な企業情報セキュリティと脅威への備え
IT関連
2023-05-30 04:56
ダイキン工業、全社規模のRPAを約1年半で展開
IT関連
2022-06-16 14:44
日本でもSaaSが当たり前に–日本オラクルのSaaS責任者が語る顧客実態
IT関連
2022-03-31 09:54
マネージャーとリーダーの違いとは?–実は異なる2つの役割
IT関連
2022-12-15 23:37
サイバーセキュリティ担当者のバーンアウトは差し迫った課題に–組織全体に影響する恐れも
IT関連
2022-03-17 04:09
大林組、ServiceNowでグループ全体のサポートデスク環境を刷新
IT関連
2021-03-18 16:03
鹿児島大学、ローカル5Gを活用し農作業現場のDX推進に貢献
IT関連
2023-03-24 00:15
マイクロソフト、Arm版Windowsアプリ開発用の小型PCを発売
IT関連
2022-10-26 21:44
クラウド名刺管理のSansanがオフラインイベントの非接触受付を可能にする無人名刺受付システム「Smart 受付」提供
ネットサービス
2021-06-24 07:55
「GitHub Actions extension for VS Code」パブリックベータ公開。VSCodeからワークフローの実行と監視、管理が可能に
GitHub
2023-03-29 09:07
千葉県・柏に「発電ブランコ」 こいでスマホ充電
IT関連
2021-05-28 22:19
理研、IBMの次世代量子システムをスーパーコンピューター「富岳」に連携
IT関連
2024-05-03 12:47