Allganize、日本語RAGの性能評価「Allganize RAG Leaderboard」を公開

今回は「Allganize、日本語RAGの性能評価「Allganize RAG Leaderboard」を公開」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成AI・大規模言語モデル(LLM)ソリューションを提供するAllganize Japanは、日本語RAGの性能を評価したLeaderboard(性能表)「Allganize RAG Leaderboard」を公開した。このLeaderboardは、AIに特化したプラットフォームである「Hugging Face」で閲覧できる。

 検索拡張生成(RAG)は、社内ドキュメントや特定情報から信頼できるデータを検索・抽出し、そのデータに基づいてLLMに回答させる技術。企業の内部情報や特定情報を生成AI・LLMで活用する際に重要となる技術であり、業務効率化や生産性向上に貢献するが、RAGの実装方法によって回答精度が大きく変わるため課題となっている。

 Allganize RAG Leaderboardは、主要なRAGソリューションの日本語性能を客観的な手法で評価した性能表。特に、日本企業が扱うドキュメントは図表などを多数含む複雑な文書が多く、業種ドメインごとにドキュメント形態や内容も異なるため、回答の難易度が高い傾向にあるという。

 Leaderboardでは、RAGソリューションの「Parser」「Retriever」「Generation」という3つの機能要素を評価している。Parserは、文書から文字・図・表などを抽出し、読みやすいフォーマットに変更する。Retrieverは、企業が保有する膨大なデータの中から、ユーザーの質問の回答となる情報を抽出する。Generationは、Retrieverで抽出した情報と学習データに基づいてLLMが回答を生成する。

 また業種によってドキュメントの傾向が異なるため、「金融」「情報通信」「製造」「公共」「流通・小売」という5つの業種ドメインのドキュメントに対して、RAGの性能を評価している。各ドメインに12〜14のドキュメントを用意し、ドメインごとに60個の質問を行った。さらに実際の業務で利用するドキュメントと同様、図表を含むドキュメントを使用して評価したという。

 さらに、あらかじめ質問に対する正解回答を用意し、質問に対してRAGソリューションで生成した回答について、4つのLLM Eval(測定ツール)を用いて評価した。

 なお、今回評価対象としたRAGソリューションは、Allganizeの提供するRAGソリューション「Alli」のほか、「LangChain」「OpenAI Assistant」「Cohere」で、今後も評価対象を追加予定だという。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
米Microsoft、Azureを展開する全世界のリージョンで「アベイラビリティゾーン」を提供 2021年中に
クラウドユーザー
2021-03-29 09:45
楽天、データ分析基盤の刷新でグーグル・クラウドを採用
IT関連
2022-04-21 11:53
中央省庁の情報漏えい件数、「このままなら21年は過去2番目の被害規模」 テレワーク推進が背景か
企業・業界動向
2021-07-09 19:10
ゲームの祭典「E3 2021」は6月12〜15日にオンラインで無料開催へ
企業・業界動向
2021-04-08 03:53
クラウド運用担当者の失敗話や苦労話、学びを共有し、技術の底力を高めよう。「Cloud Operator Days Tokyo 2022」が開幕[PR]
PR
2022-06-13 07:58
サムスンがエントリーモデルの完全ワイヤレス「Galaxy Buds 2」にアクティブノイズキャン搭載
ハードウェア
2021-08-13 16:39
MacBook AirにLightningイヤフォンをつなげられるハブ 「Anker PowerExpand Direct 8-in-2 USB-C PD メディア ハブ」を使ってみた
IT関連
2021-08-11 05:28
豊田通商やIIJら、ウズベキスタン国営の通信事業者から「通信インフラ発展プロジェクト」受注
IT関連
2023-01-29 16:22
GMがシボレー・ボルトEVに3度目のリコール、欠陥バッテリーから火災のおそれ
IT関連
2021-08-22 22:44
デル、最新型ミッションクリティカルストレージを発表
IT関連
2023-10-27 11:10
ルームクリップ、SaaS型製品データ基盤を導入–ECサイトの商品情報をAIで自動取得
IT関連
2022-07-29 23:05
「Trello」でプロジェクトプランニングを簡素化する方法
IT関連
2024-09-03 15:53
アバナード、第一三共グループの自社生成AIシステム「DS-GAI」の開発・導入を支援
IT関連
2024-04-11 04:20
新たな画像誘導手術システムを開発するZeta Surgicalがステルス状態から脱して約6億円調達
IT関連
2022-03-13 15:35