東芝デジタルソリューションズとNICTが共同研究–LLMによるRAGの品質向上へ
今回は「東芝デジタルソリューションズとNICTが共同研究–LLMによるRAGの品質向上へ」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
東芝デジタルソリューションズと情報通信研究機構(NICT)は4月1日、大規模言語モデル(LLM)を用いた検索拡張生成(RAG)の品質向上に向けた共同研究を開始した。東芝デジタルソリューションズが4月9日に発表した。
役割分担として、東芝デジタルソリューションズはNICTの言語モデル・ツールを活用した、生成AIの回答品質向上に関する研究開発を進める。またNICTは日本語を中心とした大量の学習用言語データの提供や、言語モデル・ツールの強化開発を行う。
この共同研究は、組織内に蓄積された情報を活用し、生成AIによる知識継承や業務効率化の実現を目指すもの。東芝デジタルソリューションズは、LLMのファインチューニング、RAGの回答精度向上、AIエージェント活用、工場内データ解析、ソフトウェア解析といった応用技術開発を進めている。一方、NICTは、大量の言語データを整備し、日本語に特化したLLMや検索ツールを開発してきた。同研究では、NICTの日本語特化型LLMと検索ツールを活用し、より正確で有益な情報を得るための生成AI周辺技術の高度化を図る。
この研究の背景として、多くの企業で少子高齢化による労働力不足や熟練者の後継者不足が深刻化しており、生成AI技術を活用した知識継承や業務効率化が期待されていることが挙げられる。LLMは広範な知識を持つものの、最新情報や組織内固有の情報に基づく回答は難しい。そこで、組織内の文書データベースから情報を検索し、それを基に正確な応答を生成するRAGが注目されているが、その技術はまだ発展途上であり、回答品質の向上が課題となっているという。
東芝グループは、製品・サービスの設計、製造、保守などに関する膨大なデータを保有している。同研究では、このデータを活用し、NICTの日本語特化型LLMを用いてRAGの高精度化技術を研究開発し、業務効率化や知識継承に役立つ生成AI技術の確立を目指すとしている。