NTT、独自LLM「tsuzumi」を商用化–図表や視覚読解でAI活用の拡大に期待

今回は「NTT、独自LLM「tsuzumi」を商用化–図表や視覚読解でAI活用の拡大に期待」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 NTTは11月1日、NTT版の大規模言語モデル(LLM)「tsuzumi」の商用開始に向け、報道機関に対して説明会を開いた。tsuzumiは、NTTグループ発の商用サービスとして2024年3月に提供を開始するという。

 説明会に登壇した代表取締役社長の島田明氏は、tsuzumiについて「当社の40年以上の自然言語処理(NLP)技術研究のノウハウを結集した」と、満を持してのデビューだと明かした。

 tsuzumiは「軽量」「言語性能が高い」「柔軟なカスタマイズ」「マルチモーダル」――の特徴を持つ。執行役員 研究企画部門長の木下真吾氏は、昨今LLMの大規模化により、学習に要するエネルギーやチューニングにかかるコストが膨大であることから、サステナビリティーの問題および企業が学習環境を準備するための経済的な負担があると指摘。

 また島田氏も「当社としてサステナビリティーを追求していく必要があると思っている。『IOWN APN』を利用していかに電力消費を落としていくのか、といった社会的な課題を解決することが重要だと感じている。tsuzumiは、まさにその社会課題を解決していくような位置づけで提供したい」と述べた。

 このような課題を踏まえて、tsuzumiは「専門知識を持った小さなLLM」を目指し、「言語学習データの質と量を向上させる」アプローチをとるという。そのため、今回は超軽量の「超小型版 tsuzumi」と軽量の「小型版 tsuzumi」の2種類を開発した。パラメーターサイズはそれぞれ6億(0.6B)と70億(7B)で、米OpenAIの「GPT-3」の1750億パラメーターに比べ、超小型版では約300分の1、小型版では25分の1に軽量した。なお、「中型版tsuzumi」は2024年4月以降の提供を予定している。

 またGPUクラウドの利用料金に換算すると、GPT-3規模のLLMと比べて、学習コストは超小型版で約300分の1、小型版で約25分の1。推論コストに関しては超小型版で約70分の1、小型版で約20分の1に低減できるとしている。

 言語性能の高さでは、NTTは40年以上の自然言語処理(NLU)研究により、特に日本語が得意なLLMを開発した。生成AI向けのベンチマークである「Rakuda」では、「GPT-3.5」や国産トップのLLM群を上回るという。他方、英語でも世界トップクラスと同程度の性能を実現し、多言語にも今後対応していくとしている。

 柔軟なカスタマイズの観点では、「プロンプトエンジニアリング」「フルファインチューニング」「アダプタチューニング」――の3つのチューニング方法を提供し、精度やコストなど要件の違いに柔軟に応える。

 プロンプトエンジニアリングは、入力文書に業界/組織情報を付加することでカスタマイズする。フルファインチューニングでは、基盤モデルに業界/組織のデータを学習させることで、パラメーターを全体的に変える。この方法は精度が高い分、コストがかかってしまうという。一方、アダプタチューニングでは、基盤モデルはそのままに業界/組織データを追加することで、精度とコストを両立しながら業界や組織ごとのカスタマイズができる。

 さらに今回は、基盤モデルを複数のアダプターで共有し、利用ユーザーやシーンに応じてアダプターを切り替えられるマルチアダプターを搭載。複数のアダプターを使うことで、柔軟にカスタマイズできるだけでなく、基盤モデルを一つで集約できるため、コストメリットが高くなるという。

 マルチモーダルでは、tsuzumiに言語だけでなく視覚情報を追加した。言語による質問だけでなく、文書画像を提示しながらの質問ができるという。これにより、請求書や仕様書など、画像付き文書を用いる業務やRPA業務にも適用できるとしている。

 ほかにも、聴覚情報を追加することで、例えば電話相談を受ける際に質問者の声のトーンで様子をうかがい、それに踏まえた感情のある優しい声で回答することができる。また、ユーザー状況を理解するアダプターを追加することで、質問者の状況を踏まえた回答ができるという。例えば「近くの駐車場はどこ?」といった質問をした際に、自動車のGPS情報から場所を特定し、近くの駐車場の状況や時間帯によって臨機応変な回答をする。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
freee、「freee請求書」を提供開始–インボイス制度に対応した請求書の作成を無料で可能に
IT関連
2022-12-15 23:03
全米で失業保険用に導入された顔認識システムが申請を次々拒否、本人確認できず数カ月受給できない人も
パブリック / ダイバーシティ
2021-06-22 11:33
「IBM i」モダナイゼーション失敗あるある–コンバージョンしようとして…
IT関連
2021-06-13 15:19
リモートワークで変わった働き方–本質を見失わない向き合い方を考えるべき
IT関連
2022-04-22 06:58
ビジネス書の要約サービスflierが2億円調達、法人向けSaaS強化と2022年の累計会員数120万人目指す
EdTech
2021-01-19 16:15
基幹人財育成+共創型ラボでDXを実践–サッポロホールディングス(後編)
IT関連
2024-03-20 01:02
AIがDevOpsに与える影響はいまだ不明確–Google Cloud調査
IT関連
2023-10-24 21:00
フリーランスITエンジニアの案件数が多い言語、1位Java、2位JavaScript、3位PHPなど。Go言語は人材不足。レバテックフリーランス調べ
プログラミング言語
2023-02-17 17:30
Sakeistが日本酒定期便「Sakeist Box」をリニューアル、5つ星ホテルのシェフ・ソムリエによるオンラインセミナー付き
フードテック
2021-08-17 03:53
電子文書の利用を推進する諸制度の動きとテクノロジー–後編
IT関連
2021-01-25 14:11
NVIDIA、「Hopper」採用のハイエンドGPU「H100」などを発表
IT関連
2022-03-24 08:00
クアルトリクス、今後5年間で日本に1億ドル超投資–ローカライズなど推進
IT関連
2024-07-26 00:14
ブロードコム、ヴイエムウェア新社長に山内光氏を任命
IT関連
2024-06-15 13:49
マイクロソフトの「Edge」、スリーピングタブ機能で高速化
IT関連
2021-05-26 12:11