NTT、独自LLM「tsuzumi」を商用化–図表や視覚読解でAI活用の拡大に期待

今回は「NTT、独自LLM「tsuzumi」を商用化–図表や視覚読解でAI活用の拡大に期待」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 NTTは11月1日、NTT版の大規模言語モデル(LLM)「tsuzumi」の商用開始に向け、報道機関に対して説明会を開いた。tsuzumiは、NTTグループ発の商用サービスとして2024年3月に提供を開始するという。

 説明会に登壇した代表取締役社長の島田明氏は、tsuzumiについて「当社の40年以上の自然言語処理(NLP)技術研究のノウハウを結集した」と、満を持してのデビューだと明かした。

 tsuzumiは「軽量」「言語性能が高い」「柔軟なカスタマイズ」「マルチモーダル」――の特徴を持つ。執行役員 研究企画部門長の木下真吾氏は、昨今LLMの大規模化により、学習に要するエネルギーやチューニングにかかるコストが膨大であることから、サステナビリティーの問題および企業が学習環境を準備するための経済的な負担があると指摘。

 また島田氏も「当社としてサステナビリティーを追求していく必要があると思っている。『IOWN APN』を利用していかに電力消費を落としていくのか、といった社会的な課題を解決することが重要だと感じている。tsuzumiは、まさにその社会課題を解決していくような位置づけで提供したい」と述べた。

 このような課題を踏まえて、tsuzumiは「専門知識を持った小さなLLM」を目指し、「言語学習データの質と量を向上させる」アプローチをとるという。そのため、今回は超軽量の「超小型版 tsuzumi」と軽量の「小型版 tsuzumi」の2種類を開発した。パラメーターサイズはそれぞれ6億(0.6B)と70億(7B)で、米OpenAIの「GPT-3」の1750億パラメーターに比べ、超小型版では約300分の1、小型版では25分の1に軽量した。なお、「中型版tsuzumi」は2024年4月以降の提供を予定している。

 またGPUクラウドの利用料金に換算すると、GPT-3規模のLLMと比べて、学習コストは超小型版で約300分の1、小型版で約25分の1。推論コストに関しては超小型版で約70分の1、小型版で約20分の1に低減できるとしている。

 言語性能の高さでは、NTTは40年以上の自然言語処理(NLU)研究により、特に日本語が得意なLLMを開発した。生成AI向けのベンチマークである「Rakuda」では、「GPT-3.5」や国産トップのLLM群を上回るという。他方、英語でも世界トップクラスと同程度の性能を実現し、多言語にも今後対応していくとしている。

 柔軟なカスタマイズの観点では、「プロンプトエンジニアリング」「フルファインチューニング」「アダプタチューニング」――の3つのチューニング方法を提供し、精度やコストなど要件の違いに柔軟に応える。

 プロンプトエンジニアリングは、入力文書に業界/組織情報を付加することでカスタマイズする。フルファインチューニングでは、基盤モデルに業界/組織のデータを学習させることで、パラメーターを全体的に変える。この方法は精度が高い分、コストがかかってしまうという。一方、アダプタチューニングでは、基盤モデルはそのままに業界/組織データを追加することで、精度とコストを両立しながら業界や組織ごとのカスタマイズができる。

 さらに今回は、基盤モデルを複数のアダプターで共有し、利用ユーザーやシーンに応じてアダプターを切り替えられるマルチアダプターを搭載。複数のアダプターを使うことで、柔軟にカスタマイズできるだけでなく、基盤モデルを一つで集約できるため、コストメリットが高くなるという。

 マルチモーダルでは、tsuzumiに言語だけでなく視覚情報を追加した。言語による質問だけでなく、文書画像を提示しながらの質問ができるという。これにより、請求書や仕様書など、画像付き文書を用いる業務やRPA業務にも適用できるとしている。

 ほかにも、聴覚情報を追加することで、例えば電話相談を受ける際に質問者の声のトーンで様子をうかがい、それに踏まえた感情のある優しい声で回答することができる。また、ユーザー状況を理解するアダプターを追加することで、質問者の状況を踏まえた回答ができるという。例えば「近くの駐車場はどこ?」といった質問をした際に、自動車のGPS情報から場所を特定し、近くの駐車場の状況や時間帯によって臨機応変な回答をする。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
3億人の仕事を奪うかもしれないAIの興隆、巨大IT企業も対応進める
IT関連
2023-06-01 01:32
「Mabox Linux」–懐かしさと効率の高さが同居するディストリビューション
IT関連
2024-01-11 00:41
事業者がクライアントとパートナーを結びつけるB2B向けバーチャル会議プラットフォームのInEventが約2億円調達
ネットサービス
2021-02-10 19:48
クラウドビジネスが変わる–ヴイエムウェアCTOが語る「非中央集権化」
IT関連
2022-09-15 04:10
「github」のスペルが間違っていることを伝える「guthib.com」というサイトがある :明日から使えるITトリビア
企業・業界動向
2021-07-08 07:08
NVIDIA、4608基のH100GPUを搭載したデータセンター規模の独自開発AIスーパーコンピュータ「Eos」を披露
GPU
2024-02-21 01:23
家賃やローンの支払いでもポイントがもらえる報酬プログラム「Bilt Rewards」
フィンテック
2021-06-24 18:57
卑弥呼の居館をARで再現 山田寺の伽藍も 奈良・桜井市が制作へ
IT関連
2021-03-06 19:49
LegalOn Technologies、「LegalForce」の「Copilot for Microsoft 365」向けプラグインを年内に
IT関連
2024-02-28 01:14
KDDIら、光海底ケーブルをマルチコアで大容量化–2020年代半ばの実用化へ
IT関連
2022-03-30 08:00
Red Hat、自然言語からAnsible Playbookコードを生成する「Ansible Lightspeed」発表。IBM WatsonのAIを利用
Ansible
2023-06-01 08:34
KDDIがバーチャル人間「coh」発表、5Gの超低遅延技術を活用したリアルタイムクラウドレンダリング採用
VR / AR / MR
2021-03-12 21:09
国内企業のDevOps実践率は59.3%に上昇–IDC調査
IT関連
2023-01-12 00:32
「人間よりAIの財務管理を信頼」、日本では9割超 オラクル調べ
ロボット・AI
2021-02-16 19:13