パナソニック、国内最大規模のLLMを自社用に構築へ–2024年秋に利用開始

今回は「パナソニック、国内最大規模のLLMを自社用に構築へ–2024年秋に利用開始」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 パナソニック ホールディングスは7月2日、国内最大規模となる1000億パラメーターの自社専用の大規模言語モデル(LLM)を構築すると発表した。2024年秋から利用を開始できるようにする。

 同社が構築するLLMは、ストックマークが独自開発したLLM「Stockmark-LLM-100b」をベースに、パナソニックグループの社内データを追加事前学習させたもので、同社専用の「Panasonic-LLM-100b」として構築する。今後は、パナソニックホールディングスで開発しているマルチモーダル基盤モデルへの統合を目指すほか、セキュリティ面に配慮して企業の秘匿データを高い安全性により学習する仕組みも構築する予定だという。将来的には、同LLMを製品やサービスに組み込んだ活用の可能性もあるという。

 同日記者会見したテクノロジー本部 デジタル・AI技術センター 所長の九津見洋氏は、「APIレベルの利用ではなくLLをそのまま提供してもらうことが今回の協業の肝になる。パナソニックグループとして、外部に出していない製品情報や技術情報、設計資料などを追加学習させることで、より精緻化した独自の日本語LLMを開発でき、幅広い事業領域にAIの活用を広げていくことができる」と述べた。

 また、同氏は「当社に蓄積されたシステム開発ノウハウを活用することで、Panasonic-LLM-100bの性能を劣化させずに、小型化と高速化ができる。これにより商品特化モデル、現場特化モデルも展開し、適用範囲を拡大する。機器リソースが潤沢ではないエッジ領域やオンプレミス領域でも利用できるようにする」と説明した。

 今回は、パナソニックグループが保有するデータをオープンソースモデルに追加事前学習させることで、プロンプトエンジニアリングや検索拡張生成(RAG)、ファインチューニングでは得られない多くの知識をLLMにあらかじめ学習させることができる。このため汎用モデルの学習データにはない業界専門用語への対応といった自社独自の知識、ノウハウをLLMに統合する。言語モデルの高性能化やフルカスタマイゼーションに関する技術も、社内に蓄積することにつながるとしている。

 ストックマークは、2016年に創業したスタートアップ企業で、自然言語処理技術を活用して、国内外の約3万5000サイトのビジネスニュースを分類し、事業アイデアの着想と組織内での発展を促す「Anews(エーニュース)」や、AIが組織や業務に合わせて必要な情報を構造化し示唆を得られる市場調査サービス「Astrategy(エーストラテジー)」を提供している。また、企業に特化したLLMの開発支援や個別システムの開発支援を行う「SAT」も提供する。Anewsは国内300社以上が導入しており、約7割が製造業で日経225の約3割が導入しているという。

 同社が開発したStockmark-LLM-100bは、経済産業省と新エネルギー・産業技術総合開発機構(NEDO)による「GENIAC」の採択を受けて開発したLLMで、5月には商用利用可能な形式で公開されている。同社がフルスクラッチで開発した1000億パラメーター規模のLLMとなり、独自に収集したビジネスドメインの日本語データを中心として事前学習することで、日本語やビジネス領域に特化した。ハルシネーションを大幅に抑止することで、厳密さが重視されるビジネスシーンでも信頼して利用することができるのが特徴だ。

 ストックマーク 代表取締役CEO(最高経営責任者)の林達氏は、「当社の調査では、生成AI利用者の大多数が数日に1回程度しか利用していない。ビジネスで利用されていない理由はハルシネーションがあるためになる。当社では、独自のビジネスデータを持ち、1兆トークンの学習を行い、ビジネスに特化したハルシネーションの抑制ができるようになっている。高度な質問にも豊富な知識で対応でき、時事性の高い話題にも精通しており、事実が存在しない質問に回答しない厳密性を持っている。ビジネス領域では、(OpenAIの)『GPT-4』より高い回答精度を誇る。フルスクラッチでLLMを開発できる企業は、日本では5社程度しかなく当社はそのうちの1つ」などと述べた。

 また林氏は、「Google検索ができるようなオープンデータは、データ全体の約2割で、残りの8割が企業内などに蓄積され、一般的なLLMは世の中の2割のデータしか使われていないのが現状。GPT-4も学習したデータは約1PBだ。しかし、企業内に蓄積されているデータは1社当たり5~10PBもあると言われる。パナソニックグループ全体では、さらに大きなデータ量を蓄積しているだろう。GPT-4よりも知識が多いモデルを個社で作ることは現実的で、それを作らないことは自社にとって使えないLLMを使い続けることにもなりかねない。企業特化のLLMの構築は必然のトレンドで、それをしなければ、大きな機会損失を招く」と提言した。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
「Chrome」のサードパーティークッキー廃止が2023年に延期
IT関連
2021-06-25 17:15
ノジマ、日立グループGlobalLogicのデジタルエンジニアリングを活用–DXを加速
IT関連
2022-06-14 03:16
M2搭載「MacBook Air」–薄型軽量化されたアップル製ノートを写真でチェック
IT関連
2022-08-12 20:59
インテリジェントなデータ基盤がAI開発を加速–ネットアップの戦略
IT関連
2024-04-18 05:51
Java/Scalaの最新版Webアプリケーションフレームワーク「Play Framework 3.0」正式リリース。Akkaに代わりApache Pekkoを採用
Java
2023-11-24 03:56
LINE、コロナワクチンの接種予約システムを開発 自治体に提供
ロボット・AI
2021-01-29 03:54
AIで「適材適所」人材活用を実現するEightfold AIがソフトバンク主導で約241億円調達、評価額約2298億円に
HRテック
2021-06-12 05:51
SAPジャパン、SaaS型「S/4HANA Cloud」の最新版を提供–ABAPでカスタム機能を開発可能に
IT関連
2022-10-06 20:01
Slackで使える「ソフトウェアテスト関係者くらいしか使わない絵文字」第二弾をMagicPodが公開。「9割できてます」「運用でカバー」など50種類
おもしろ
2024-03-22 00:06
Redis、クラウドベンダなどによる商用サービスを制限するライセンス変更を発表。今後はRedis社とのライセンス契約が必須に
NoSQL
2024-03-22 14:38
デジタルサイネージ広告の勝機–広告主から継続的に出稿してもらうには
IT関連
2024-06-04 14:22
IT系上場企業の平均年収を業種別にみてみた 2021年版[前編] ~ ネットベンチャー、ゲーム、メディア系
働き方
2021-07-12 00:57
DX人材をどう確保・育成するか–東京都の取り組みから探ってみた
IT関連
2022-02-18 23:13
2022年のDXと今後–テクノロジー導入戦略を決定づける主要トレンド
IT関連
2022-08-19 22:43