リコーが進める独自のAIモデル開発–業務効率化や新たな価値創造を支援
今回は「リコーが進める独自のAIモデル開発–業務効率化や新たな価値創造を支援」についてご紹介します。
関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
リコーは、複合機やカメラデバイスなどのOAメーカーからデジタルサービスの会社へと変革を進めている。その取り組みの一環として、大規模言語モデル(LLM)を活用した独自のAIモデル開発を進めている。
同社は「大規模言語AIモデルを活用した顧客価値創造 ~デジタルサービスの会社への変革を目指すリコーのデジタル戦略~」と題した説明会を開催し、AI開発の道のりと同社が提供するサービスについて紹介した。
同社では1990年代からAIの開発に取り組み、深層学習(ディープラーニング)が登場した2015年ごろから画像AIを活用した外観検査AIの開発や、振動解析AIを活用した工作機械向けの振動モニタリングシステムを開発。2021年には高性能の自然言語処理(NLP)技術を用い、クラウドサービス「仕事のAI」を開発した。
仕事のAIは、企業が持つデータをNLPで分析し、業務の効率化や新たな価値の創造を支援する。例えば、コールセンターやお客さま相談窓口に集まる顧客の声(VOC)をAIを活用して迅速に分析・分類し、業務効率化や顧客満足度の向上につなげる。
同サービスはBERT世代のNLPモデルを採用していたが、商用化した当時は「BERTレベルのAIも大規模モデルと言われており、これをクラウドで提供した場合に利益を得られるのか課題だった」と、リコー デジタル戦略部 デジタル技術開発センター長の梅津良昭氏は話す。
そこで、パートナー企業であるアマゾン ウェブ サービス ジャパン(AWSジャパン)は、MLを簡単にデプロイできる「Amazon SageMaker Serverless Inference」の活用を提案。リコーは、同社のクラウド基盤「RSI」上でAmazon SageMaker Serverless Inferenceを活用して仕事のAIを構築し、低ランニングコストで高可用性を実現したという。これにより、顧客に対してAI機能を簡単でリーズナブルに提供できるようになった。
一方で「なかなかAIが普及しないという課題がある」と梅津氏は言及。この背景には、AI導入に当たっての概念実証(PoC)疲れなどが原因であると予測した。「お客さまにとって自然言語AIは未知数で、効果に対する懸念や性能が分からないことから、まずは自社のデータを使って試したいと思っている。しかし、データを当社に出す際に秘密保持契約などの障壁があり、PoCだけで3~6カ月かかってしまう場合がある」
同社は、このようなリードタイムを削減するため、「AI開発プラットフォーム」(AI開発PF)を顧客に提供できるよう準備している。AI開発PFでは、データ分析からAIモデル開発、API利用までをクラウド上でできる。大量のデータをクラスタリングツールで分析し、アノテーションを作成。そのデータを教師データにして顧客固有のカスタムモデルを作成し、顧客のシステムに組み込んで使えるという。
AI開発PFの利用方法は、分類機器の登録、学習、推論の手順で進める。例えばコールセンターで利用する場合は、クレームやヒント、ニーズ表現が含まれている分類を作成し、分類に則したデータをクラウドに登録して、単語数などのパラメーターを登録するだけで1モデル10~30分で作れるという。作成したモデルが十分な分類精度を保持している場合は、APIを用いて顧客のシステムから利用できる。また、分類精度が不十分の場合は顧客自身で分析できるツールも準備しているという。
他方、梅津氏は、BERT世代のAIモデルには「教師データの開発が必須で、アノテーション開発に時間がかかる」「単純なタスク(分類や回帰など)に落とし込むためにPoCが必要である」という課題を挙げた。この課題を解消すべく、同社が目を付けたのはGPT3だった。
2022年度から同社ではGPT3の本格的な自前開発に取り組んでいる。GPT3の活用で、より高機能で、かつプロンプトプログラムを使うことで簡単に顧客が業務フィッティングできる環境を準備した。さらに、AIを熟知していない人でも簡易にAIを活用できるようにデジタルヒューマンの開発も行っている。デジタルヒューマンの開発では、音声認識やAIモデル、音声発話、CGを組み合わせることで「AIアシスタント」を開発した。
デジタルヒューマンはさまざまなシーンで活用することを想定しているという。例えば、デジタルヒューマンを活用したデジタルサイネージでは、音声認識をして顧客と話しながら顧客の要求に則した商品を紹介できる。また、メタバース上の展示会にAIアバターとして参加することで、24時間、多言語での自動対応ができるとしている。
同社は、今後企業がGPT3レベルのAIを企業が導入することを見越し、AWSジャパンとのタッグを組み、開発を進めてきたという。
GPT3世代のモデル開発に当たっては、「当時、世界的な部品枯渇でGPUマシンが入手困難な状況にあった。また、リコーにとってはGPT3クラスの大規模AIエンジニアリングは未体験の領域だった」と振り返る。しかし、AWSの支援プログラムを活用したことで、モデル開発に必要なインスタンスを上限緩和申請によって確保できたという。AIエンジニアリングは機械学習(ML)サービス「Amazon SageMaker」による分散学習環境を構築し、「Amazon Machine Learning Solutions Lab」で実装レベルの開発をすることで、3カ月でエンジニアリングを終え、GPT3 の開発ができた。
同社が開発したGPT3の特徴を梅津氏は、「小規模だが吟味した日本語のデータを学習させたことで、日本語に強いモデルとなった。また、高速かつ良質な文生成ができる」と話す。
梅津氏は、「われわれはデジタルバディーやGPT3を企業が所有し、業務に使うことが当然の時代が到来すると思っている」とし、そこに同社がリーチするためにより高度なAIの開発に取り組みたいと話す。「今回紹介したのはGPT3だったが、GPT3に対して強化学習をすることで、3.5世代に進化し、よりリッチなサービスができるようになる。そのためには、人のフィードバックからの強化学習(RLHF)やプロンプトエンジニアリングの開発リソースを拡大したい」と展望を語る。
また、GPT.X世代のAI開発運用の環境を顧客に提供するために、AWSが提供する深層学習専用の高性能チップ「AWS Trainium」などを適用し、学習コストの削減や時間短縮を検討しているという。同氏は「さまざまなAIを企業が使いこなし、企業のDXに貢献できる商品開発をしていきたい」と述べた。