データ活用における生成AIとクラウド–2024年のトレンドを読む(前編)

今回は「データ活用における生成AIとクラウド–2024年のトレンドを読む(前編)」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成AIは、Gartnerが2023年に発表した先進テクノロジーのハイプサイクルにおいて、「過度な期待」のピーク期に近づいていると考えられています。

 生成AIのメリットは魅力的かつ広範囲にわたるため、アナリストらは生成AIがあらゆる主要産業や業務部門に影響を及ぼすであろうと見込んでいます。McKinsey&Companyによる2023年のレポートでは、現代における生成AIとその他のテクノロジーは、従業員の業務時間の60~70%に当たる作業を自動化する可能性があると述べられています。また、IDCの調査では、アジア太平洋地域の組織の3分の2が2023年に生成AIの検討や調査を進めていることが明らかになりました。

 2024年は、企業が生成AIの運用や改善に一層注力するとともに、クラウドをはじめとするさまざまな環境で増大するデータを管理するアプローチを見直し、さらなる柔軟性と成長を実現する取り組みを推進していくと予想されます。

 2024年に見られるであろうトレンドを6つのポイントに分けて前編・後編で紹介します。なお、後編は筆者(Daniel Hand)の予測に、Cloudera 社長執行役員の大澤毅の見解も加えています。

 2022年11月に「ChatGPT」(GPT-3.5)がリリースされて以来、組織は成果を達成するため十分なコンテキストデータを安全に提供しつつ、メリットを実現するという課題に直面しています。

 ChatGPTや大規模言語モデル(LLM)を基盤とするその他のSaaSは、データプライバシーに関する重大な課題を組織にもたらします。多くの場合、質問、回答、コンテキストデータは機密性を有しています。そのため、モデルの再トレーニングのためにこうしたデータを再利用するパブリックなマルチテナント型サービスは、企業での利用に適しているとは言えません。

 Metaの「Llama 2」などのオープンソース型LLMも急速な進化を遂げ、ChatGPTに引けを取らないパフォーマンスにより代替サービスとしての可能性を示してはいますが、拡張性や信頼性を実現しつつ生成AIモデルをラボから実運用へと移行させることは困難です。また、これらのサービスは一般的に複数のアプリケーションで共有されるため、データ連携に関しては、従来の機械学習(ML)モデルと比べて大きな課題が残ります。

 2024年、組織は引き続き強力な機械学習運用(MLOps)とデータ連携機能の開発に注力することになるでしょう。

 LLMのパフォーマンスを最適化するためには、プロンプトエンジニアリングや検索拡張生成(RAG)、ファインチューニングなど幾つかのアプローチが存在します。

 RAGはナレッジベースのコンテンツを使い、プロンプトを拡充して、必要なコンテキストを提供します。RAGの主要なコンポーネントは、特別な方法でインデックスを付与したナレッジベースコンテンツのデータベースです。

 ユーザーからの質問は数学的な表現でエンコードされ、データベース内でその質問に非常に近いコンテンツを検索する際に使用できます。これらの質問はプロンプトの一部としてLLMに送信され、推論に利用されます。質問とドメインのコンテキストをいずれも提供することで、結果が大幅に改善されます。

 RAGはLLMのトレーニングやチューニングを行わずとも優れた成果を達成できるため、LLMの導入時の効果的なアプローチとして定評があります。しかし、ナレッジベースリポジトリーの維持にはデータエンジニアリングパイプラインと、インデックス化されたデータを保存する特別なベクトルデータベースが必要です。

 2024年においても、RAGは多くの組織にとって、引き続き利用しやすい生成AIアプローチであろうと思われます。

 2023年に大いに関心を集めたファインチューニングのアプローチの1つが、Performance Efficient Fine Tuning(PEFT)です。PEFTは多目的LLMと共存しつつ、ドメイン固有のデータについて小規模なニューラルネットワークをトレーニングします。これにより、コストや必要となるトレーニングデータを抑えつつ、大規模LLMの再教育によるパフォーマンスのメリットを最大限に得ることができます。LLMのファインチューニングには強力なML機能が必要となりますが、特にトレーニングデータの制約がある場合には、効率、説明可能性や結果の精度が大幅に改善される可能性があります。

 2024年にはPEFTのようなファインチューニングのアプローチが組織にますます活用されるようになるでしょう。新規のプロジェクトだけでなく、初期のRAGアーキテクチャーを利用していたプロジェクトを代替する可能性もあります。大規模かつ有能なデータサイエンスチームを擁する組織では、大いに活用されるようになるでしょう。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
アビーム、財務経理の業務基盤として「BlackLine」導入–工数が約7割削減
IT関連
2023-03-12 09:53
OutSystemsジャパン、クラウドネイティブアプリ向けのローコード開発基盤を国内提供
IT関連
2023-04-18 07:06
マルチクラウドインテグレーターへと向かうIBMの動きを追う
IT関連
2021-01-25 04:15
先週の労働問題:GitHubがナチス発言社員を解雇、Facebookが公民権担当幹部を採用、Dropboxが315人を解雇
パブリック / ダイバーシティ
2021-01-19 06:24
ドコモ、沖縄県の産業創出と課題解決を支援するビジネス拠点開設へ
IT関連
2023-08-02 09:04
レトロなアーケードでゲームを楽しめるハイブリッドな没入型プラットフォームをPortalOneが年内提供予定
IT関連
2022-02-15 04:46
衝突しても曲がって復活する柔らかドローン用ローター 北陸先端大など「トンボプロペラ」開発 :Innovative Tech
トップニュース
2021-05-13 02:28
価格約11万円、レノボがARMベース「Snapdragon 8c」搭載Windowsノート「IdeaPad 4G」を4月9日発売
ハードウェア
2021-04-07 08:11
アイエスエフネット、介護や性的指向に関する専門相談窓口を社内に設置
IT関連
2023-05-24 15:14
HPE、サーバーの一元管理とストレージバックアップのサブスクを開始
IT関連
2022-10-26 10:24
Instagram、4人でライブ配信可能な「Live Rooms」(ややClubhouse似)
アプリ・Web
2021-03-03 17:11
Electron代替を目指すTauriがGUIライブラリ「tauri-egui 0.1.0」をリリース
Rust
2022-09-27 15:06
OSSサプライチェーンのセキュリティ向上へ–OpenSSFの「Alpha-Omega」プロジェクト
IT関連
2022-02-22 11:16
熱海の土石流災害、現場の3Dモデルを有志が公開 ドローン映像を基に作成
DX
2021-07-06 16:14