データ活用における生成AIとクラウド–2024年のトレンドを読む(前編)

今回は「データ活用における生成AIとクラウド–2024年のトレンドを読む(前編)」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成AIは、Gartnerが2023年に発表した先進テクノロジーのハイプサイクルにおいて、「過度な期待」のピーク期に近づいていると考えられています。

 生成AIのメリットは魅力的かつ広範囲にわたるため、アナリストらは生成AIがあらゆる主要産業や業務部門に影響を及ぼすであろうと見込んでいます。McKinsey&Companyによる2023年のレポートでは、現代における生成AIとその他のテクノロジーは、従業員の業務時間の60~70%に当たる作業を自動化する可能性があると述べられています。また、IDCの調査では、アジア太平洋地域の組織の3分の2が2023年に生成AIの検討や調査を進めていることが明らかになりました。

 2024年は、企業が生成AIの運用や改善に一層注力するとともに、クラウドをはじめとするさまざまな環境で増大するデータを管理するアプローチを見直し、さらなる柔軟性と成長を実現する取り組みを推進していくと予想されます。

 2024年に見られるであろうトレンドを6つのポイントに分けて前編・後編で紹介します。なお、後編は筆者(Daniel Hand)の予測に、Cloudera 社長執行役員の大澤毅の見解も加えています。

 2022年11月に「ChatGPT」(GPT-3.5)がリリースされて以来、組織は成果を達成するため十分なコンテキストデータを安全に提供しつつ、メリットを実現するという課題に直面しています。

 ChatGPTや大規模言語モデル(LLM)を基盤とするその他のSaaSは、データプライバシーに関する重大な課題を組織にもたらします。多くの場合、質問、回答、コンテキストデータは機密性を有しています。そのため、モデルの再トレーニングのためにこうしたデータを再利用するパブリックなマルチテナント型サービスは、企業での利用に適しているとは言えません。

 Metaの「Llama 2」などのオープンソース型LLMも急速な進化を遂げ、ChatGPTに引けを取らないパフォーマンスにより代替サービスとしての可能性を示してはいますが、拡張性や信頼性を実現しつつ生成AIモデルをラボから実運用へと移行させることは困難です。また、これらのサービスは一般的に複数のアプリケーションで共有されるため、データ連携に関しては、従来の機械学習(ML)モデルと比べて大きな課題が残ります。

 2024年、組織は引き続き強力な機械学習運用(MLOps)とデータ連携機能の開発に注力することになるでしょう。

 LLMのパフォーマンスを最適化するためには、プロンプトエンジニアリングや検索拡張生成(RAG)、ファインチューニングなど幾つかのアプローチが存在します。

 RAGはナレッジベースのコンテンツを使い、プロンプトを拡充して、必要なコンテキストを提供します。RAGの主要なコンポーネントは、特別な方法でインデックスを付与したナレッジベースコンテンツのデータベースです。

 ユーザーからの質問は数学的な表現でエンコードされ、データベース内でその質問に非常に近いコンテンツを検索する際に使用できます。これらの質問はプロンプトの一部としてLLMに送信され、推論に利用されます。質問とドメインのコンテキストをいずれも提供することで、結果が大幅に改善されます。

 RAGはLLMのトレーニングやチューニングを行わずとも優れた成果を達成できるため、LLMの導入時の効果的なアプローチとして定評があります。しかし、ナレッジベースリポジトリーの維持にはデータエンジニアリングパイプラインと、インデックス化されたデータを保存する特別なベクトルデータベースが必要です。

 2024年においても、RAGは多くの組織にとって、引き続き利用しやすい生成AIアプローチであろうと思われます。

 2023年に大いに関心を集めたファインチューニングのアプローチの1つが、Performance Efficient Fine Tuning(PEFT)です。PEFTは多目的LLMと共存しつつ、ドメイン固有のデータについて小規模なニューラルネットワークをトレーニングします。これにより、コストや必要となるトレーニングデータを抑えつつ、大規模LLMの再教育によるパフォーマンスのメリットを最大限に得ることができます。LLMのファインチューニングには強力なML機能が必要となりますが、特にトレーニングデータの制約がある場合には、効率、説明可能性や結果の精度が大幅に改善される可能性があります。

 2024年にはPEFTのようなファインチューニングのアプローチが組織にますます活用されるようになるでしょう。新規のプロジェクトだけでなく、初期のRAGアーキテクチャーを利用していたプロジェクトを代替する可能性もあります。大規模かつ有能なデータサイエンスチームを擁する組織では、大いに活用されるようになるでしょう。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
デジタル前提のIT構造に変えていく–日本オラクルの2023年度事業戦略
IT関連
2022-07-09 06:19
NECが中期計画の現状報告–「課題あるも着実に前進」と森田社長
IT関連
2023-05-02 02:37
商工中金、次期勘定系システムとしてオープン勘定系システムを採用
IT関連
2023-02-22 06:02
DevOpsは顧客への提供価値を確かにする営み–弁護士ドットコムの開発現場
IT関連
2023-02-08 07:34
【コラム】ヒートアイランド現象による影響を軽減するため、今、世界はAIを活用すべきだ
IT関連
2022-01-18 10:56
われわれのゴールは「より良いネットワークを作る」ことではない–Extreme Networks
IT関連
2024-06-05 10:37
PayPalとGoogle Cloudが提携強化–オンライン決済の拡大支える
IT関連
2021-05-17 17:10
積水化学工業、国内外3万ユーザーの認証基盤を統合化
IT関連
2023-03-31 06:45
アドビ、生成AI「Firefly」でクリエーティブツールを強化–「Illustrator」などに搭載
IT関連
2023-06-15 18:18
18〜19世紀の新聞データ100万ページを英国企業が無償公開 商用利用は条件付きで可
イラスト・デザイン
2021-08-13 10:10
新たな1歩を踏み出すロボティクススタートアップたち
ロボティクス
2021-03-13 18:14
ソムリエを客室に ホテルニューオータニ、宿泊客に「スーパールームサービス」 飲食店の酒類販売停止で
くらテク
2021-04-27 15:45
2024年にAIはますます台頭、雇用への不安はあれど歓迎すべき理由
IT関連
2024-01-25 14:23
ソーシャルプラットフォームはタリバンの扱い方で歩調揃わず
IT関連
2021-08-22 18:04