非構造化データの活用で期待される生成型AI

今回は「非構造化データの活用で期待される生成型AI」についてご紹介します。

関連ワード (調査等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 近年、非構造化データ(テキスト、図面、文書、IoTデータストリーム)が注目を集めている。これらにはまだ活用されていない大きな価値がある。データベース業界は、これらの資産を生かすための大規模な変革を進めている。

 非構造化データに対する認識不足が、こうした取り組みの妨げになることも多い。Boxが委託したIDCの調査によると、企業内に存在する情報の90%は非構造化データだと推定されている一方で、そこから価値を引き出すべく分析されるのは半分にも満たないと回答した組織が46%にのぼった。

 現在、ITやビジネスのリーダーらには、非構造化データを追求し、表面化させるもう1つの理由がある。それは、生成型の人工知能(AI)の台頭だ。

 非構造化データに対する取り組みを近年進めてきた企業やITプロフェッショナルらは、生成型AIによる利点を享受できる、またデータストアをさらに深く掘り下げる分析においてもAIを活用できるという点で、より優位な立場にあるのかもしれない。

 PwCで米国のデータやアナリティクス、AIのリーダーを務めるMatt Labovich氏は、「(企業が)『PowerPoint』のプレゼンテーションや、テキスト、『Excel』のスプレッドシートといった知識ドキュメントとともに、IoTなどのソースから集積された非構造化データの管理」に力を入れるべき時がきており、「こうした非構造化データは全て、業務運用に関する価値ある組織的知識を含んでおり、生成型AIによって引き出せる洞察を秘めている」と述べている。

 Labovich氏は、構造化データに関する戦略がこれまでの注力対象の大部分を占めてきたが、「生成型AIの進化とともに、非構造化データの持つ大きな役割」に目を向ける時がきているとした。

 MIT Technology Review Insightsが最近発表した世界規模の調査によると、「これまでのAIイニシアティブでは、すぐに使える構造化データが豊富にあるという状況でのユースケースに力点が置かれていた一方で、タイプの異なるデータセットの収集や注釈付記、合成の複雑さによって、より広範なAIイニシアティブの展開が阻まれてきた」という。

 データを捕捉し、そこから価値を導き出すという能力は、かつてないほど重要だと考えられるようになってきている。この調査の対象となったIT幹部のほぼ70%は、データにまつわる問題が、AIや機械学習(ML)を活用する自社の目標達成に最も大きな影を落としているという点に同意している。調査レポートを執筆したAdam Green氏は「人気の高い『ChatGPT』といったテキスト生成AIシステムは、大規模言語モデル(LLM)に基づいて構築されている。LLMは膨大な量のコーパスで訓練されており、統計的に最も妥当な内容に基づいて質問に答えたり、タスクを実行したりする」と記している。

 また同氏は、「AIアプリケーションは、大規模なデータ世界の収集と保存、分析を可能にする堅牢なデータインフラに依存している」と記した上で、「2022年の末に生成型AIの業務アプリケーションが普及し始める前から、アナリティクスやAI向けの統合データプラットフォームが重要な鍵を握っているという見方をしていた調査回答者は70%近くいた」と続けている。

 また、調査回答者の3分の2以上は、アナリティクスやAI向けにデータプラットフォームを統合していくことが、自社のエンタープライズデータ戦略にとって重要な鍵だという点に同意している。調査レポートによると、「生成型AIの時代には、柔軟でスケーラブルかつ効率的なデータインフラが必要」であり、「データレイクハウスなどの先進的なアプローチによって、データとアナリティクスへのアクセスを拡大し、セキュリティを強化し、低コストのストレージと高性能なクエリーを組み合わせることが可能になる」という。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
きらぼし銀行、融資支援システムを構築へ–フューチャーアーキテクトが開発支援
IT関連
2022-07-05 14:29
シャープ、大阪府枚方市で「基幹業務システムシェアリング」を実証
IT関連
2022-01-22 11:07
ベネッセ、販売管理や新顧客基盤を含む基幹システムをオラクルのクラウドで構築
IT関連
2022-12-15 02:50
テレワーク下の不調を早期発見–従業員のメンタルヘルスを可視化する「Weekare」が提供開始
IT関連
2021-05-28 07:50
ソフトバンク、世界初のLenovo製“画面折りたたみPC”発売 5G対応で約40万円
製品動向
2021-03-05 20:34
シンガポール拠点のライドシェアSWAT Mobilityが資金調達、日本におけるサービス開発に投資
シェアリングエコノミー
2021-02-09 19:21
Docker Desktop 4.14登場。コンテナごとのCPUやメモリ消費量のグラフ化、コンテナイメージの依存関係などをビジュアルに表示可能
Docker
2022-11-24 23:43
LINEがデータガバナンスに関する現状認識を発表、海外保管のトークデータを完全国内移転へ
セキュリティ
2021-03-25 07:21
2022年、Linuxとオープンソース開発者の最優先事項はセキュリティ
IT関連
2022-01-19 12:54
“鳳凰”と呼ばれる時計──虹色の魔法を使う幻想の「G-SHOCK」 :矢野渉の「金属魂」特別編
PR
2021-03-30 17:28
Metaの監督委員会、FacebookとInstagramに「晒し」からユーザーを守る規定強化を要請
IT関連
2022-02-10 11:35
ヴイエムウェアが「VMware Cloud」発表、マルチインフラ対応とアプリのモダン化を促進
IT関連
2021-04-01 05:58
より良い選択を学ぶオートコンプリートで誰でも文章を早くかけるようになるCompose.ai、企業独自の言葉遣いにも対応
人工知能・AI
2021-06-11 05:56
自動運転シャトルバスの仏EasyMileが72.5億円を調達
モビリティ
2021-04-30 01:40