非構造化データの活用でワークフローを自動化–Boxに聞く生成AI戦略

今回は「非構造化データの活用でワークフローを自動化–Boxに聞く生成AI戦略」についてご紹介します。

関連ワード (クラウド等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 クラウドコンテンツ管理を手掛けるBoxは、米国時間11月12日に開催した年次イベント「BoxWorks 2024」で、AIに関する新たな取り組みを発表した。その狙いは生成AIによるワークフロー自動化の実現にあるという。生成AIの展開などについて最高技術責任者(CTO)のBen Kus氏、Box Japan 代表取締役社長の古市克典氏、同専務執行役 ヴァイスプレジデントの佐藤範之氏に聞いた。

 Boxは、2023年に最初の生成AI機能として「Box AI」をリリースした。Box AIでは、ユーザーが一般提供されている大規模言語モデル(LLM)を利用して、Box上にあるコンテンツの検索やドキュメント内容の要約といったことができる。今回のイベントでは、利用可能なLLMの更新と拡大、ユーザーの独自モデル(Bring Your Own Model)への対応を図ったほか、新機能ではユーザー独自のAIエージェントを作成できる「Box AI Studio」、生成AIで非構造化データからメタデータを自動抽出する「Box AI for Metadata」、AI技術を取り入れたワークフロー作成の「Box Forms」、ワークフローからドキュメントファイルを生成する「Box Doc Gen」などを発表した。

 まずBox AIのアップデート内容についてKus氏は、「顧客は異なるAIモデルを好むことが多いと聞いている。特定のベンダーの異なるモデルで学習して慣れていることや、セキュリティ上の信頼性から他方のモデルも好むといった理由になる。また、AIモデルは常に進化しているので、将来に備えて異なるものを使用できる選択肢があることも確認したいとも考えている。Box AIではそうしたモデルが確実に機能することを確認できるようにした」と説明する。

 一連の発表で特に注目を集めたのが、Box AI for Metadataだ。イベントの基調講演では、共同創業者 最高経営責任者(CEO)のAaron Levie氏が、組織のデータの90%を占める非構造化データの活用が重要になると説いた。ERPシステムなどに格納されている構造化データは、データの形式や情報の種類などが整っているため、システムでの認識、処理、加工がしやすい。一方で、多様な情報が含まれている文章や画像、動画などの非構造化データを構造化データのようにシステムで活用するには、基本的に人間が手作業で必要とする情報を抽出し、メタデータとして意味付けや分類などのラベリング作業をしなければならず、多大な時間や労力、コストなどを伴ってしまう。

 Kus氏は、生成AI技術の登場によって非構造化データからも効率的にメタデータを抽出できるようになったと話す。

 「生成型AIの新しい点は、ほとんどのドキュメントから欲しいデータを抽出するために特別なモデルを訓練する必要がないことにある。われわれは最新、最良のモデルを使って、人が抽出したものと同じように理解できる精度でメタデータ抽出ができることを確認している。ここでわれわれが重視しているのは、メタデータでAIに正しい指示を与えられるようにすることであり、おおむね正確か、かなり正確であることを目指している」

 Kus氏によれば、Box AI for Metadataでメタデータを抽出する際には、フィールドとタイプを指定し、フィールドごとにユーザーが指示を追加できる。つまり、ユーザーが対象のコンテンツからどのようなメタデータを抽出したいのかを設定することで、生成AIが設定に合致する可能性が高いと認識した情報をメタデータとして抽出する仕組みだ。

 「当然ながらBox AI for Metadataは、100%正確にメタデータを抽出するものではない。それは、人が100%正確にメタデータを抽出できないのと同じ理由になる。あいまいさが障害になることもあるが、われわれの目標は、顧客ができるだけ正確にメタデータを抽出できるようなツールを提供することにある」

 なお、あいまい表現が多く含むことが多い日本語のコンテンツについては、日本語が分かる人が手作業で抽出するケースと大差がない抽出精度を確認できているという。同氏は、非構造化データからメタデータが抽出できるようになったことで、膨大なドキュメントのコンテンツをワークフローやビジネスプロセスの効率化に生かす道筋が開かれると強調する。

 また同氏は、イベントの基調講演で複数のAIエージェントが協調動作し、複雑なワークフローや業務プロセスを自動的に実行する世界が到来するだろうとも語った。基調講演では、交通事故に伴う自動車修理の見積もりをAIエージェントが対応するケースを紹介し、車体や修理箇所などの識別、修理内容、想定費用の算出といったことを複数のAIエージェントが行うワークフローを示した。

 「企業には同じワークフローを実行する人々がいる。その観点で捉えれば、これらのことをAIエージェントが行うワークフローを想起しやすいと思う。AIエージェントによるプロセスはまだ初期段階だが、人々がAIエージェントとうまく協働することに慣れ、改善を図ることで、より優れたワークフローにしていくことができるだろう」

COMMENTS


Recommended

TITLE
CATEGORY
DATE
審査をすり抜ける詐欺アプリに注意–「ChatGPT」人気を利用
IT関連
2023-05-30 11:44
Facebook版Clubhouse「Live Audio Rooms」とPodcast、米国で始動
アプリ・Web
2021-06-23 14:17
日本郵便、23年にドローン配送実用化 開発会社に30億円出資
DX
2021-06-17 20:32
Canonical、「Ubuntu 22.04 LTS」をリリース
IT関連
2022-04-27 16:40
改正電帳法へ具体的に取り組む企業は全体の約3割–ウイングアーク1st
IT関連
2022-03-24 16:01
地球の電力需要を満たす大きな可能性を持つ地熱テクノロジーでリーダーを目指す「Fervo」
EnviroTech
2021-05-04 21:42
日立、「IT基盤/運用高度化オファリング」提供–クラウド構築・運用ベストプラクティス活用
IT関連
2022-11-15 10:29
建機向け自動運転システム、東大発建設テックベンチャーのARAVが開発へ
IT関連
2021-03-10 11:58
「プロダクトのデリバリーを加速する」–Snowflakeの新CEOが年次イベントに初登壇
IT関連
2024-06-08 06:26
PwCが説く「“親亀・子亀・孫亀の構造”によるサステナビリティーの意味」とは
IT関連
2022-10-01 23:40
日立、アジア通信大手シングテルと戦略的提携拡大–DXとAI適用加速へ
IT関連
2024-08-29 23:06
Go言語でポータブルなCI/CDパイプラインが定義可能に。「Dagger」がGo SDKを発表
CI/CD
2022-10-26 11:58
AIをテーマにいろんな発表–写真で見る「Lenovo Tech World '23」
IT関連
2023-11-01 14:27
「ChatGPT」のプログラミングの実力–主要12言語でコードを書かせてみた
IT関連
2023-05-04 19:55