BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出

今回は「BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出」についてご紹介します。

関連ワード (利用方法、抽出可能、表記等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Google Cloudは、大規模並列データ処理サービスのBigQueryに、画像データから自動的に内容を抽出するAI機能「Document AI」を統合したと発表しました。

Document AIは、請求書や領収書、パスポート、契約書といったドキュメントの画像データを与えると、その項目と内容を生成AIによって自動的に抽出する機能を提供します。

BigQueryがDocument AIを統合することで、BigQueryからSQL文を用いてドキュメントの画像データ群に対して問い合わせが可能になります。

例えば、Google Cloud Storageに請求書の画像スキャンをまとめて保存しておき、BigQueryで今月の日付の請求書の合計金額をSQLで求める、などの処理ができるわけです。

fig

具体的な利用方法のおおまかな手順は次の通りです。

  1. ドキュメントの画像データから抽出したいデータのスキーマを定義し、抽出のサンプルや注釈を提供、Document AIをトレーニングします(あらかじめよくあるフォーマットの学習サンプルも用意されているようです)。 2.Google Cloud Storage上のドキュメントの画像データを、データベースの仮想的な表となるオブジェクトテーブルとして定義します。
  2. オブジェクトテーブルに対して項目を抽出する関数を呼び出すと、どのような項目が抽出可能かが返ってきます。
  3. オブジェクトテーブルの項目を列名のようにWhere節で表記したSQLでクエリが発行可能です。

そのほかにも、テキスト分析による感情の分析、ドキュメントの要約、抽出したデータと別テーブルとのジョインなど、さまざまな処理が可能だと説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
【レビュー】iPhone SE(第3世代)「Touch IDよ永遠に、Face IDよ無縁に」
IT関連
2022-03-11 05:23
三井住友海上、従業員エクスペリエンス管理を全社員に導入
IT関連
2023-07-28 11:54
米ガートナー「先進テクノロジーのハイプサイクル2023年」を発表。GitOpsは黎明期、生成的AIとクラウドネイティブは過度な期待のピーク
業界動向
2023-08-18 09:57
対話型AIがコンタクトセンター分野で着実に成長–ガートナー
IT関連
2023-08-09 22:42
VRでドローン操縦を学べるコース、ドローンスクールが提供 「地理的制約の解消に」
企業・業界動向
2021-06-30 14:31
「AIのiPhone」をつくる–OpenAIによる絶え間ない仕掛け
IT関連
2023-10-11 11:41
日経225企業の75%はなりすまし対策が不十分–プルーフポイント調べ
IT関連
2021-03-04 05:10
Google Cloudは2020年に約5880億円の損失
ネットサービス
2021-02-04 20:47
テレワークで「つながり弱い同僚」との会話は激減、しかしそれが不安をもたらす──NTT調査 :Innovative Tech(1/3 ページ)
トップニュース
2021-08-21 21:40
ID管理のOkta、Auth0を買収へ–約7000億円
IT関連
2021-03-05 03:15
第4回 VPSでのリモート接続
IT関連
2023-07-20 21:40
金融業務に特化した生成AI活用が増加–AWSジャパン、金融領域の生成AIトレンドを紹介
IT関連
2024-09-07 17:52
NEC、AIでファクトチェックを支援–インターネット上の偽情報対策に貢献
IT関連
2024-09-19 19:37
「自転車NAVITIME」が英語、中国語に対応
企業・業界動向
2021-02-05 09:04