BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出

今回は「BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出」についてご紹介します。

関連ワード (利用方法、抽出可能、表記等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Google Cloudは、大規模並列データ処理サービスのBigQueryに、画像データから自動的に内容を抽出するAI機能「Document AI」を統合したと発表しました。

Document AIは、請求書や領収書、パスポート、契約書といったドキュメントの画像データを与えると、その項目と内容を生成AIによって自動的に抽出する機能を提供します。

BigQueryがDocument AIを統合することで、BigQueryからSQL文を用いてドキュメントの画像データ群に対して問い合わせが可能になります。

例えば、Google Cloud Storageに請求書の画像スキャンをまとめて保存しておき、BigQueryで今月の日付の請求書の合計金額をSQLで求める、などの処理ができるわけです。

fig

具体的な利用方法のおおまかな手順は次の通りです。

  1. ドキュメントの画像データから抽出したいデータのスキーマを定義し、抽出のサンプルや注釈を提供、Document AIをトレーニングします(あらかじめよくあるフォーマットの学習サンプルも用意されているようです)。 2.Google Cloud Storage上のドキュメントの画像データを、データベースの仮想的な表となるオブジェクトテーブルとして定義します。
  2. オブジェクトテーブルに対して項目を抽出する関数を呼び出すと、どのような項目が抽出可能かが返ってきます。
  3. オブジェクトテーブルの項目を列名のようにWhere節で表記したSQLでクエリが発行可能です。

そのほかにも、テキスト分析による感情の分析、ドキュメントの要約、抽出したデータと別テーブルとのジョインなど、さまざまな処理が可能だと説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
Deno 1.28登場、npm対応が安定版に到達。130万種以上のnpmモジュールを利用可能に
Deno
2022-11-16 20:28
家庭用性感染症検査キットを提供しSTI検査の敷居を下げる米TBD Health
IT関連
2022-02-02 03:26
クラウドフレア、日本など5カ国で中小企業向けのセキュリティ機能を無償化
IT関連
2022-12-16 14:54
熱心な顧客には何を提供できる?–新組織「アクセンチュア ソング」の調べ
IT関連
2023-04-27 09:00
NECとRed Hatが「OpenShift」で協業拡大–100人規模の共同支援体制など編成
IT関連
2022-10-04 04:04
インテル、2040年までに温室効果ガス「ネットゼロ」を目指す
IT関連
2022-04-15 03:23
「GVA manage」、法務案件依頼時の回答期限をより適切に設定できるよう機能アップデート
IT関連
2023-09-14 21:08
損保ジャパン、基幹システムを刷新–DXに当たりセキュリティ強化と開発業務を高度化
IT関連
2021-06-04 02:39
サンドラッグ、統合型カスタマーエンゲージメントプラットフォームを導入
IT関連
2022-06-14 09:52
お古のGalaxyスマホを「赤ちゃんモニター」などに再利用 サムスンの環境保護プログラム
企業・業界動向
2021-01-17 01:16
脆弱性への対応はセキュリティ対策の基本–テナブル日本代表の貴島氏
IT関連
2021-07-15 00:49
「公認釣り人」に年120万円支給 釣りSNS運営会社がスポンサーシップ制度
企業・業界動向
2021-08-14 23:19
Google AnalyticsはちゃんとCookieがなくなった後に備えている
ネットサービス
2021-05-15 23:58
KDDIのDX専業中間持株会社KDH、DX事業会社の取り込み急ぐ
IT関連
2023-11-10 19:33