BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出

今回は「BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出」についてご紹介します。

関連ワード (利用方法、抽出可能、表記等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Google Cloudは、大規模並列データ処理サービスのBigQueryに、画像データから自動的に内容を抽出するAI機能「Document AI」を統合したと発表しました。

Document AIは、請求書や領収書、パスポート、契約書といったドキュメントの画像データを与えると、その項目と内容を生成AIによって自動的に抽出する機能を提供します。

BigQueryがDocument AIを統合することで、BigQueryからSQL文を用いてドキュメントの画像データ群に対して問い合わせが可能になります。

例えば、Google Cloud Storageに請求書の画像スキャンをまとめて保存しておき、BigQueryで今月の日付の請求書の合計金額をSQLで求める、などの処理ができるわけです。

fig

具体的な利用方法のおおまかな手順は次の通りです。

  1. ドキュメントの画像データから抽出したいデータのスキーマを定義し、抽出のサンプルや注釈を提供、Document AIをトレーニングします(あらかじめよくあるフォーマットの学習サンプルも用意されているようです)。 2.Google Cloud Storage上のドキュメントの画像データを、データベースの仮想的な表となるオブジェクトテーブルとして定義します。
  2. オブジェクトテーブルに対して項目を抽出する関数を呼び出すと、どのような項目が抽出可能かが返ってきます。
  3. オブジェクトテーブルの項目を列名のようにWhere節で表記したSQLでクエリが発行可能です。

そのほかにも、テキスト分析による感情の分析、ドキュメントの要約、抽出したデータと別テーブルとのジョインなど、さまざまな処理が可能だと説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
中国のアントグループ、作業車のリース事業にブロックチェーンを活用
IT関連
2022-12-08 20:42
自動車業界向けAWSリファレンス、「WP.29 UN-R 155」対応を支援
IT関連
2024-06-09 00:44
藤沢市、電子契約サービス「GMOサイン」で行政DXを加速
IT関連
2024-09-25 10:00
出光興産、アクセンチュアと輸送管理プラットフォームを構築–燃料輸送の業務変革へ
IT関連
2021-03-23 12:53
DeepL、「次世代言語モデル」を実装–翻訳品質で「GPT-4」上回る
IT関連
2024-07-19 14:28
インテル、データセンター向けAIプロセッサー「Habana Gaudi2」発表–「IPU」ロードマップも
IT関連
2022-05-14 13:35
中国でVPNの利用は違法なのか再考する
IT関連
2024-10-30 03:11
同志社大学、学生相談の対応にAIチャットボット導入–導入から公開まで約2カ月
IT関連
2023-06-03 18:00
Instagramがクリエイターがファンにだけコンテンツを独占公開できる機能「Exclusive Stories」を開発中
ネットサービス
2021-07-02 18:55
オープンソースのWebAssemblyサーバレス基盤「Wasm Workers Server 1.0」正式リリース。RubyとPythonのWASMランタイムに対応し、Ruby/Pythonでの記述が可能に
JavaScript
2023-03-09 18:07
「たまごサンドおいしい」オリンピック訪日記者の投稿で“コンビニ飯”に注目 ローソンも反応
ネットトピック
2021-08-06 08:04
本人確認のデジタル化–後編:法令と確認方法別の利点や弱点とは
IT関連
2021-03-29 21:43
NVIDIAが目指す「AI-on-5G」のロードマップ
IT関連
2021-07-05 00:50
ウイングアーク1st、営業支援サービス導入–新規リード獲得数が561%増
IT関連
2022-07-20 05:48