BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出

今回は「BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出」についてご紹介します。

関連ワード (利用方法、抽出可能、表記等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Google Cloudは、大規模並列データ処理サービスのBigQueryに、画像データから自動的に内容を抽出するAI機能「Document AI」を統合したと発表しました。

Document AIは、請求書や領収書、パスポート、契約書といったドキュメントの画像データを与えると、その項目と内容を生成AIによって自動的に抽出する機能を提供します。

BigQueryがDocument AIを統合することで、BigQueryからSQL文を用いてドキュメントの画像データ群に対して問い合わせが可能になります。

例えば、Google Cloud Storageに請求書の画像スキャンをまとめて保存しておき、BigQueryで今月の日付の請求書の合計金額をSQLで求める、などの処理ができるわけです。

fig

具体的な利用方法のおおまかな手順は次の通りです。

  1. ドキュメントの画像データから抽出したいデータのスキーマを定義し、抽出のサンプルや注釈を提供、Document AIをトレーニングします(あらかじめよくあるフォーマットの学習サンプルも用意されているようです)。 2.Google Cloud Storage上のドキュメントの画像データを、データベースの仮想的な表となるオブジェクトテーブルとして定義します。
  2. オブジェクトテーブルに対して項目を抽出する関数を呼び出すと、どのような項目が抽出可能かが返ってきます。
  3. オブジェクトテーブルの項目を列名のようにWhere節で表記したSQLでクエリが発行可能です。

そのほかにも、テキスト分析による感情の分析、ドキュメントの要約、抽出したデータと別テーブルとのジョインなど、さまざまな処理が可能だと説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
「Spring Framework」のアップデート公開、深刻な脆弱性に対処
IT関連
2022-04-02 00:28
今週の記事ランキング(2021.5.30〜6.3)
IT関連
2021-06-05 01:58
Tiger Globalがインドの若いSNSに約190億円規模の投資を検討中
ネットサービス
2021-03-15 08:17
OpenAIに集団訴訟、「ChatGPT」などの訓練用データ収集で
IT関連
2023-07-01 23:00
3Dプリントでわずか60日で完成するRelativity Spaceの新しい大型ロケットTerran R、もちろん再利用可能
宇宙
2021-06-27 15:49
ウエスタンデジタルにセキュリティ侵害、被害状況はまだ不明
IT関連
2023-04-05 17:03
客先常駐のエンジニアも含めたD&I制度の普及が課題–アイエスエフネット調査
IT関連
2023-01-28 10:33
日本版「ファンタジースポーツ」の普及を目指すスポーツ観戦視聴体験向上サービス「なんでもドラフト」が1.7億円を調達
ゲーム / eSports
2021-06-30 00:58
アトランタが米国南東部でユニコーンを量産するテクノロジーハブに成長した理由
VC / エンジェル
2021-06-28 11:08
インテックら3社、耐量子暗号証明書を利用したインターネットEDI接続に成功
IT関連
2024-08-06 20:50
DeepL、企業向け文章作成支援ツール「DeepL Write Pro」提供–独自LLMを採用
IT関連
2024-04-27 20:13
濃飛倉庫運輸、業務アプリ開発をローコード化して工数を半減
IT関連
2023-02-09 16:35
iSpotはAce Metrixを買収し広告測定プラットフォームを拡大
その他
2021-01-16 16:02
デージーネット、DMARCレポート分析サーバーを発売
IT関連
2024-04-13 09:19