BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出

今回は「BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出」についてご紹介します。

関連ワード (利用方法、抽出可能、表記等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Google Cloudは、大規模並列データ処理サービスのBigQueryに、画像データから自動的に内容を抽出するAI機能「Document AI」を統合したと発表しました。

Document AIは、請求書や領収書、パスポート、契約書といったドキュメントの画像データを与えると、その項目と内容を生成AIによって自動的に抽出する機能を提供します。

BigQueryがDocument AIを統合することで、BigQueryからSQL文を用いてドキュメントの画像データ群に対して問い合わせが可能になります。

例えば、Google Cloud Storageに請求書の画像スキャンをまとめて保存しておき、BigQueryで今月の日付の請求書の合計金額をSQLで求める、などの処理ができるわけです。

fig

具体的な利用方法のおおまかな手順は次の通りです。

  1. ドキュメントの画像データから抽出したいデータのスキーマを定義し、抽出のサンプルや注釈を提供、Document AIをトレーニングします(あらかじめよくあるフォーマットの学習サンプルも用意されているようです)。 2.Google Cloud Storage上のドキュメントの画像データを、データベースの仮想的な表となるオブジェクトテーブルとして定義します。
  2. オブジェクトテーブルに対して項目を抽出する関数を呼び出すと、どのような項目が抽出可能かが返ってきます。
  3. オブジェクトテーブルの項目を列名のようにWhere節で表記したSQLでクエリが発行可能です。

そのほかにも、テキスト分析による感情の分析、ドキュメントの要約、抽出したデータと別テーブルとのジョインなど、さまざまな処理が可能だと説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
グーグル、機械学習を利用してDDoS攻撃をブロックするCloud Armorの適応型保護機能をプレビュー
IT関連
2021-07-22 19:04
SpaceXの衛星ネットサービス「Starlink」、予約受付を開始
IT関連
2021-02-16 06:38
メディアジーン、メディアサイトを「WOVN.io」で英語化
IT関連
2023-01-12 03:56
農業助成金の申請支援を起点に金融サービスの巨人を目指すFarmRaise
IT関連
2022-01-25 14:32
「リーガルテックサービス導入で課題が解決」は7割–LegalForceの企業法務調査
IT関連
2022-07-27 23:10
携帯3社、料金の支払い期限を延長 コロナ禍で支払いが困難な人向けに
企業・業界動向
2021-01-22 12:27
働き方の柔軟性が組織文化と生産性を強化する–Future Forum調査
IT関連
2023-03-01 08:58
ニコニコ大百科に偽サイト、Google検索の上位に 公式が注意喚起
連載チーム
2021-04-22 14:02
「Linux」で独自の音楽ストリーミングサーバーを構築するには
IT関連
2024-04-19 23:12
親会社でのDXの中核になれる組織力を–NRI、情報・デジタル子会社の課題を調査
IT関連
2021-06-16 06:23
LinkedInが独自のポッドキャストネットワークを開始
IT関連
2022-02-25 15:51
テクノロジーと災害対応の未来2「データとAI」
EnviroTech
2021-05-29 00:40
エンジニアが対応するオンライン打ち合わせの工夫や施策–SES分科会
IT関連
2022-01-19 23:06
東芝テック、マイクロサービスによる流通向けプラットフォームの構造を解説
IT関連
2023-10-14 12:12