凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCR開発

今回は「凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCR開発」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 凸版印刷は、明治期から昭和初期(近代)の手書き文字に対応したAI-OCR(人工知能を活用した光学文字認識)を開発した。

 このAI-OCRは、同社が提供する古文書解読とくずし字資料の活用サービス「ふみのは」を基に、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させたもの。開発は、神戸大学経済経営研究所附属企業資料総合センターおよび公益財団法人三井文庫と共同で実施した。

 近代の手書き文字には、書き手によるくずし方のばらつきが大きく、筆記用具の多様化、カタカナ語の混在、旧字旧仮名遣い表記などの特性があり、解読が困難とされている。今回開発したAI-OCRでは、さまざまなパターンの文字をAIに学習させることで、これらの難読文字の解読を実現した。

 想定される活用のシーンとして、地方自治体、教育研究機関、企業などが所蔵する難読資料の解読補助、難読資料の活用を目的とした検索機能付きデータベースの構築補助、謄本類など、日常的に難読資料の解読が必要な企業・機関の作業補助などが挙げられる。

 近代に作成されたくずし字を多く含む手書きの資料は全国に大量に残存しており、その中には公文書、企業経営文書、業務日誌、書簡のような貴重な情報が記された資料が数多く含まれている。また、手書きの謄本類を取り扱う業務では、近代の手書き資料の解読が日常的に行われているが、これらの資料の解読は専門家でも難易度が高く手間のかかる作業であり、実用レベルのOCR技術も開発されていなかった。

 凸版印刷は11月から神戸大学経済経営研究所附属企業資料総合センターなどと実証実験を実施し、2023年4月に正式サービスの開始を予定している。また、提供中のふみのはゼミシステムや、開発中の古文書解読スマートフォンアプリなど、自社のサービスと連携させるという。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
葛城ミサトの部屋、「獺祭」の旭酒造が再現 7日から一般公開
くらテク
2021-06-08 03:10
ティーリアム、LINE公式アカウントの「オーディエンス」機能とデータ連携
IT関連
2023-06-24 07:20
ギブリー、自社専用の「ChatGPT」環境を構築できる「法人GPT」を提供
IT関連
2023-04-06 21:52
ツール・ド・フランス、「ChatGPT」とデジタルツインを採用–NTTが協力
IT関連
2023-07-05 18:30
グーグル、「Chrome」の新たなゼロデイ脆弱性の修正を公開
IT関連
2022-09-07 20:42
北九州市建設局、工事現場にビデオ通話アプリを導入–遠隔支援で業務効率化を図る
IT関連
2022-07-09 14:48
気象庁、線状降水帯予測スーパーコンピューターの構築を完了
IT関連
2023-03-01 05:47
Google CloudとWorkdayが戦略的パートナーシップを発表
IT関連
2021-08-14 18:36
「Spring4Shell」脆弱性、マイクロソフトが詳細を説明
IT関連
2022-04-07 08:03
野村不動産コマース、経営管理SaaSの導入で収支管理の精度を高度化
IT関連
2024-01-19 19:37
iPad Proの「常に自分(たち)を中央に」機能、サードパーティーのビデオ会議アプリにも対応
IT関連
2021-05-22 11:21
18〜19世紀の新聞データ100万ページを英国企業が無償公開 商用利用は条件付きで可
イラスト・デザイン
2021-08-13 10:10
表記揺れの影響を受けず不動産物件を特定できる「不動産共通ID」ベータ版が4月公開、APIとして提供
パブリック / ダイバーシティ
2021-03-16 16:16
LayerX、「バクラク請求書発行」に見積書、納品書、領収書を簡単に作成できる機能を追加
IT関連
2023-09-26 00:53