凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCR開発

今回は「凸版印刷、明治期から昭和初期の手書き文字を解読するAI-OCR開発」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 凸版印刷は、明治期から昭和初期(近代)の手書き文字に対応したAI-OCR(人工知能を活用した光学文字認識)を開発した。

 このAI-OCRは、同社が提供する古文書解読とくずし字資料の活用サービス「ふみのは」を基に、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させたもの。開発は、神戸大学経済経営研究所附属企業資料総合センターおよび公益財団法人三井文庫と共同で実施した。

 近代の手書き文字には、書き手によるくずし方のばらつきが大きく、筆記用具の多様化、カタカナ語の混在、旧字旧仮名遣い表記などの特性があり、解読が困難とされている。今回開発したAI-OCRでは、さまざまなパターンの文字をAIに学習させることで、これらの難読文字の解読を実現した。

 想定される活用のシーンとして、地方自治体、教育研究機関、企業などが所蔵する難読資料の解読補助、難読資料の活用を目的とした検索機能付きデータベースの構築補助、謄本類など、日常的に難読資料の解読が必要な企業・機関の作業補助などが挙げられる。

 近代に作成されたくずし字を多く含む手書きの資料は全国に大量に残存しており、その中には公文書、企業経営文書、業務日誌、書簡のような貴重な情報が記された資料が数多く含まれている。また、手書きの謄本類を取り扱う業務では、近代の手書き資料の解読が日常的に行われているが、これらの資料の解読は専門家でも難易度が高く手間のかかる作業であり、実用レベルのOCR技術も開発されていなかった。

 凸版印刷は11月から神戸大学経済経営研究所附属企業資料総合センターなどと実証実験を実施し、2023年4月に正式サービスの開始を予定している。また、提供中のふみのはゼミシステムや、開発中の古文書解読スマートフォンアプリなど、自社のサービスと連携させるという。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
迫られる脱炭素対応、IT人材も強化 トヨタ株主総会
IT関連
2021-06-18 07:58
光電変換効率が高い有機薄膜太陽電池の発電の仕組みは「下り坂」だった―京都大学が発電機構を解明
IT関連
2022-03-02 01:48
【コラム】核廃棄物のリサイクルはエネルギー革新の最重要手段だ
その他
2021-06-15 04:14
MongoDB 6.0がリリース。時系列データ対応、ポーリング不要でデータ変更によるトリガー処理、スケーラビリティ、暗号化など強化
MongoDB
2022-07-25 23:26
MySQLの運用をコードで定義し大幅に自動化する「MySQL Operator for Kubernetes」がオープンソースで公開[PR]
Kubernetes
2022-05-30 08:21
“もう1つの逆シャア”、テープ音源から32年ぶり復刻 KADOKAWAがドラマCDで再販
くらテク
2021-06-12 22:02
データで成功するために「データアンバサダー」や多様性を–ドーモのCOO
IT関連
2022-09-13 05:13
PS5の4K/120fps出力に対応した4Kテレビ、ソニーが発売 「ゲームプレイに適している」
くらテク
2021-04-13 16:48
マルチクラウドの導入進む、AWSとMicrosoft Azureの差は?–Flexeraレポート
IT関連
2021-03-16 19:25
日本初の女性に特化したメンタリティ教育・キャリアスクールを手がけるLiLiが総額1億円のプレシリーズA調達
ネットサービス
2021-07-28 00:59
バイデン米大統領、半導体などの供給網を見直す大統領令に署名
IT関連
2021-02-26 15:48
カバンの中で勢いよく発火、発煙 リチウムイオン電池の事故、国民生活センターが再現動画で注意喚起
くらテク
2021-03-20 20:30
五輪会場周辺をオンライン観光 活躍の場失ったボランティアが案内
IT関連
2021-07-29 21:18
ソフトバンクが中国の産業用自律型モバイルロボットYouibotの16.9億円のラウンドをリード
ロボティクス
2021-05-08 03:42