紙帳票のイメージ管理システム構築に関して
最近立て続けに各種帳票のイメージ化とイメージ管理システム、OCRテキスト変換の構築案件を弊社で手掛けております。
いわゆる大企業のお客様からの要望が多いのですが、ペーパーレス化や電子データによる承認・審査業務フロー化が進んでいるのでしょうかね?
帳票のイメージ化は、ペーパーレスだけが目的ではなく、帳票に印字されている活字や手書き文字を基幹システム登録用のメタ情報として部分的にOCRを利用してテキスト抽出したいという要望が必ずあります。
基本的にOCR抽出で100%の認識率を実現することは、ほぼ不可能なので、抽出内容を人が目検でチェックして誤認識している部分を手動で修正しなければなりませんが、お客様からは100%に近い認識率をOCRに求められますので、そこをいかに実現するか?は正直難しいところです。
最近では、AIを使って認識率を高める商品も出始めておりますが、こちらもカタログスペックでは、高い認識率を実現できていたり、AIの学習機能で、どんどん認識率を高められるような記述がありますが、導入している経験から言えば半信半疑なところがあります。
例えば定型的な(住所情報や必ずこの部分には、このパターンの文字列のいずれかが記入される)情報部分であれば、あらかじめこれを辞書登録しておけば、認識率100%を実現することができますが、何が書かれるか不特定(非定型)な部分に関しては、認識率100%の実現は難しいですね。
また、QRコード情報のOCR認識であれば、認識率100%実現は可能です。
弊社では、スキャン解像度や辞書機能、バッチプログラムを駆使して、なるべく100%に近い認識率で目検修正部分が極力無いようにして、正確な認識情報として基幹システムにデータ登録するノウハウと実績があります!
我々に帳票OCR処理に関する仕事をお任せいただければ、目検修正に関わる人員は大幅に省力化することが可能です!