AI-OCRとは何か。どこがAIなのか、従来のOCRと何が違うのか疑問に思われているものと思います。最近バズワードになりつつあるAI-OCRについて解説します。単に「AI」と言う場合と同様に明確な定義はありません。従来のOCRを機械学習などを使って賢くさせたものというのが一般的な解釈です。各社によって賢い機能、すなわち「AI」の部分は異なります。

  • 機械学習を用いて手書き文字の読取精度を上げる
  • 帳票定義の範囲を自動拡張(枠からはみ出してもOK)
  • 傾き、文字の重なり、カスレ、滲みなどの自動補正(前処理部分)

ちなみにsweeepは「帳票定義が不要(AIによる自動帳票定義)」「会計仕訳の自動作成」という点が従来のOCRにはない機能となります。非定形フォーマットの請求書に対応するために、このような機能を装備しています。

 

非定形フォーマット帳票とは :文字の印字位置が固定ではない帳票をいいます。代表例は請求書(受領側)や履歴書など、外部ユーザが作成する書類です。反対に稟議書や支払伝票などは社内発行のため定形フォーマットとなります。
帳票定義とは :OCRの前設定として行う業務です。帳票のどこに何が書いてあるのかを指定してOCRソフトに記録します。座標での指定のほか、キーワードによる指定などがあります(注文番号という文字の横を読むなど)。基本的には帳票のフォーマット毎に設定が必要になるため非定形フォーマット帳票の場合、帳票定義を頻繁に行います。

 

なぜ今OCRか

ではなぜOCR(AI-OCR)が最近になって再注目されているのでしょうか。OCRは数十年前から使われている技術です。郵便はがきの自動仕分けにOCRが使われているのは有名な話です。OCRが再び見直されているのは以下のような背景によるものです。

  • OCR技術全体の精度向上
  • RPAによる自動化の流れ
  • 働き方改革に代表される労働時間圧縮の流れ

特にRPAや働き方改革の文脈は強い影響力を持っております。EUC(End User Computing)として避けられてきたVBAが見直されていることを見ても、これがビッグウェーブであることをうかがい知ることができます。また、RPAでは解決できないアナログデータの処理(デジタル化)を一手に引き受ける手段としてOCRへの期待が最高潮に達していると言えるでしょう。AI-OCRの未来はどうでしょうか?2つの流れがおきると思います。1つはRPAとの連携、もう1つは特定帳票に特化したOCRの増加です。

 

OCRとRPAの連携

OCRは帳票に書かれている内容をデジタル化する技術ですが、業務の観点でいえばそれがゴールではありません。むしろデジタル化はスタート地点です。

ゴールはデジタル化したデータを整理してシステムへ入力することです。OCRはいわばディフェンダーの位置にいて前線にパスを送る役目です。各システムへゴールを決めるのはパスをもらった別のプレイヤーなのです。

以前はOCRで読み取ったデータをエクセルなので綺麗に加工してシステムをインポートしてきました。

今はRPAがOCRからもらったRawデータをVBAで綺麗にして自ら基幹システムに登録したり、APIを使ってゴールを決めにいきます。

今RPAツールは他のツールとの連携を強化しています。これまでは何でもできるスーパープレイヤーとして期待されてきたRPAですが、RPAにも得手不得手があることがユーザ側に認知されるようになってきました。加えて業務整理ができるITスキルの高いメンバーと推進し続ける組織とルールを揃えなければなりません。

RPAは他システムと連携することによってこれらの困難から少しでも解放される必要があります。

一方でOCRもこれまでどちらかというと日陰にいて今ほど注目を浴びたことはないでしょう。OCRしてデータ化はできたけど何する?という問題を業務コンサルを含めたRPAというソリューションが補完してくれる期待が高いです。

OCR側とRPA側双方の事情が綺麗にマッチし、それぞれが補い合う状況にあると言えるでしょう。

 

専用OCRの登場

OCRは長年「読取精度」という問題と向き合ってきました。それは手書き文字や罫線や解像度との闘いでした。その甲斐あって精度は格段に上がってきました。しかし一方で業務への適合という観点は疎かになっていたと言わざるを得ません。それは純粋なOCRの前後にやらなきゃならないことが多すぎるという問題です。OCR前の帳票定義とOCR後のデータ整理です。この作業があることで、結局はOCRで得られる“貯金”を使ってしまい、効果の薄い結果となってしまうのです。

 

OCR前の帳票定義

帳票定義は帳票のどこに何が書かれているかを設定する作業です。これをすることでOCRするポジションを狙い撃ちすることができるようになります。しかし、狙いがはずれると期待はずれの答えを受け取ることになります。定形レイアウトにおいてもエンドユーザ(書き手)の書く位置のズレやスキャン時のズレなどで帳票定義のやり直しを迫られます。ましては、非定形レイアウトなら毎回のように一枚ずつ定義しなくてはならず、設定の負担はOCRの“貯金”を上回ることだってあります。

 

OCR後のデータ整理

帳票定義がうまくいき、OCRで正しい答えが返ってきたらそれで終わりではありません。文字を読んでデジタル化はできたけど、そのままでは使えないという問題です。帳票に書かれている(印字されている)文字はエンドユーザ(書き手)が書きやすいように書かれていますが、最終登録先のシステムでは形式が規定されていたりします。簡単な例で言えば、生年月日を和暦で書く人と西暦で書く人がいれば、それを整える作業がシステム登録前に発生します。全角を半角に直すこともあるでしょう。更に非定形レイアウトの帳票であればなおさらです。例えば履歴書は、どんなレイアウトでも書く内容は大体同じですが、書く順番などが微妙に異なります。そうすると、OCRで読み取ったデータをシステム登録前に並び替えるという作業が発生します。

このようにOCR後・システム登録前には変換や並び替えの作業が発生します。この作業を誤って行うとゴミデータがシステム内に入ってしまうため、とても重要で変換ツールなどを作る必要がでてきます。

 

エンジンから完成品へ

これまでのOCRはまさに“エンジン”としての進化を遂げてきました。手書き文字が読めたり、傾きを補正したり、不要な印影を除去したり読取精度と戦ってきました。しかし、それだけでは業務として使うに十分とは言えません。車体やハンドルやタイヤを装備して自走しなければ真の自動化は達成されません。帳票定義をなくし、データ整理までを完結できるAI-OCRサービスが今後は増えていくと予測しております。それは恐らく業務特化型(帳票特化型)のOCRだと思います。

 

真の理想はOCRレス

そもそもペーパーがなければOCRなんて不要です。長年、生産性を低下させてきた紙をなくし、同時にOCRは役割を終えます。我々はオフィスから紙がなくなることを心から望んでおります。