村山です。いつもご覧いただきありがとうございます。前回の「AI-OCRの不都合な真実」に続きOCR製品を選ぶ際のポイントを解説いたします。この記事はOCRを選ぶ前にやるべきこととOCR製品の評価方法の大きく二部構成となっています。後者の製品の比較評価については皆さんやられていると思いますが、私は前者が特に大事だと思っています。製品を選ぶことを目的化すると長期的にみて失敗するケースが多いので注意いただくことをお勧めいたします。

OCRを選ぶ前にやるべきこと

あなたの会社で今まさにOCR製品を選定しているとしましょう。あなたは、なぜOCR製品を導入するのでしょうか?もちろん「プロジェクトで決まったから」という答えはNGですよね。「業務効率化のため」「自動化したい」というのも解像度としては非常に低いです。「現状こういう課題があり、導入することで定量的効果がXで、定性的にもYの効果が見込める。OCR以外で課題を解決しようとした場合はこんなデメリットがある」というような答えでないと選ぶことが目的化してしまいます。目的は課題を解決することです。OCRは手段だということを忘れてはいけません。

業務全体で考える

OCRという技術単体が解決できる課題というのは入力業務のみです。もっというと「見る」という行為のみです。見た書類の中から必要な情報だけを抜き出したりすることはOCRとは別の技術です。またOCR前後の業務が長ければ長いほど業務全体に対するインパクトは相対的に小さくなります。そこをきちっと把握していないとなんとなく今の入力作業が軽減されそうというノリで始めると得られるリターンが小さくなったり、場合によってはマイナス(工数増加)という結果が待っています。

時間軸で考える

そもそもなぜOCRが必要なのか。それは紙が存在するからです。全ての情報がデジタル化できればOCRは不要となります。遅かれ早かれいつかはOCRが不要な時代はきます。それがいつになるかわからないので取り敢えず進むという考え方もありますが、その時にOCRに投資した時間と費用は資産として残りません。今の課題を手っ取り早く解決する手段としてOCRを捉えるなら良いと思います。しかし1年もかけてOCR導入プロジェクトを計画するのであれば、投資対効果が見合わないと私は考えます。その場合はOCRを前提としない課題解決手段にチャレンジすることをおすすめします。デジタルデータを前提とした仕組みは資産として残るはずです。

今あるOCR製品を前提としない

こんな話をよく耳にします。「会社でXXというOCR製品を導入したので、それを使って他の書類もやっていたが結局使わなくなった」という話です。会社でせっかく導入した製品ですからちょっとだけ試してみるのは良いと思います。1-2日あれば十分使えるかわかります。試してみて「すごく良い」という感触を得られなければ他の製品も含めて検討した方が良いです(そもそもその業務に大きな課題認識がなければ導入すら不要ですが)。一部のOCR製品は特定の書類(sweeepは請求書)に特化していたりするので、特化型の製品があるならそれを試した方が良いです。会社横断の改善プロジェクトなどから「せっかく買ったから各部署で使ってください」という依頼がきた場合は、「その業務の課題が大きいか」「他の製品はないか」という点を忘れずに対応してください。検討に多くの時間を割く必要はありません。

OCR製品の選び方

最初に答えを書きます。「ざっくり評価」「しっかり検証」この2つのプロセスです。ソフトウェア評価の手法として色々とありますが、特にOCRは「しっかり検証」が必須です。これを外して導入すれば失敗の確率はかなり上がってしまいます。(予算、納期、セキュリティなどはのぞいており、運用面の評価ポイントのみです)

全体のプロセスでしっかり検証

まず「しっかり検証」の方から解説します。具体的に一つのプロセスの頭からお尻まで全てやってください。OCR製品の操作だけを試すことがありますが、それでは不十分です。OCR対象の書類を集めるところからスキャン、帳票定義*、読み取り、チェック、個別の修正、全データのアウトプット、加工、次のシステムへのインポート、次のシステムでの処理まで全ての工程をやってください。書類の数や対象部門は少なくて構いません。しかし、プロセスは全てをやってください。なぜなら紙がサイズがバラバラでスキャンがボトルネックになるケースもあります。OCR結果を次のシステムに渡したけど思ったデータができてなかったというケースもあります。机上ではOCRと関係ないと思っている業務でも影響することがよくあります。

*帳票定義:文書全体から項目ごとに読み取る位置を予め設定する作業。例えば会員申込書の氏名欄はこの範囲というように指定しておく。

もう一つ、検証は実際に運用するユーザが行ってください。スキャンする人とチェックする人と次のシステムを操作する人が別ならそれぞれの人が実施してください。運用しない人が検証すると手順を省略したり、データの品質をチェックできなかったりするからです。

検証する製品を絞り込む方法

次に「ざっくり検証」です。全てのOCR製品を「しっかり検証」する必要はありません。デスクトップリサーチ(ホームページやカタログでの確認)で3-5ぐらいの製品をピックアップしたら検証をしましょう。検証するのは読み取り精度です。カタログ上の精度ではなく実際に使っている書類をOCRしてみて精度を出しましょう。帳票定義が必要な製品であれば帳票定義も含めて実際にやりましょう。それぞれの製品で実施したらかかった時間と精度を一覧表にまとめて比較をします。精度は業務内容によりますが、概ね文書単位で80%の精度が出れば検討対象として良いと思います(100枚読んで80枚は修正不要という状態)。文字あたりの精度を検証しても意味がありません。

ここで大事なのは「しっかり検証」と同様に実際の文書を使って試すということです。カタログ上のスペックはもちろんのこと、デモデータで検証しても意味がないのでご注意ください。(カタログ上の読み取り精度については「AI-OCRの不都合な真実」を参照ください)

OCRは手段

繰り返しになりますがOCRはあくまで手段です。本当に解決したい課題は何なのか、その課題はOCR以外に解決する手段はないのかということを深く考えてください。そしてOCRを導入することを決めたら「しっかり検証」を必ず実施してください。そこで得られた結果が不満足であればOCR以外の解決策を再考するのも良いと思います。最後にポイントをまとめます。

<OCR選定前>

  • 本当にOCRが最適な手段かを考える
  • OCR製品を持っているからといって無理に導入しない

<ざっくり検証>

  • カタログの「精度」は参考にしない
  • 実際の書類で読み取りを行う
  • 帳票定義の工数を加味する
  • 精度は文書単位で評価する
  • 精度の許容範囲はあまり高く設定しない

<しっかり検証>

  • 業務全体で検証する
  • 実際に業務をする人が検証する
  • 削減工数だけで決めない(業務が円滑に回るという定性的な効果にも着目)

OCRで失敗する人を増やさないためにこの記事が参考になった方はシェアなどしていただけると大変ありがたいです。

最後に皆さまの会社が良いOCR製品に出会い、課題が解決されることを心より願っています。

オートメーションラボ株式会社
東京都千代田区大手町1-6-1
大手町ビル1F


© 2020 Automation Lab, Inc.

その他

  •