AI-OCRを比較検討~RPAとの連携、業務改善効果を上げる

OCR(光学文字認識)の歴史は古く、RPA(ロボティック・プロセス・オートメーション)とともに、業務効率化向上の点で注目を浴びています。このOCRにAI(人工知能)を用いて、文字認識率を飛躍的に向上させたAI-OCRは、RPAとの親和性が高く、人の手で行っていた、手書きや活字の帳票をデータ化する作業を効率化するとして、導入活用事例やセミナーなどで見聞きしたことがあるのではないでしょうか。

<事例セミナー:AI-OCRとRPA連携でFAX帳票のデータ化を実現>

この記事ではユーザックシステムが、これまでのRPA業務効率化プロジェクトで培ったAI-OCR(OCR)の検討ポイントとツールの比較をわかりやすく解説します。

AI-OCR(OCR)の検討のポイント

AI-OCR(OCR)は様々な製品があります。
製品にはそれぞれの強みがあり、その中から自社に合うものを選択し、導入を検討するのはかなり大変な作業です。ましてや帳票に業界特有な要件がある、膨大な量の帳票を読み込まなければならない等など、一口に「帳票を読み込んでデータ化する」と言っても、読み込む対象項目や読み込んだ後のデータをどう処理・連携するかの検討は、業務効率化を進めるうえで重要です。
その上で、AI-OCR(OCR)の検討ポイントをいくつか紹介します。

AI-OCR(OCR)は手書き文字が得意なものと、活字読み込みが得意なものがある

一つは、文字の認識精度です。AI-OCR(OCR)は、帳票中の手書き文字と活字の割合によって手書き文字の認識精度が高いとか、活字のほうが良い、ということがあります。

読み込みに影響するのは文字だけではなく、読み込む帳票のスタイルによっても変わってきます。帳票のどこに読み込む対象項目があるのか、はっきりしているのかしていないのか、罫線があったりなかったり、チェックや丸印などの特殊文字、押印があって重なっているところがあるとか、FAXでは擦れている部分がある等、細かく言うときりがありませんが、これらの要件のどれを優先するかです。

次に、帳票の種類も、AI-OCR(OCR)製品によって得意な分野があるものです。注文書、請求書、申込書の類、領収書など、読み込みたい帳票が何なのかというのは一つの製品選択のポイントになります。また、少量多品種な項目がたくさんあるもの、あるいは一種類の帳票しかないけれど、膨大な量を読み込まなければならない場合では、AI-OCR(OCR)ツール選択の際、どのようにツールを運用していくかで検討のポイントは変わってきます。同時に、求められるAI-OCR(OCR)の性能にも目を向けるべきでしょう。業界に特化した特殊な仕様の帳票などの場合は注意が必要です。

とはいえ、ほとんどのAI-OCR(OCR)製品では、試用ができたり、メーカーによっては読み取りのテストをしてもらえるものもありますから、ぜひ問い合わせてみましょう。そして、実際に読み取りたい帳票が、そのAI-OCR(OCR)ツールでどのくらい読み込めるものなのか、〇〇パーセント以上読めたら検討に値するなどと、基準を決めて比較選択をすすめていくと効率的です。

さて、AI-OCR(OCR)の特徴や性能の点での検討ポイントの次に考えたいのは、運用の点です。

文字認識エンジンだけの提供で十分か、読み取り前後の処理も検討

読み取り結果の確認と修正において、帳票のすべての項目―例えば1つの帳票に50項目あったとして―全部の項目を確認して、読み取り違いがあれば訂正しなければならないのか、数か所だけでよいのか、というのでも運用はかなり変わります。

AI-OCR(OCR)で読み取れる帳票と読み取りが困難な帳票というものもあり、見極めが必要です。また、読み取ってデータ化した後、RPAなど外部のシステムと連携がしやすいもの、しにくいもの、というのもあります。読み取りした後、どのような形でデータが吐き出されるか、ファイル生成がどのようなものか、など細かいところにも注目します。

AI-OCR(OCR)を利用して、業務効率化を目指すには、「帳票が読み取れた」というだけでなく、そのデータをどのように運用・活用するかが重要です。そして、どんなAI-OCR(OCR)ツールでも、読み取りは100%正確というわけではありません。読み取りエラーの場合は、人による確認が必ず入りますので、そのフローについても忘れず検討するべきです。AI-OCR(OCR)によっては、読み取り作業の前後に発生する処理もアプリで提供しているものもあります。

業務改善のプロが見る、AI-OCR(OCR)の特長

前段で説明したAI-OCR(OCR)の検討点を踏まえて、ここでは多数あるAI-OCR(OCR)製品の中で、業務効率化に有効なポイントを紹介します。

■ネットスマイル社:AIスキャンロボ

<特長>
・AIによる最適な読み取り箇所の解析
・帳票テンプレートの自動判別

どのAI-OCRでも帳票を読み取りする前にテンプレートを作成する必要がありますが、そのテンプレート定義にもAIが活用されている点が強みでしょう。「この帳票のどこにスキャンすべき項目があるか」を設定するのではなくて、AIが自動で判断します。複数ページや、多段明細も読み取り可能です。導入費用対効果では、読み取りの枚数課金となっており、項目数が多いほど導入の効果が大きくなります。

■株式会社たけびし:ファイルアーク Officeエディション 

<特長>
・活字だけでなく、バーコードやチェックボックスなども認識
・読み取ったデータを加工する機能も提供

文字認識エンジンとして、クラウドサービスを利用した文字認識(クラウドOCR)とスタンドアロンで動作する文字認識(オフラインOCR)を採用。
活字だけでなく、バーコード、チェックボックスの高精度な文字認識を実現します。
クラウド版では手書き文字認識が可能で、手書き文字認識においては、認識結果だけでなく、
認識信頼度を0~100%で取得できるため、認識結果のチェックも効率化が図れます。
また、抽出した文字データを、適切なデータ書式に加工してシステムに連携させることも可能です。

■ハンモック社:AnyFormOCR

<特長>
・OCRのエンジンが複数利用可能
・FAX受注業務に強み

OCRのエンジンが複数利用可能という点に注目です。OCRは一つのエンジンではなく、数字・文字用・手書き用のAI-OCRなどというように、複数のエンジンが用意されています。それらを組み合わせて読み取りの精度をあげるということができます。また、AIで読み取る項目を絞ると、従量課金のコストを抑えることができます。なお、同社はFAXでの注文書の業務効率化に長年取り組んできたため、FAX業務の知見に優れています。認識した文字の修正画面が提供されているのも特徴です。他のシステムへの連携など相談ができる点は心強いでしょう。

■インフォディオ社:スマートOCR

<特長>
・AIエンジンの導入形態がオンプレミス型とクラウド型の両方あり
・スマートフォン連携機能

業務で帳票を読み取る際に、セキュリティ制限でクラウド型が使えない場合、オンプレミス型も用意している点は大変有効です。このAI-OCR(OCR)も他社と同じように、フォーマットを自動認識します。加えて、スマートフォンアプリ機能もオプションで用意されています。領収書やレシートなどはスマートフォンで撮影してアップロードすると、経理部門がPCで確認してシステムに反映するなどの使い方ができます。

■PFU社:DynaEYE

<特長>
・スキャナーが自社製で認識率向上
・料金が従量課金ではなく、読み取り放題

検討のポイントで触れた通り、文字認識精度は、AI-OCR(OCR)ごとに得意・不得意があります。この製品は、読み取りのスキャナーを自社開発し、自社のAIエンジンと合わせて読み取りの認識率の向上を図っている点がポイントです。コストの点では、従量課金ではないため、読み取る量に制限はありません。買取かサブスクリプションでの利用選択が可能です。

■AI Inside社:DX Suite

<特長>
・学習済みのAI-OCRエンジンが利用可能
・読み取り結果などをAPI連携で次工程にパス

個社学習させることなく、同社が提供するAI-OCRエンジンを利用可能な点は、すぐに業務に利用でき、便利です。帳票画像や読み取り結果はAPI連携でRPAやアプリケーションなど、次工程への連携ができることもポイントです。2020年4月時点で、契約数がAI-OCR市場ナンバーワンを誇るツールです。

■Cogent Labs社:SmartRead

<特長>
・Tegakiで培ってきた独自のエンジンを継承した高い文字認識精度
・活字、定型、非定型帳票なども読み取り可能
・読み取った書類は自動で仕分けることができ、情報の整理をすることが可能
・APIでシステム連携、CSVやエクセルで抽出も可能

OCR・ディープラーニングを活用した独自のアルゴリズムを利用し、平仮名、片仮名、漢字、数字、アルファベット、記号などさまざまな手書き文字を認識することに長けています。また、デジタル化されたデータはAPI連携で自社システムやCSV、エクセルへ抽出もできます。

AI-OCR(OCR)とRPAの連携で業務効率を上げる

ここまで、手書きや印刷された帳票情報を速やかにデータ化するAI-OCR(OCR)について紹介しましたが、業務効率をさらに高めるために連携させるツールとして、RPAがあります。

Autoジョブ名人のAI-OCR(OCR)連携に有効な機能について紹介します。

■パラメータデータセットアップ

<特長>
・OCRから出力された読み取り結果を連携ファイルとして登録可能

一般的なRPAではAI-OCR(OCR)から出力された読み取り結果をCSVに変換し、エクセルを立ち上げ、CSVの内容をコピーしてから連携するシステムに入力する、というシナリオになります。しかし、Autoジョブ名人の「パラメータデータセットアップ」機能であれば、読み取り結果をダイレクトにファイルとして登録可能です。これにより、RPAがエクセルに転記するというシナリオは不要となり、シームレスな連携が実現できます。

Autoジョブ名人のパラメータデータセットアップ ウィンドウ
Autoジョブ名人 パラメータデータセットアップ

■データ変換オプション

<特長>
OCR読み取り結果のマッピング、項目追加 マスタ参照、計算機能を提供

読み取った項目を補完する機能で評価が高いのは、マッピングや計算機能です。RPAが作業できる領域を広げ、人手による作業を減らすことができる点がポイントです。

Autoジョブ名人のデータ変換オプション
Autoジョブ名人 データ変換オプション マッピング設定

これらの機能やオプションを利用して業務における人による工数をいかに削減していくか、また、運用面でも、AI-OCR(OCR)の読み取り完了をトリガーとしてRPAを実行し、業務をどんどん先に進めることも、Autoジョブ名人では可能です。

業務効率化を推進する「失敗しないRPA選定ポイント」

業務効率向上に効果的なAI-OCR(OCR)とRPAについて述べてきました。様々な製品が出ている中で機能はどんどん高性能になり、比較検討が難しいと思われることもあるでしょう。

その中で、ユーザックシステムが取得した業務効率化に関するアンケートにおいて、RPAに関する設問が参考になるので紹介します。

Q:RPAを導入して、業務効率化は達成されましたか?

A:回答の4割以上が「達成できなかった」

回答を分析してみると、RPAを選定の際に、どのような点に重きを置いているかがキーになっていると感じます。

達成できなかったという回答をした方の選定ポイントとしては「導入コストの安さ」と「シナリオがいかに簡単に作れるか」という点が多く見られます。また、導入前に、自動化したい業務が何なのか、それがRPAで対応できるのか(RPAの性能)、というところまで検討されているという回答も見受けられましたが、それだけでは物足りません。

業務効率を上げるということは、将来的にビジネスの成功にかかわってきます。変化の激しいビジネス環境において、AI-OCR(OCR)やRPAをいち早く取り入れ、とにかく回す、という考えもあります。そういう場合には、スモールスタートできるツールというのは評価できます。

しかし、ツールを利用し続け、他の業務にも展開していくとなったときに、ライセンス体系の違いからコスト面で大きな違いが出てくるのを忘れてはいけません。また、シナリオの作りやすさという点でも、自動化する業務がどんなものか、RPAを利活用する、あるいは管理する部署との連携も想定しておくことができればよいでしょう。

RPAを導入して業務効率化が達成できた企業は、これらに加えて2点、RPA検討材料に入れています。

1.RPAの稼働安定性
2.保守・サポート体制の範囲

1.は、RPAの性能に由来します。どのような思想に基づいてそのRPAが提供されているかというところです。Autoジョブ名人は、基幹システムとの連携に多くの実績を持つRPAですので、「止めてはならない業務」に力を発揮します。稼働の安定性を担保しているタグ解析は、多くのRPAが採用している画像認識に比べてRPAの処理がエラーで止まるということがかなり抑えられます

2.については、RPAを導入後、業務現場で運用管理をするのが普通ですが、万が一の際には、頼れるところがあると安心です。RPAメーカーが手厚く保守―シナリオ作成で不明な点や難しいところが出てきた、原因が追えないエラーがある、など―をしている、導入するときには考えもしなかったことが起こった場合や、定期的なバージョンアップセミナーがある、ユーザー同士で情報交換ができる場がある、などもポイントです。 

ユーザックシステムでは、RPAというまだまだ成長し続ける製品を提供する側として業務効率を上げるための工夫や提案を発信していきます。

関連リンク

≫OCR×RPA連携記事はこちらから

≫3分でわかるRPAのキホン