DXやオフィスのペーパーレス化の強力なツールとして多くの企業で導入されている、AI-OCR。従来のパッケージ販売されているOCRソフトやPDFに標準搭載されているOCRには無いメリットや機能が注目されている一方、「AI-OCRのサブスクリプションを辞めた」「思ったよりAI-OCRが使えなかった」という声も徐々に出てきています。
2022年6月にハンモック社が実施したAI-OCR導入企業向けのアンケートによると、導入企業の実に8割近くが「AI-OCRに課題を感じている」と回答しています。何故このようなお声が出てしまうのでしょうか。
AIという言葉から完璧さを想像してしまいがちですが、実はAI-OCRにも苦手分野やデメリットがあります。10年以上に渡ってOCRサービスを提供してきたそのままスキャンが解説しましょう。
Table of Contents
AI-OCRとは?
AI-OCRとは、OCRにAI(人工知能)エンジンを搭載したOCRのことを指します。
従来のOCRソフトは主にパッケージとして販売されてきており、予め対応する文字に上限がありました。また基本的に読み取りが出来る文字はボーンデジタルが中心で、手書き文字への精度は非常に厳しいレベルとなっていました。
一方AI-OCRはAIエンジンが都度入力される文字を学習し、徐々に精度が上がっていくのが最大の特徴です。特に従来のOCRソフトでは対応出来なかった癖の強い手書き文字の読み取りに効果を発揮しており、これまで書類や紙文書へ手書きで書き込むことが多かった企業やシーンでも導入することが出来るようになりました。更にAI-OCRは多くがクラウドサービスのため、デバイスの紐付けや場所の制約を受ける心配がありません。
以上がAI-OCRのメリットであり、普及してきた理由です。では何故、最近になって「AI-OCRは使えない」という声が出てくるようになったのでしょうか。
AI-OCRが「使えない」とされてしまう理由
前提としてAI-OCRには沢山のメリットがあり、導入することは大小関わらず何らかの恩恵を企業にもたらしてくれます。しかし、次のようなAI-OCRの苦手な部分、デメリットも認識しておく必要があります。
定型化された書類が想定されている
AI-OCRは主にオフィスの業務効率化やDX化を目的としたソフトです。オフィスで最も発生する紙文書は帳票類、具体的には請求書や領収書、見積書のほか、工場などの現場で作業員が作成する報告書なども頻繁に発生する書類です。
フォーマットのことを定型とも呼びますが、AI-OCRは文字を読み込む前に予め定型を利用者側で設定することが必要です。上記のように定型が決まっている書類は読み取りやすい一方、非定型の資料、例えばフリーフォームのアンケートや調査票のように形が定まっていない資料の読み取りは苦手としています。
精度にバラつきがある
先出のハンモック社の調査で、AI-OCR導入後に最も課題として挙げられていたのが「確認作業の手間がなくならない」「文字認識の精度が低い」というものでした。つまり精度への不安・不満です。
多くのAI-OCRが手書き文字の読み取りに対応していますが、実際にはケースによって殆ど認識出来ない場合も少なくありません。もちろん使い続けることで精度は上がりますが、『どんな手書きでも正確に文字認識してくれる!』と期待していた方にとっては『意外とAI-OCRって使えないんだなぁ・・・』と思ってしまうかも知れません。
当然AI-OCRの開発側でもこの点は認識しており、サービスによってはAI-OCRで読み取った後に目視で校正までしてくれるところもあります。しかし作業員を挟む分コストは高くなりがちなので、予算との兼ね合いになるでしょう。
これはAI-OCRに限らずOCR一般に言えることですが、HPや広告で『精度●●.●%以上!』と書かれていても、あくまで「大体の目安」程度に考えることをオススメします。
セキュリティヘの懸念
AI-OCRは多くがクラウド型のサービスになります。これは大きなメリットである一方、社内規定やセキュリティ的な理由からクラウドサービスを簡単に導入出来ない企業も少なくないのではないでしょうか。
折角高精度でもこの部分がネックになり、従来のOCRサービスへ依頼するというケースもあります。もっともこちらに関してもサービス側によっては対応が進んでおり、顧客のサーバーに直接インストールする「オンプレミス型」のAI-OCRも続々とリリースされています。
操作への慣れに時間がかかる
これはAI-OCRに限りませんが、クラウドサービスはサービスによって仕様やUIが異なるため慣れるまでに時間が必要です。下手に運用すると『むしろ業務スピードは導入してから遅くなった』ということも。
設定を間違えたまま読み取りを開始してしまい、最初からやり直しになった・・・などとならないよう、導入直後は丁寧に操作する必要があります。
費用対効果(コストパフォーマンス)
AI-OCRは通常月額制です。『毎月定額』と言われるとお得な気がしますが、毎日大量の書類が発生する大企業ならともかく、月によって発行する書類の数量に差がある場合「あまり使わなかった月」も同じ費用を支払うのはなるべく避けたいですよね。
OCRサービスの中には、OCR処理を「代行」してくれる業者も存在します(後述)。この場合は「使う分だけ払いきり」なので、毎月決まった量が出る訳ではない・一時的に大量のOCRが必要な時がある企業の方はOCR処理の代行サービスを利用することをオススメします。
縦書きの書籍に対応していない場合がある
AI-OCRは当初、横書きの英語圏で開発が先行していた技術です。数年前まで縦書きの日本語に対応したAI-OCRは多くありませんでしたが、2023年現在は縦書きの読み取りも可能なAI-OCRが登場しています。
ただしAI-OCR一般の傾向として、やはり横書きの定形フォーマットを最も得意とする点は変わりません。サービスによっては縦書きの読み取りに対応していない場合もあるので、導入を検討する際に必ず確認するようにしましょう。
AI-OCRが向いているシーンとは?
以上紹介したように、AI-OCRには導入する上で気を付けておかなければならないポイントが複数あります。では導入しない方が良いのかと言えば勿論そんなことはありません。
次からはAI-OCRが向いているシーンを紹介しましょう。
定形フォーマットの書類が大量に発生する
繰り返しになりますが、AI-OCRの技術力が最大に発揮されるのはフォーマットが決まっている帳票類などの書類です。これまでペンで直接書き込んだ書類を手入力でExcel等に反映していた企業の方は多いと思いますが、AI-OCRはまさにこうしたケースに最適。
それまで派遣社員や事務員が、中小企業ならフロント部署自ら地道に入力していた手書きの情報が一瞬で文字データに変換させることは、控えめに言っても革命的ですね。
DX、RPAの一環として考えている
OCR処理という技術は意外に古く、1914年に文字列を読み取って電気符号に変換する機械が発明されたことに端を発します。2023年現在、OCR処理はAIを取り入れるまでに大きく進化していますが、「画像データ上に見える文字を読み取り、文字データを付与する」という仕組みそれ自体は従来のOCRソフトの延長とも言えます。
では何故AI-OCRがここまで話題になっているのかというと、RPAなどのシステムと連携させることで業務フローの自動化・DX化が出来るからです。例えば、PDF化した手書きの報告書をAI-OCRでテキストデータ化し、そのデータを更にCRMなどのシステムへ自動的に登録するフローを確立すれば、劇的な作業効率の改善が見込めます。このように、AI-OCRは単なる文字のデータ化だけでなく、業務一連のオペレーションに組み込むことで最大の効果を発揮することが出来るのです。
従来型のOCR代行サービスが便利な場合は?
AI-OCRは精度やコストパフォーマンス等の面で課題があるものの、いずれも今後改善されていくことは間違いないでしょう。
一方でAI-OCR以前より普及しているOCR代行サービスにも、AI-OCRには無い様々なメリットがあります。なお、ここでの「OCR代行」は、書類や書籍を送るとあなたに代わってOCR処理を代行してくれるサービスのことを指します。課題によってはむしろこちらの方が良い場合もあるので参考にしてみてください。
書籍にOCRを施したい
特に研究者や出版社の方、企業の広報部所属の方などは「書籍の文字データ(原稿データ)が欲しい」と考えたことのあるのでは無いでしょうか。日本で開発されてきた従来のOCRソフトは縦書きが多い日本語の書籍に強さを発揮するため、AI-OCRの登場以前からデータ分析用、出版データ作成用、シンプルな検索用など様々な用途で活用されてきました。
先述したように、現在は縦書き対応のAI-OCRも増えてきたためこの点の優位性は年々弱くなっています。しかし書籍の場合、精度とは別に考えなければならないことがあります。それは、電子化作業です。
書類のような、いわゆる一枚もののペラ紙は会社の複合機でも電子化が可能です。しかし書籍のような本に厚みのある資料は複合機でのスキャンが中々難しいですよね。AI-OCRに限らず、OCR処理は文字を認識する上で「スキャン画像が鮮明であること」が極めて重要で、OCR代行を担う業者では書籍専用のスキャナーを使うことが一般的です。
このスキャナーを購入することは簡単です。しかし書類と違って頻繁に電子化する機会がある訳ではないでしょうし、非破壊スキャンの場合1ページずつ電子化するのは(仮に1冊だけだとしても)膨大な時間がかかってしまいます。つまり、書籍へOCR処理を施すことは全体的に書類よりもハードルが高いのです。
そのままスキャンでは、10年以上に渡って大学、出版社様他あらゆる法人様の書籍のOCR処理を代行してきました。書籍専用だけで4機種以上という豊富な業務用スキャナーと、国内製OCRソフトに独自の校正システムを活用した高精度なOCR処理で、企業様が保管する貴重な書籍や冊子を「使えるデータ」にさせていただきます。
OCRサービスはこちらからご覧ください。
スキャナーや人員が不足している
AI-OCRは確かに素晴らしい技術ですが、大前提として対象資料がPDFや画像等にデータ化されている必要があります。しかし日々発生する大量の書類を社内で逐一スキャンすることは、それこそ業務効率の大きな妨げになります。
複合機ではなく卓上タイプのADFを導入しているオフィスの方もいらっしゃるかと思いますが、それでもスキャンを内製化するのは大きなリソースの負担となる筈です。まして、OCR処理後のチェック作業まで行うのは出来れば避けたいところ。一方いわゆるOCR代行サービスでは、業務用の自動スキャナーなど電子化に必要な機材は全て揃っている上、OCR処理、更にOCR処理後のチェック作業まで全てワンストップで代行してくれます。
もちろん料金は一回のご依頼毎に発生するのみなので、OCR処理が必要ない時期に月額費用等を支払う必要は一切ありません。「必要な時に必要な分だけ」OCR処理をしたいという方は、OCR代行サービスも選択肢の一つに入れてみてはいかがでしょうか。
そのままスキャンのOCR代行サービスこちらから。
「AI-OCRは使えない!」と言い切る前に
本稿ではAI-OCR導入における課題・注意点と、従来のOCR代行サービスとの比較について解説してきました。今後もAI-OCRの活用シーンは飛躍的に拡大し続けると思われますが、完璧な精度を前提に導入を検討すると「期待はずれ」に感じてしまうかも知れません。一方でケースによっては従来のOCR代行サービスに依頼した方がお得でもあります。
AI-OCRの導入を検討中の方、既に使っている方のご参考になれば幸いです!