ニュースリリース

業務効率を大幅改善する文字認識サービスの機能強化版の提供を開始
~ 文字認識とRPAの連携で働き方改革を強力にサポート ~

2019年1月31日

東芝デジタルソリューションズ株式会社

 東芝デジタルソリューションズ株式会社(以下、当社)は、読み取り位置を事前に設定しなくても、受発注伝票や見積書などさまざまな書式・レイアウトの非定型文書から、必要な項目を探し出して読み取る文字認識サービスを商品化し、本日から販売を開始します。

 近年OCR(光学的文字認識)は、認識精度の向上など技術的な進化と、RPA(ソフトウェアロボット)との組み合せによる業務効率化への期待の両面から注目されています。しかし従来のOCRは、専用帳票を作成し、読み取り位置などの詳細定義が必要でした。そのため、実際に業務で扱われる紙文書の多くをOCR帳票化することは運用面から難しく、特に、さまざまな取引先から届く請求書のように書式のバリエーションが多岐にわたる場合、すべての書式を定義することは困難でした。

 今回商品化した文字認識サービスは、専用のスキャナは不要で、オフィスの複合機などで作成した紙文書のイメージデータから、簡単な操作で必要な文字を認識するサービスです。面倒な読み取り位置の詳細定義は不要で、キーワード(読み取りたい項目)を登録するだけで該当する項目を探して活字を読み取るので、さまざまな書式の非定型文書で利用可能です(図1)。特に「請求書」については、合計金額や請求番号などの主なキーワード注1を事前登録(プリセット)してあるのですぐに利用でき、合計金額・総合計・御合計などの言葉の「ゆらぎ」にも対応しています。もちろん定型文書にも対応しており、読み取り位置をマウス操作で簡単に設定でき、活字だけでなく手書きも読み取ります。さらに、複数の文書をまとめて処理する一括読み取りや、読取後のチェック・訂正の利便性も強化しました。利用形態も、クラウドサービス、オンプレミス注2、API注3を選択可能です。

文字認識サービスの主な特長

➀ 非定型文書から該当項目を探し出して活字を読み取り(項目サーチ機能)
あらかじめキーワード(読み取りたい項目)を登録するだけで、受発注伝票や見積書などさまざまな書式・レイアウトの非定型文書から該当項目を自動で探して活字を読み取ります。
➁ 「請求書」は、キーワードの事前登録が不要で活字を自動読み取り(項目プリセット)
非定型文書の内、とりわけ扱う機会が多い「請求書」については、合計金額・差出元・請求書番号など必要なキーワード項目があらかじめ登録されていますのですぐに利用できます。しかも、合計金額、総合計、御合計など言葉の「ゆらぎ」にも対応しています。
➂ 定型文書の手書き・活字の読み取り
書式が同一な定型文章の場合は、読み取り位置をマウス操作で簡単に登録でき、活字だけでなく手書きの読み取りも行います。
➃ 3つの利用形態を選択可能
クラウドサービス、オンプレミス、APIの3つの利用形態を選択可能です。

 当社の文字認識サービスは、お客さまの運用に応じて3つの読み取りモード(非定型文書、定型文書、請求書)と3つの利用形態(クラウドサービス、オンプレミス、API)を提供し、請求書支払や申込書登録など紙文書を用いた幅広いオフィス業務に柔軟に対応できます。当社は今後も、帳票識別や画像処理に学習機能を取り入れるなど、幅広いバリエーションの帳票・紙文書を精度よく読み取れるよう強化していきます。

  • 注1 請求書の自動読み取り:宛先、差出元、合計金額、消費税額、銀行口座番号、請求書番号、請求日付の7項目を自動で読み取ることが可能です。
  • 注2 オンプレミスは今後提供予定です。
  • 注3 API:Application Programming Interface
図1 項目サーチ機能(非定型文書から該当項目を探し出して活字を読み取り) 図1 項目サーチ機能(非定型文書から該当項目を探し出して活字を読み取り)

図1 項目サーチ機能(非定型文書から該当項目を探し出して活字を読み取り)

以上