日本未上陸のAmazon Textractとは?魅力や使い方をご紹介
この記事を読むと、以下の3つのことがわかります。
1.Amazon Textractとは何なのか
2.Amazon Textractの使い方やメリット
3.OCRを導入するメリットとデメリット
手書きや紙媒体の書類をデータ化したい時に活躍するAmazon Textract。残念ながら日本語は未対応ですが、Amazonにもドキュメント分析サービスがあるのです。
Amazon Textractがあれば事務処理の一部を機械に任せられるため業務の効率化になったり、ペーパーレス化の促進につながったります。「日本版も早く対応してほしい!」という声もあるAmazon Textractの特徴や使い方、魅力を解説します。
Amazon Textractとはドキュメント用分析サービスのこと
Amazon Textractは、手書きの文字やデータを自動的に抽出する機械学習サービスです。AWS(Amazon Web Services)が提供するサービスの1つで、かつては承認制でしたが海外で一般公開されるようになりました。
国内でも手書き文字などをデータ化する「OCRソフトウェア」がありますが、Amazon TextractはAIが搭載されており、より複雑な文書もデータ化できます。AWSを基盤とした堅牢なデータプライバシーもあり、機密性の高い資料も安心です。
言語については後述しますが限られており、まだ日本語には対応していません。(2021年1月時点)クラウド上で動作するため、ソフトウェアをインストールする必要はなく簡単に利用できます。(要契約)
Amazon Textractの利用方法や対応言語、魅力を解説します。
利用方法
Amazon Textractはクラウドサービスなので、ソフトなどは必要ありません。Amazon Textractの契約とインターネット環境、データ化したい文書があればどこからでも利用できます。
手順は以下の通りです。
・AWSのAmazon Textractページにアクセスする
アクセスページはこちら:https://aws.amazon.com/jp/textract/
・サインアップする
・[ドキュメントのアップロード]から、分析したいファイルをアップロードする
Amazon Textractは上記の手順のみで利用できます。OCRソフトにありがちな事前設定などもなく、大変手軽に利用できるのもAmazon Textractの魅力です。
対応言語【日本非対応】
Amazon Textractは標準的な英語や、世界中で基本的な文字コードとされるASCIIという文字コードを使用した文字の検出が可能です。対応言語については、以下の通りとなっています。(2022年1月時点)
・スペイン語
・イタリア語
・フランス語
・ポルトガル語
・ドイツ語
(※1)
また手書きや請求書、領収書の処理については英語のみの対応です。日本語のデータをAmazon Textractで分析させると、無理やりローマ字読みになったりエラーを起こしたりするのでまだ実用性はありません。
サポート形式も豊富
Amazon Textractのサポート形式は、以下の通りです。
・PDF
・JPG
・PNG
(※1)
上記のファイル形式をサポートしているので、例えば手書きの文書をデータ化したい場合は、スキャナで読み取りPDFデータにすることで分析できます。
Amazon Textractの魅力
Amazon Textractの魅力は、主に以下の3つが挙げられます。
・初心者も簡単に利用できる
・コストパフォーマンスが良い
・機能性が高い
順番に解説します。
初心者も簡単に利用できる
まずAmazon Textractが承認制になったことで、技術者でなくても気軽に利用できるようになりました。前述したようにAmazon Textractのサイトにアクセスして該当データをアップロードすれば分析してくれるので、高度な技術は必要ありません。
コストパフォーマンスが良い
Amazon Textractは従量課金制であり、使った分だけを支払うシステムです。そのため「月額で契約したのに、結局ほぼ使わなかった」と無駄にならない点も魅力です。またAmazon TextractはAWSの無料枠に含まれており、AWSの新規利用者なら3か月間無料で利用できます。
Amazon Textractには4つのプランがあり、それぞれで料金が異なります。まず活字と手書き文字だけを認識する「Detect Document Text API」は0.0015ドル/ページです。(100万ページまで)
またAnalyze Document APIはフォーム用の「Analyze Document API」、請求書や請求書IDを分析する「Analyze Expense API」の2種類あり、料金があり料金が異なります。前者が0.015ドル/ページ、後者が0.05ドル/ページです。(100万ページまで)
また米国のパスポートや運転免許証といった身分証も分析する「Analyze ID API」は0.025ドル/ページです。
また上記は米国東部(オハイオ)の料金で、地域によって金額は異なります。詳しくは、Amazon Textractの「料金」をご参照ください。
Amazon Textract 料金ページはこちら:https://aws.amazon.com/jp/textract/pricing/
機能性が高い
Amazon TextractはOCR(光学文字認識)技術がベースですが、機械学習によってさらに機能性が高い点も魅力です。機能性を誇る理由の1つが表や書式といった構造化された書類の分析で、表内の文字なども高い認識力で分析できます。
性能が高くないOCRは、白抜き文字や表内の文字、イレギュラーな段落など複雑な文書を正確に分析できません。また表や図、写真まで分析できるOCRソフトは高額になりがちで、予算で諦めるケースも多いものです。
その点Amazon Textractは表などの分析もでき、従量課金制なので無駄なコストもかかりません。
読み取り性能を上げるポイント
OCRによる文書の読み取りはまだ人間と同レベルとはいかず、読み取りに失敗することも珍しくありません。Amazon Textractの場合は、最良の結果を得るために以下のポイントを推奨しています。
・150dpi以上の、なるべく高画質なデータを用意する。
・Amazon Textractがサポートしている形式(PDF、JPG、PNG)のみのデータを使い、アップロード前に変換や低解像度処理を行わない
・ドキュメント内に表がある場合、その周辺から視覚的にきちんと分離しているデータを使う
(※2)
元の画像を高画質なものにするというのが、読み取り性能を上げる最大のポイントです。また表の読み取りなど複雑な要素がある場合、機械が理解しやすいよう工夫する必要があります。
例えば元データである画像が白紙ではなく、会社のロゴや模様が全面にプリントされているデータは避けるといった対策が考えられます。
Amazon Textractも搭載するOCRとは?
最後に、Amazon TextractがベースとしているOCRについてご紹介します。OCR技術を使うことで、大幅な業務効率の改善が期待できるでしょう。
OCRとは光学文字認識機能のこと
OCRとはOptical Character Readerの略で、画像データを機械で分析して文字データに変換する技術です。日本語では光学文字認識機能といわれます。
一般的なOCRソフトはまず画像処理から行い、データの中から読み取り対象となる文字を探し出して1文字ごとに切り出します。次に切り出した文字を識別して判定し、そして電子データに変換して入力しているのです。
業務にOCRを導入するメリット・デメリット
業務にOCRを導入するメリットは、以下の3つです。
・データ入力を効率化できる
・入力ミスの削減につながる
・データ化することで情報が管理しやすくなる
OCRの最大のメリットといえば、データ入力の効率化です。元となるデータさえあれば機械が勝手に文書をデータ化してくれるので、人の手間がかかりません。事務作業の効率化になり、働き方改革に直結します。
また人が入力するとどうしてもヒューマンエラーが起こりますが、機械には入力間違いもありません。引継ぎや欠席などもなく、貴重な戦力となってくれるでしょう。
社内に散在する文書がデータ化されれば一元管理でき、検索も簡単になります。ペーパーレス化にもつながり、より快適になる点も魅力です。
業務にOCRを導入するデメリットは、以下の3つです。
・導入にコストがかかる
・元データによって分析できないものがある
OCRソフトは高額なものもあり、予算の都合上導入できない企業も少なくありません。Amazon Textractのように従量課金制なら使った分しか料金が発生しないので、コスト削減につながります。
またOCRの技術は日々向上していますが、やはり認識率は100%とはいきません。結果が芳しくない場合は人がやり直す場合もあり、二度手間となるリスクもあります。またデータ形式やフォーマットが非対応なら、分析自体できません。この点は人に比べて劣る点となります。
Amazonが提供するAmazon Textractについて、その使い方や魅力、OCRの概要についてご紹介しました。日本未対応のAmazon Textractですが、AWSサービスの1つとして注目する技術者も少なくありません。AWSの機械学習サービスですから、性能の高さも期待できるでしょう。
はやく日本語に対応して、日本の文書を分析してみたいですね。
大手ゼネコンBIM活用事例と 建設業界のDXについてまとめた ホワイトペーパー配布中!
❶大手ゼネコンのBIM活用事例
❷BIMを活かすためのツール紹介
❸DXレポートについて
❹建設業界におけるDX
▼キャパの公式Twitter・FacebookではITに関する情報を随時更新しています!
参照サイト:
※1 https://aws.amazon.com/jp/textract/faqs/
※2 どうすれば Amazon Textract から最良の結果を得ることができますか?