お知らせ:

当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Document Processor

はじめに

このチュートリアルでは、CatalystでAI/ML機能を活用してスキャンされたドキュメントや画像から特定のデータを検出、処理、抽出するDocument Processor Reactアプリケーションを構築します。このチュートリアルで構築するDocument Processorアプリケーションは、以下の機能を備えています。

  1. スキャンされたデジタルドキュメントや画像内の手書きまたは印刷されたテキストを認識し、機械可読形式(JSONレスポンス)に変換します。

  2. 印刷されたバーコード(1Dおよび2D形式)をスキャンし、エンコードされた情報を抽出します。

  3. PAN、AADHAARなどのデジタル身分証明書、通帳や小切手を含むドキュメントをスキャン・処理し、それらのドキュメントからフィールドレコードを抽出します。なお、PANとAADHAARはインド地域固有の身分証明書です。

Note : PANとAADHAARはインド地域固有の身分証明書です。

クライアントアプリケーションは以下のように表示されます。

local-hosted

動作するアプリケーションにアクセスして機能をテストできます: アプリを試す!

Document Processorアプリケーションは、以下のCatalystサービスとそのコンポーネントを活用しています。

  1. Catalyst Serverless

  2. Catalyst Cloud Scale

    • Web Client Hosting: このチュートリアルでは、組み込みのCatalystプラグインを使用して、WebクライアントをReactアプリケーションとして作成・初期化します。クライアントアプリケーションはWeb Client Hostingを使用してCatalystにホスティングされます。
  3. Catalyst Zia Services

    • OCR: このコンポーネントは、入力されたデジタルドキュメントや画像内のテキスト文字を検出・認識し、機械エンコードされたテキストに変換します。Catalyst OCRは主要10言語のテキストを認識できます。

    • Barcode Scanner: このコンポーネントは、バーコードをスキャンしてエンコードされた情報を抽出します。サポートされているバーコード形式の詳細については、こちらのページをご覧ください。

    • Identity Scanner: Identity Scannerコンポーネントは、AADHAARカード、PANカード、銀行通帳、小切手などの一般的な身分証明書からデータをスキャン・抽出できます。サポートされている言語、ファイル形式、ファイルサイズの詳細については、こちらのページをご参照ください。

このアプリケーションの構築には、Catalyst WebコンソールCatalystコマンドラインインターフェース(CLI)を使用します。

チュートリアルのコードはこちらのgitリポジトリから取得できます。Functionクライアントの設定セクションの指示に従って、プロジェクトディレクトリ内のファイルを置き換える必要があります。

最終更新日 2026-03-05 11:43:24 +0530 IST

最短完了時間:

20 mins

難易度:

Beginner

関連サービス

Serverless Cloud Scale Zia Services