Document Processor
はじめに
このチュートリアルでは、CatalystでAI/ML機能を活用してスキャンされたドキュメントや画像から特定のデータを検出、処理、抽出するDocument Processor Reactアプリケーションを構築します。このチュートリアルで構築するDocument Processorアプリケーションは、以下の機能を備えています。
-
スキャンされたデジタルドキュメントや画像内の手書きまたは印刷されたテキストを認識し、機械可読形式(JSONレスポンス)に変換します。
-
印刷されたバーコード(1Dおよび2D形式)をスキャンし、エンコードされた情報を抽出します。
-
PAN、AADHAARなどのデジタル身分証明書、通帳や小切手を含むドキュメントをスキャン・処理し、それらのドキュメントからフィールドレコードを抽出します。なお、PANとAADHAARはインド地域固有の身分証明書です。
クライアントアプリケーションは以下のように表示されます。
動作するアプリケーションにアクセスして機能をテストできます: アプリを試す!
Document Processorアプリケーションは、以下のCatalystサービスとそのコンポーネントを活用しています。
-
- Functions: Advanced I/O functionをNode.jsでコーディングします。入力ドキュメントや画像からデータを処理・抽出するロジックが含まれています。この目的のために、Catalyst Zia Services Node.js SDKパッケージを活用しています。
-
- Web Client Hosting: このチュートリアルでは、組み込みのCatalystプラグインを使用して、WebクライアントをReactアプリケーションとして作成・初期化します。クライアントアプリケーションはWeb Client Hostingを使用してCatalystにホスティングされます。
-
-
OCR: このコンポーネントは、入力されたデジタルドキュメントや画像内のテキスト文字を検出・認識し、機械エンコードされたテキストに変換します。Catalyst OCRは主要10言語のテキストを認識できます。
-
Barcode Scanner: このコンポーネントは、バーコードをスキャンしてエンコードされた情報を抽出します。サポートされているバーコード形式の詳細については、こちらのページをご覧ください。
-
Identity Scanner: Identity Scannerコンポーネントは、AADHAARカード、PANカード、銀行通帳、小切手などの一般的な身分証明書からデータをスキャン・抽出できます。サポートされている言語、ファイル形式、ファイルサイズの詳細については、こちらのページをご参照ください。
-
このアプリケーションの構築には、Catalyst WebコンソールとCatalystコマンドラインインターフェース(CLI)を使用します。
チュートリアルのコードはこちらのgitリポジトリから取得できます。Functionとクライアントの設定セクションの指示に従って、プロジェクトディレクトリ内のファイルを置き換える必要があります。
最終更新日 2026-03-05 11:43:24 +0530 IST
