主要な概念
Identity Scannerのユースケースと実装について学ぶ前に、その基本的な概念を詳しく理解することが重要です。
E-KYC
Identity ScannerのE-KYCまたはFacial Comparison機能は、2つの異なる画像で検出された顔の特徴の一致を比較します。比較のために提供される2つの画像は、ソース画像とクエリ画像と呼ばれます。Identity Scanningの場合、1つは個人のIDの証明書で検出された画像であり、もう1つはその人物の新しいまたは既存の写真です。
-
IDの証明書または既存の写真のいずれかをソースまたはクエリ画像として処理できます。これは結果に影響しません。
-
既存の写真に複数の人物が含まれている場合、Ziaは画像内で最も目立つ顔を自動的に検出し、Identity Scanningのために処理します。そのため、人物のIDの証明書を、その人物の明確な個人写真と比較してください。
Facial Comparisonプロセス
Zia AIは、さまざまな最先端のオブジェクト検出、画像分析、パターン認識モデルを実装しています。一般的なFacial Comparisonプロセスは、以下のサブタスクに分けることができます。
-
顔検出: 顔検出は顔認識プロセスの重要な部分であり、実際にはオブジェクト検出のサブセットです。これは顔認識に向けた最初のステップです。基盤となるアルゴリズムは、画像内の顔を背景からセグメント化し、画像内の座標を特定することで検出します。
-
顔ランドマーク検出: 顔ランドマーキングは、顔を認識するために顔上の特定のキーポイント特徴を検出し、位置を特定するプロセスです。これには、目の間の距離、顔の長さ、顔の端点、唇・耳・あごの輪郭、頬骨の形状と位置などのキーポイントの座標の特定が含まれます。
-
顔分析: Facial Comparisonは、基本的にクエリ画像で検出された顔をトレーニングセットやデータベースと比較して、個人の身元を確認することを含みます。Zia Facial Comparisonの場合、クエリ画像とソース画像で検出された顔が分析されます。両方の顔の分析データから特定されたフェイスプリントが互いに比較され、一致の程度が確認されます。Ziaが返すconfidence scoreは、このデータに対応しています。
1つ以上の顔検出および顔認識方法に属するさまざまなMLおよびディープラーニングアルゴリズムが、これらの操作の実行に使用できます。これには、テンプレートマッチングなどの幾何学的またはフィーチャーベースのアプローチ、EigenfaceまたはLDAを使用したPCA、Fisherfaceアルゴリズム、ニューラルネットワークの実装などのアルゴリズムや手法を含む外観または統計ベースのアプローチが含まれます。
リクエスト形式
E-KYCまたはFacial Comparisonの入力ファイル形式は以下に指定されています。
| Identity Scannerタイプ | サポートされるファイル形式 | ファイルサイズ制限 |
|---|---|---|
| E-KYC | ソース画像とクエリ画像の両方は、以下の形式のみである必要があります: .webp/.jpeg .png | 各画像10 MB |
レスポンス形式
E-KYCまたはFacial Comparisonのレスポンス形式は以下のとおりです。
- SDKおよびAPIを使用する場合:
JSON response: デフォルトのJSON responseには、ステータスメッセージと操作のデータが含まれます。Facial Comparisonは、顔が一致するかどうかのバイナリレスポンスを返します。顔が一致する場合、結果はtrueに設定され、一致しない場合はfalseに設定されます。JSON responseには、0から1の範囲のconfidence scoreが含まれます。比較が50%(つまり0.5)を超えるconfidence scoreを生成した場合にのみ、結果がtrueに設定されます。詳細については、Java、Node.js、Python SDK、およびAPIドキュメントを参照してください。 - コンソールの場合:
コンソールでテスト用に画像やファイルをアップロードすると、2つの形式でレスポンスが返されます。
- 簡略化されたレスポンス: 結果に基づいて「Faces matched!」または「Faces not matched!」というメッセージが表示され、比較のconfidence scoreがパーセンテージ値で表示されます。
- JSON response: コンソールには、操作に対して受信した元のJSON responseも表示されます。
書類処理
テキスト認識と情報抽出プロセス
本人確認書類からのテキスト検出、認識、抽出は、高度なOCRシステムによって処理されます。一般的にOCRシステムは、プロセスにトップダウンアプローチを採用しています。
サポートされている書類がIdentity Scannerに送信されると、テキスト検出と認識プロセスは以下のように進行します。
- Ziaはテキストの構造を分析し、個々のテキスト行に分割します。
- テキスト行はさらに単語に分解され、各単語は個々の文字に分解されます。
- Ziaは検出した文字をデータセットと比較し、高度なアルゴリズムを実行して文字を特定し、文字のグループに基づいて単語を認識します。
- ZiaはICRを使用して確率と仮説の大量のデータを処理し、コンテンツの言語を特定するアルゴリズムも実行します。書類の言語を追加で指定することもできます。これはPASSBOOKモデルでのみサポートされています。言語がすでに指定されている場合、この処理はより迅速に実行されます。サポートされている言語については、次のセクションで学ぶことができます。
- 拡張OCRプロセスを通じて、書類モデルタイプに基づいて、関連する特定された情報が抽出され、事前に決定されたキーの値として設定されます。たとえば、銀行名や口座番号などの値がbank passbookから認識・抽出され、対応するキーとともにレスポンスで返されます。
モデルタイプ
Identity Scannerは、サポートされている本人確認書類に対応する以下のモデルタイプをサポートしています。
- AADHAAR: このモデルタイプで、インドのAadhaar cardを本人確認書類として処理できます。入力としてAadhaar cardの2つの画像(カードの表面と裏面の画像)を提供する必要があります。レスポンスは、Aadhaar番号、カード所有者の名前、住所、性別など、Aadhaar cardから認識されたパラメータを、各認識のconfidence scoreとともに返します。
- PAN: PAN cardの単一の画像を入力として提供することで、インドのPAN cardを本人確認書類として処理できます。レスポンスは、カード所有者の名、姓、生年月日、PAN番号など、PAN cardから認識されたパラメータを返します。
- PASSBOOK: このモデルを使用して、passbookの表紙ページの画像をアップロードすることで、インドの銀行のpassbookの表紙ページを本人確認または金融証明書として処理できます。レスポンスは、口座番号、銀行名、支店、住所など、passbookから認識されたパラメータを返します。レスポンスには、その口座でRTGS、NEFT、IMPSが有効になっているかどうかも表示されます。
- CHEQUE: このモデルを使用して、chequeの画像をアップロードすることで、インドのcheque leavesを金融証明書として処理できます。Identity ScannerはCTS-2010形式のchequeのみを処理します。レスポンスは、金額、銀行名、支店名、口座番号、IFSCコード、発行日など、認識されたパラメータを返します。
Java、Node.js、またはPython SDKコードを使用する場合、またはAPIを使用する場合は、リクエストでそれぞれのモデルタイプを渡す必要があります。
サポート言語
PASSBOOK
PASSBOOKモデルは、以下の9つの国際言語をサポートしています。
- English
- Arabic
- Chinese
- French
- Italian
- Japanese
- Portuguese
- Romanian
- Spanish
また、以下の10のインド言語もサポートしています。
- Hindi
- Bengali
- Marathi
- Telugu
- Tamil
- Gujarati
- Urdu
- Kannada
- Malayalam
- Sanskrit
AADHAAR
AADHAARモデルは、サポートされているすべてのインド言語と英語のテキストコンテンツを検出・認識できます。Identity Scannerを使用して、インドのあらゆる地域のAadhaar cardを処理できます。
CHEQUE and PAN
CHEQUEおよびPANモデルは、デフォルトで英語のみのコンテンツを処理し、他の言語はサポートしていません。
以下の点に注意してください。
- PASSBOOKモデルの処理時に、bank passbookに含まれる可能性のある言語を渡すことができます。
- 言語の指定はオプションです。ただし、言語を指定すると、テキスト認識と抽出プロセスがより高速で正確になります。言語が指定されていない場合、Identity Scannerは自動的に言語を検出します。
- CHEQUEまたはPANモデルの言語を選択することはできません。これらのタイプでは英語が唯一のサポート言語であるためです。AADHAARモデルの言語を選択することもできません。
リクエスト形式
各モデルタイプの入力ファイル形式は以下に指定されています。
| モデルタイプ | サポートされるファイル形式 | ファイルサイズ制限 |
|---|---|---|
| AADHAAR | 表面と裏面の両方の画像は、以下の形式のみである必要があります: .webp/.jpeg .png .tiff .bmp | 各画像15 MB |
| PASSBOOK | .webp/.jpeg .png .tiff .bmp .pdf | 15 MB |
| CHEQUE | .webp/.jpeg .png | 15 MB |
| PAN | .webp/.jpeg .png | 15 MB |
レスポンス形式
書類処理のレスポンス形式は以下のとおりです。
- SDKおよびAPIを使用する場合:
JSON response: デフォルトのJSON responseには、モデルタイプセクションで指定されているように、ステータスメッセージと各操作のデータが含まれます。コード内で書類処理のレスポンスで受信したテキストをフォーマットできます。詳細については、Java、Node.js、Python SDKドキュメントを参照してください。 - コンソールの場合:
コンソールでテスト用に画像やファイルをアップロードすると、2つの形式でレスポンスが返されます。
- 簡略化されたレスポンス: 簡略化されたテキストレスポンスは、本人確認書類から抽出されたパラメータを読みやすい形式で一覧表示します。
- JSON response: コンソールには、各操作に対して受信した元のJSON responseも表示されます。
最終更新日 2026-02-23 18:09:41 +0530 IST
Yes
No
Send your feedback to us