光学文字認識
Zia光学文字認識は、画像やデジタルドキュメント内のテキスト文字を電子的に検出し、マシンエンコードされたテキストに変換します。Zia OCRは9つの国際言語と10のインド言語のテキストを認識できます。言語と言語コードのリストは、APIドキュメントで確認できます。
注意:Catalystは、アップロードされたファイルをシステムに保存しません。アップロードされたファイルは一度きりの処理にのみ使用されます。MLモデルのトレーニング目的にも使用されません。Catalystコンポーネントは、該当するすべてのデータ保護およびプライバシー法に完全に準拠しています。
OCR処理が必要な画像またはドキュメントファイルのパスをopen()メソッドのパラメータとして指定する必要があります。これによりファイルが開かれ、レスポンスとしてファイルオブジェクトが返されます。
許可されるファイル形式: .jpg、.jpeg、.png、.tiff、.bmp、.pdf
ファイルサイズ制限: 20 MB
extract_optical_characters()メソッドに、ファイルパス、モデルタイプ、言語を引数として渡す必要があります。ただし、モデルタイプと言語の値はオプションです。デフォルトではOCRモデルタイプとして渡され、言語は指定されない場合は自動的に検出されます。
以下で使用されているコンポーネントインスタンスziaの詳細については、こちらのヘルプセクションを参照してください。
使用パラメータ
| パラメータ名 | データ型 | 定義 |
|---|---|---|
| img | Image | 必須パラメータです。解析対象の画像を格納します。 |
| language | String | 必須パラメータです。識別対象の言語を格納します。 |
| modelType | String | 必須パラメータです。デフォルト値として「OCR」を格納します。 |
copy
# OCR Implementation
zia = app.zia()
img = open("sample.webp", "rb")
result = zia.extract_optical_characters(img, {"language": "eng", "modelType": "OCR"})
サンプルレスポンスを以下に示します:
copy
{
"confidence":95,
"text":"This is a lot of 12 point text to test the\nocr code and see if it works on all types\nof file format\n\nThe quick brown dog jumped over the\nlazy fox. The quick brown dog jumped\nover the lazy fox. The quick brown dog\njumped over the lazy fox. The quick\nbrown dog jumped over the lazy fox"
}
情報 : 上記の操作を実行するために必要な権限レベルを確認するには、SDKスコープテーブルを参照してください。
最終更新日 2026-02-23 18:09:41 +0530 IST
Yes
No
Send your feedback to us
Skip
Submit