お知らせ:

当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

光学文字認識

Zia光学文字認識は、画像やデジタルドキュメント内のテキスト文字を電子的に検出し、マシンエンコードされたテキストに変換します。Zia OCRは9つの国際言語と10のインド言語のテキストを認識できます。言語と言語コードのリストは、APIドキュメントで確認できます。

注意:Catalystは、アップロードされたファイルをシステムに保存しません。アップロードされたファイルは一度きりの処理にのみ使用されます。MLモデルのトレーニング目的にも使用されません。Catalystコンポーネントは、該当するすべてのデータ保護およびプライバシー法に完全に準拠しています。

OCR処理が必要な画像またはドキュメントファイルのパスをopen()メソッドのパラメータとして指定する必要があります。これによりファイルが開かれ、レスポンスとしてファイルオブジェクトが返されます。

許可されるファイル形式: .jpg、.jpeg、.png、.tiff、.bmp、.pdf

ファイルサイズ制限: 20 MB

extract_optical_characters()メソッドに、ファイルパス、モデルタイプ、言語を引数として渡す必要があります。ただし、モデルタイプと言語の値はオプションです。デフォルトではOCRモデルタイプとして渡され、言語は指定されない場合は自動的に検出されます。

以下で使用されているコンポーネントインスタンスziaの詳細については、こちらのヘルプセクションを参照してください。

使用パラメータ

パラメータ名 データ型 定義
img Image 必須パラメータです。解析対象の画像を格納します。
language String 必須パラメータです。識別対象の言語を格納します。
modelType String 必須パラメータです。デフォルト値として「OCR」を格納します。
copy
# OCR Implementation
zia = app.zia()
img = open("sample.webp", "rb")
result = zia.extract_optical_characters(img, {"language": "eng", "modelType": "OCR"})

サンプルレスポンスを以下に示します:

copy
{
   "confidence":95,
   "text":"This is a lot of 12 point text to test the\nocr code and see if it works on all types\nof file format\n\nThe quick brown dog jumped over the\nlazy fox. The quick brown dog jumped\nover the lazy fox. The quick brown dog\njumped over the lazy fox. The quick\nbrown dog jumped over the lazy fox"
}
情報 : 上記の操作を実行するために必要な権限レベルを確認するには、SDKスコープテーブルを参照してください。

最終更新日 2026-02-23 18:09:41 +0530 IST

このページについて

関連リンク

OCR - API SDK Scopes