Optical Character Recognition
Zia Optical Character Recognitionは、画像やデジタルドキュメント内のテキスト文字を電子的に検出し、機械エンコードされたテキストに変換します。Zia OCRは、9つの国際言語と10のインド言語のテキストを認識できます。APIドキュメントから言語と言語コードのリストを確認できます。
注意:Catalystは、アップロードされたファイルをシステムに保存しません。アップロードされたファイルは一回限りの処理にのみ使用されます。MLモデルのトレーニング目的にも使用されません。Catalystのコンポーネントは、適用されるすべてのデータ保護およびプライバシー法に完全に準拠しています。
OCR処理が必要な画像またはドキュメントファイルへのパスを指定する必要があります。レスポンスには、認識されたテキストに加えて、処理の精度を定義する信頼度スコアも含まれます。
許可されるファイル形式: .jpg、.jpeg、.png、.tiff、.bmp、.pdf
ファイルサイズ制限: 20 MB
ファイルパス、モデルタイプ、および言語をextractOpticalCharacters()メソッドの引数として渡す必要があります。ただし、モデルタイプと言語の値はオプションです。デフォルトでは、OCRモデルタイプとして渡され、言語は指定されない場合自動的に検出されます。
以下で使用されているziaリファレンスは、 コンポーネントインスタンスページで定義されています。 ここで返されるPromiseは、JSONオブジェクトに解決されます。
copy
let fs = require('fs'); //Define the file stream for file attachments
let result = await zia.extractOpticalCharacters(
fs.createReadStream('/Users/amelia-421/Desktop/MyDoc.webp'),
{
language:'eng',
modelType: 'OCR'
}) ;
console.log(result);
受信するサンプルレスポンスを以下に示します。レスポンスはNode.jsの両方のバージョンで同じです。
Node js
copy
{
"confidence":95,
"text":"This is a lot of 12 point text to test the\nocr code and see if it works on all types\nof file format\n\nThe quick brown dog jumped over the\nlazy fox. The quick brown dog jumped\nover the lazy fox. The quick brown dog\njumped over the lazy fox. The quick\nbrown dog jumped over the lazy fox"
}
最終更新日 2026-02-23 18:09:41 +0530 IST
Yes
No
Send your feedback to us
Skip
Submit