Optical Character Recognition
Zia Optical Character Recognitionは、画像やデジタルドキュメント内のテキスト文字を電子的に検出し、機械エンコードされたテキストに変換します。Zia OCRは、9つの国際言語と10のインド言語のテキストを認識できます。APIドキュメントから言語と言語コードの一覧を確認できます。
注:
Catalystは、アップロードされたファイルをシステムに保存しません。アップロードされたファイルは一回限りの処理にのみ使用されます。MLモデルのトレーニング目的にも使用されません。Catalystコンポーネントは、適用されるすべてのデータ保護およびプライバシー法に完全に準拠しています。
OCRで処理する必要がある画像またはドキュメントファイルのパスを、以下のコードに示すように指定する必要があります。サンプルコードに示すように、受信したレスポンスをフォーマットすることもできます。レスポンスには、認識されたテキストに加えて、処理の精度を定義する信頼度スコアも含まれます。
許可されるファイル形式: .jpg, .jpeg, .png, .tiff, .bmp, .pdf
ファイルサイズ制限: 20 MB
setModelType()でモデルタイプをOCRとして指定し、setLanguageCodeで言語コードを指定する必要があります。これらの値はOCRモデルタイプではオプションです。デフォルトではOCRモデルタイプとして処理され、言語が指定されていない場合は自動的に検出されます。
サンプルコードスニペット
Package Imports
copy
import com.zc.component.ml.ZCContent;
import com.zc.component.ml.ZCLine;
import com.zc.component.ml.ZCML;
import com.zc.component.ml.ZCOCRModelType;
import com.zc.component.ml.ZCOCROptions;
import com.zc.component.ml.ZCParagraph;
import java.io.File;
copy
File file = new File("/Users/amelia-421/Desktop/MyImage.webp");
//ファイルパスを指定する
ZCOCROptions options = ZCOCROptions.getInstance().setModelType(ZCOCRModelType.OCR).setLanguageCode("eng,tam");
//モデルタイプと言語を設定する
ZCContent ocrContent = ZCML.getInstance().getContent(file, options);
//ファイルオブジェクトでgetContent()を呼び出して、ZCContentオブジェクトで検出されたテキストを取得する
//個別の段落リストを取得する
paragraphs = ocrContent.getParagraphs();
for(ZCParagraph paragraph : paragraphs)
{
//段落内の個別の行を取得する
List paraLines = paragraph.lines;
for(ZCLine line : paraLines)
{
//行内の個別の単語を取得する
String words = line.words;
String text = line.text;
//生の行テキスト
}
String text = paragraph.text;
//段落の生テキストを返す
}
String text = ocrContent.text;
//画像の生テキストを返す
最終更新日 2026-03-24 17:38:39 +0530 IST
Yes
No
Send your feedback to us
Skip
Submit