Optical Character Recognition

# Optical Character Recognition

Zia Optical Character Recognitionは、画像やデジタルドキュメント内のテキスト文字を電子的に検出し、機械エンコードされたテキストに変換します。Zia OCRは、9つの国際言語と10のインド言語のテキストを認識できます。APIドキュメントから言語と言語コードの一覧を確認できます。

注:
Catalystは、アップロードされたファイルをシステムに保存しません。アップロードされたファイルは一回限りの処理にのみ使用されます。MLモデルのトレーニング目的にも使用されません。Catalystコンポーネントは、適用されるすべてのデータ保護およびプライバシー法に完全に準拠しています。

OCRで処理する必要がある画像またはドキュメントファイルのパスを、以下のコードに示すように指定する必要があります。サンプルコードに示すように、受信したレスポンスをフォーマットすることもできます。レスポンスには、認識されたテキストに加えて、処理の精度を定義する信頼度スコアも含まれます。

許可されるファイル形式: ._jpg,_ ._jpeg_, ._png_, ._tiff_, ._bmp_, ._pdf_

ファイルサイズ制限: 20 MB

setModelType()でモデルタイプをOCRとして指定し、setLanguageCodeで言語コードを指定する必要があります。これらの値はOCRモデルタイプではオプションです。デフォルトではOCRモデルタイプとして処理され、言語が指定されていない場合は自動的に検出されます。

#### サンプルコードスニペット 
<br>
import com.zc.component.ml.ZCContent; 
import com.zc.component.ml.ZCLine;
import com.zc.component.ml.ZCML; 
import com.zc.component.ml.ZCOCRModelType; 
import com.zc.component.ml.ZCOCROptions;
import com.zc.component.ml.ZCParagraph;
import java.io.File;

File file = new File("/Users/amelia-421/Desktop/MyImage.webp"); 
//ファイルパスを指定する 
ZCOCROptions options = ZCOCROptions.getInstance().setModelType(ZCOCRModelType.OCR).setLanguageCode("eng,tam");
//モデルタイプと言語を設定する 
ZCContent ocrContent = ZCML.getInstance().getContent(file, options); 
//ファイルオブジェクトでgetContent()を呼び出して、ZCContentオブジェクトで検出されたテキストを取得する 
//個別の段落リストを取得する
paragraphs = ocrContent.getParagraphs(); 
for(ZCParagraph paragraph : paragraphs)
{ 
//段落内の個別の行を取得する 
List paraLines = paragraph.lines; 
for(ZCLine line : paraLines)
{ 
//行内の個別の単語を取得する
String words = line.words; 
String text = line.text; 
//生の行テキスト 
} 
String text = paragraph.text; 
//段落の生テキストを返す 
} 
String text = ocrContent.text; 
//画像の生テキストを返す

注: Catalystは、アップロードされたファイルをシステムに保存しません。アップロードされたファイルは一回限りの処理にのみ使用されます。MLモデルのトレーニング目的にも使用されません。Catalystコンポーネントは、適用されるすべてのデータ保護およびプライバシー法に完全に準拠しています。

許可されるファイル形式: .jpg, .jpeg, .png, .tiff, .bmp, .pdf

ファイルサイズ制限: 20 MB

サンプルコードスニペット

Package Imports
copy

         import com.zc.component.ml.ZCContent; 
import com.zc.component.ml.ZCLine;
import com.zc.component.ml.ZCML; 
import com.zc.component.ml.ZCOCRModelType; 
import com.zc.component.ml.ZCOCROptions;
import com.zc.component.ml.ZCParagraph;
import java.io.File;

    

copy

         File file = new File("/Users/amelia-421/Desktop/MyImage.webp"); 
//ファイルパスを指定する 
ZCOCROptions options = ZCOCROptions.getInstance().setModelType(ZCOCRModelType.OCR).setLanguageCode("eng,tam");
//モデルタイプと言語を設定する 
ZCContent ocrContent = ZCML.getInstance().getContent(file, options); 
//ファイルオブジェクトでgetContent()を呼び出して、ZCContentオブジェクトで検出されたテキストを取得する 
//個別の段落リストを取得する
paragraphs = ocrContent.getParagraphs(); 
for(ZCParagraph paragraph : paragraphs)
{ 
//段落内の個別の行を取得する 
List paraLines = paragraph.lines; 
for(ZCLine line : paraLines)
{ 
//行内の個別の単語を取得する
String words = line.words; 
String text = line.text; 
//生の行テキスト 
} 
String text = paragraph.text; 
//段落の生テキストを返す 
} 
String text = ocrContent.text; 
//画像の生テキストを返す

    

最終更新日 2026-03-24 17:38:39 +0530 IST

Yes

Thank you for your feedback!

Send your feedback to us

Skip

Submit

OCR - API

Java SDK

SDK操作

Optical Character Recognition

サンプルコードスニペット