お知らせ:

当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

Optical Character Recognition

Zia Optical Character Recognitionは、画像やデジタルドキュメント内のテキスト文字を電子的に検出し、機械エンコードされたテキストに変換します。Zia OCRは、9つの国際言語と10のインド言語のテキストを認識できます。APIドキュメントから言語と言語コードの一覧を確認できます。

注: Catalystは、アップロードされたファイルをシステムに保存しません。アップロードされたファイルは一回限りの処理にのみ使用されます。MLモデルのトレーニング目的にも使用されません。Catalystコンポーネントは、適用されるすべてのデータ保護およびプライバシー法に完全に準拠しています。

OCRで処理する必要がある画像またはドキュメントファイルのパスを、以下のコードに示すように指定する必要があります。サンプルコードに示すように、受信したレスポンスをフォーマットすることもできます。レスポンスには、認識されたテキストに加えて、処理の精度を定義する信頼度スコアも含まれます。

許可されるファイル形式: .jpg, .jpeg, .png, .tiff, .bmp, .pdf

ファイルサイズ制限: 20 MB

setModelType()でモデルタイプをOCRとして指定し、setLanguageCodeで言語コードを指定する必要があります。これらの値はOCRモデルタイプではオプションです。デフォルトではOCRモデルタイプとして処理され、言語が指定されていない場合は自動的に検出されます。

サンプルコードスニペット


Package Imports
copy
import com.zc.component.ml.ZCContent; 
import com.zc.component.ml.ZCLine;
import com.zc.component.ml.ZCML; 
import com.zc.component.ml.ZCOCRModelType; 
import com.zc.component.ml.ZCOCROptions;
import com.zc.component.ml.ZCParagraph;
import java.io.File;
copy
File file = new File("/Users/amelia-421/Desktop/MyImage.webp"); 
//ファイルパスを指定する 
ZCOCROptions options = ZCOCROptions.getInstance().setModelType(ZCOCRModelType.OCR).setLanguageCode("eng,tam");
//モデルタイプと言語を設定する 
ZCContent ocrContent = ZCML.getInstance().getContent(file, options); 
//ファイルオブジェクトでgetContent()を呼び出して、ZCContentオブジェクトで検出されたテキストを取得する 
//個別の段落リストを取得する
paragraphs = ocrContent.getParagraphs(); 
for(ZCParagraph paragraph : paragraphs)
{ 
//段落内の個別の行を取得する 
List paraLines = paragraph.lines; 
for(ZCLine line : paraLines)
{ 
//行内の個別の単語を取得する
String words = line.words; 
String text = line.text; 
//生の行テキスト 
} 
String text = paragraph.text; 
//段落の生テキストを返す 
} 
String text = ocrContent.text; 
//画像の生テキストを返す

最終更新日 2026-03-24 17:38:39 +0530 IST

このページについて

関連リンク

OCR - API