お知らせ:

当社は、お客様により充実したサポート情報を迅速に提供するため、本ページのコンテンツは機械翻訳を用いて日本語に翻訳しています。正確かつ最新のサポート情報をご覧いただくには、本内容の英語版を参照してください。

実装

このセクションでは、CatalystコンソールでのOCRの操作のみを扱います。アプリケーションのコードでZia OCRを実装する方法については、SDKおよびAPIドキュメントのセクションを参照してください。

前述のとおり、コンソールからOCRをCatalystアプリケーションに統合するためのコードテンプレートにアクセスでき、またサンプル画像や書類をアップロードして認識されたテキストを取得することで機能をテストすることもできます。

Optical Character Recognitionへのアクセス

CatalystコンソールでOptical Character Recognitionにアクセスするには、以下の手順を実行します。

  1. Catalystコンソールの左ペインでZia servicesに移動し、OCRをクリックして機能にアクセスします。
    ocr
  2. Optical Character Recognitionの機能ページでTry a Demoをクリックします。
    catalyst_ocr_test_page

CatalystコンソールでのOptical Character Recognitionのテスト

Catalystのサンプル画像またはPDFファイルを選択するか、独自のファイルをアップロードすることで、OCRをテストできます。

サンプルファイルを処理して結果を取得するには、以下の手順を実行します。

  1. ボックス内のSelect a Sample Imageをクリックします。
    catalyst_ocr_sample
  2. 提供されているサンプルから画像またはPDFファイルを選択します。
    catalyst_ocr_select_sample
    OCRがファイルを処理し、その中のテキストコンテンツを検出・識別します。サンプルファイルであるため、テキストの言語とモデルタイプはCatalystによって自動的に提供されます。

    認識されたテキストは、コンソールの_Result_セクションの下に表示されます。
    catalyst_ocr_sample_processed
    View ResponseをクリックしてJSON responseを表示できます。
    catalyst_ocr_sample_json

テキストを含む独自の画像またはPDFファイルをアップロードするには、以下の手順を実行します。

  1. _Result_セクションの下にあるUploadをクリックします。
    catalyst_ocr_upload
    閉じた後にOptical Character Recognitionを再度開く場合は、このボックスのBrowse Filesをクリックします。
    catalyst_ocr_browse

  2. ローカルシステムからファイルをアップロードします。

注意: ファイルは._jpg_/._jpeg_、._png_、._bmp_、._tiff_、または._pdf_形式である必要があります。ファイルサイズは20 MBを超えてはなりません。
  1. ファイルのテキストのモデルタイプ言語がわかっている場合は選択します。OCRモデルにはGeneralを選択できます。ファイルに複数の言語のテキストが含まれている場合は、複数の言語を選択できます。 catalyst_ocr_upload_options

  2. Proceedをクリックします。

コンソールがファイルを処理し、認識されたテキストコンテンツを表示し、OCRモデルタイプの場合はconfidence scoreも表示します。コピーアイコンを使用して認識されたテキストをコピーできます。

catalyst_ocr_image_scanned

同様にJSON responseも確認できます。

catalyst_ocr_image_json

Optical Character Recognitionのコードテンプレートへのアクセス

CatalystがJavaNode.jsPythonプラットフォーム用に提供するコードテンプレートを使用して、CatalystアプリケーションにOptical Character Recognitionを実装できます。

テストウィンドウの下のセクションからアクセスできます。Java SDKNodeJS SDK、またはPython SDKタブをクリックし、コピーアイコンを使用してコードをコピーします。このコードを、必要な箇所でWebまたはAndroidアプリケーションのコードに貼り付けることができます。

catalyst_ocr_java

Javaでは、入力ファイルを新しいFileとして処理し、ZCOCRModelTypeを使用してモデルタイプを指定し、setLanguageCodeを使用して言語を指定できます。サポートされている言語とモデルタイプのキーについては、APIドキュメントを参照してください。

前述のとおり、受信したJSON responseをフォーマットできます。Javaコードでは、特定の段落、段落内の個々の行、または行内の個々の単語を取得できます。

catalyst_ocr_node

Node.jsコードは、入力ファイルをオブジェクトocrPromiseとして処理します。入力ファイル名を提供し、modelTypeを使用してモデルタイプを設定し、languageを使用して言語を設定できます。

catalyst_ocr_python

Pythonでは、ファイルパス、モデルタイプ、言語をextract_optical_characters()メソッドの引数として渡す必要があります。ただし、モデルタイプと言語の値はオプションです。デフォルトではOCRモデルタイプとして渡され、言語が指定されていない場合は自動的に検出されます。

最終更新日 2026-02-23 18:09:41 +0530 IST