Aviso:

Para brindarle información de soporte completa de manera más rápida, el contenido de esta página ha sido traducido al español mediante traducción automática. Para consultar la información de soporte más precisa, consulte la versión en inglés de este contenido.

Implementación

Esta sección solo cubre el trabajo con OCR en la consola de Catalyst. Consulta las secciones de documentación del SDK y la API para implementar Zia OCR en el código de tu aplicación.

Como se mencionó anteriormente, puedes acceder a las plantillas de código que te permitirán integrar OCR en tu aplicación de Catalyst desde la consola, y también probar la función subiendo imágenes y documentos de muestra y obteniendo el texto reconocido.

Acceder a Optical Character Recognition

Para acceder a Optical Character Recognition en tu consola de Catalyst:

  1. Navega a Zia services en el panel izquierdo de la consola de Catalyst y haz clic en OCR para acceder a la función.
    ocr
  2. Haz clic en Try a Demo en la página de la función Optical Character Recognition.
    catalyst_ocr_test_page

Probar Optical Character Recognition en la consola de Catalyst

Puedes probar OCR seleccionando una imagen o archivo PDF de muestra de Catalyst o subiendo tu propio archivo.

Para procesar un archivo de muestra y obtener los resultados:

  1. Haz clic en Select a Sample Image en el cuadro.
    catalyst_ocr_sample
  2. Selecciona una imagen o un archivo PDF de las muestras proporcionadas.
    catalyst_ocr_select_sample
    OCR procesará el archivo, detectará e identificará el contenido textual en él. Dado que es un archivo de muestra, el idioma del texto y el tipo de modelo son proporcionados por Catalyst automáticamente.

    El texto reconocido se muestra en la consola en la sección Result.
    catalyst_ocr_sample_processed
    Puedes ver la respuesta JSON haciendo clic en View Response.
    catalyst_ocr_sample_json

Para subir tu propia imagen o archivo PDF con texto:

  1. Haz clic en Upload en la sección Result.
    catalyst_ocr_upload
    Si estás abriendo Optical Character Recognition después de haberlo cerrado, haz clic en Browse Files en este cuadro.
    catalyst_ocr_browse

  2. Sube un archivo desde tu sistema local.

Nota: El archivo debe estar en formato ._jpg_/._jpeg_, ._png_, ._bmp_, ._tiff_ o ._pdf_. El tamaño del archivo no debe exceder 20 MB.
  1. Selecciona el tipo de modelo y los idiomas en el texto del archivo, si los conoces. Puedes seleccionar General para el modelo OCR. Puedes seleccionar múltiples idiomas, si el archivo contiene texto en varios idiomas. catalyst_ocr_upload_options

  2. Haz clic en Proceed.

La consola procesará el archivo y mostrará el contenido textual reconocido, y la puntuación de confianza si es del tipo de modelo OCR. Puedes copiar el texto reconocido usando el icono de copiar.

catalyst_ocr_image_scanned

Puedes verificar la respuesta JSON de manera similar.

catalyst_ocr_image_json

Acceder a plantillas de código para Optical Character Recognition

Puedes implementar Optical Character Recognition en tu aplicación de Catalyst usando las plantillas de código proporcionadas por Catalyst para las plataformas Java, Node.js y Python.

Puedes acceder a ellas desde la sección debajo de la ventana de pruebas. Haz clic en la pestaña Java SDK, NodeJS SDK o Python SDK, y copia el código usando el icono de copiar. Puedes pegar este código en el código de tu aplicación web o Android donde lo necesites.

catalyst_ocr_java

En Java, puedes procesar el archivo de entrada como un nuevo File, especificar el tipo de modelo usando ZCOCRModelType y los idiomas usando setLanguageCode. Consulta la documentación de la API para las claves de los idiomas y tipos de modelo soportados.

Como se mencionó anteriormente, puedes formatear la respuesta JSON que recibes. El código Java te permite obtener párrafos específicos, líneas individuales en un párrafo o palabras individuales en una línea.

catalyst_ocr_node

El código de Node.js procesa el archivo de entrada como el objeto ocrPromise. Puedes proporcionar el nombre del archivo de entrada, establecer el tipo de modelo usando modelType y los idiomas usando language.

catalyst_ocr_python

Para Python, debes pasar la ruta del archivo, el tipo de modelo y los idiomas como argumentos al método extract_optical_characters(). Sin embargo, los valores del tipo de modelo e idioma son opcionales. Por defecto, se pasa como el tipo de modelo OCR, y los idiomas se detectan automáticamente si no se especifican.

Última actualización 2026-03-20 21:51:56 +0530 IST