Aviso:

Para brindarle información de soporte completa de manera más rápida, el contenido de esta página ha sido traducido al español mediante traducción automática. Para consultar la información de soporte más precisa, consulte la versión en inglés de este contenido.

Reconocimiento óptico de caracteres

Zia Optical Character Recognition detecta electrónicamente caracteres textuales en imágenes o documentos digitales, y los convierte en texto codificado por máquina. Zia OCR puede reconocer texto en 9 idiomas internacionales y 10 idiomas indios. Puedes consultar la lista de idiomas y códigos de idioma en la documentación de la API

Nota: Catalyst no almacena ninguno de los archivos que subes en sus sistemas. Los archivos que subes se usan solo para procesamiento único. Tampoco se usan para propósitos de entrenamiento de modelos de ML. Los componentes de Catalyst cumplen completamente con todas las leyes aplicables de protección de datos y privacidad.

Debes especificar la ruta al archivo de imagen o documento que necesita ser procesado para OCR, como se muestra en el código a continuación. También puedes formatear la respuesta que recibes como se muestra en el código de ejemplo. La respuesta también incluirá una puntuación de confianza, que define la precisión del procesamiento, además del texto reconocido.

Formatos de archivo permitidos: .jpg, .jpeg, .png, .tiff, .bmp, .pdf

Límite de tamaño de archivo: 20 MB

Debes especificar el tipo de modelo como OCR en setModelType(), y los códigos de idioma usando setLanguageCode. Estos valores son opcionales para el tipo de modelo OCR. Por defecto, se procesa como el tipo de modelo OCR, y los idiomas se detectan automáticamente si no se especifican.

Fragmento de código de ejemplo


Package Imports
copy
import com.zc.component.ml.ZCContent; 
import com.zc.component.ml.ZCLine;
import com.zc.component.ml.ZCML; 
import com.zc.component.ml.ZCOCRModelType; 
import com.zc.component.ml.ZCOCROptions;
import com.zc.component.ml.ZCParagraph;
import java.io.File;
copy
File file = new File("/Users/amelia-421/Desktop/MyImage.webp"); 
//Especifica la ruta del archivo 
ZCOCROptions options = ZCOCROptions.getInstance().setModelType(ZCOCRModelType.OCR).setLanguageCode("eng,tam");
//Establece el tipo de modelo y los idiomas 
ZCContent ocrContent = ZCML.getInstance().getContent(file, options); 
//Llama a getContent() con el objeto de archivo para obtener el texto detectado en el objeto ZCContent 
//Para obtener la lista de párrafos individuales
paragraphs = ocrContent.getParagraphs(); 
for(ZCParagraph paragraph : paragraphs)
{ 
//Para obtener líneas individuales en el párrafo 
List paraLines = paragraph.lines; 
for(ZCLine line : paraLines)
{ 
//Para obtener palabras individuales en la línea
String words = line.words; 
String text = line.text; 
//Texto sin formato de la línea 
} 
String text = paragraph.text; 
//Devuelve el texto sin formato del párrafo 
} 
String text = ocrContent.text; 
//Devuelve el texto sin formato de la imagen

Última actualización 2026-03-24 17:38:39 +0530 IST

EN ESTA PÁGINA

ENLACES RELACIONADOS

OCR - API