Aviso:

Para brindarle información de soporte completa de manera más rápida, el contenido de esta página ha sido traducido al español mediante traducción automática. Para consultar la información de soporte más precisa, consulte la versión en inglés de este contenido.

Optical Character Recognition

Zia Optical Character Recognition detecta electrónicamente caracteres textuales en imágenes o documentos digitales, y los convierte en texto codificado por máquina. Zia OCR puede reconocer texto en nueve idiomas internacionales y 10 idiomas indios. Puedes consultar la lista de idiomas y códigos de idioma en la documentación de la API.

Note:Catalyst no almacena ninguno de los archivos que subes en sus sistemas. Los archivos que subes se utilizan solo para procesamiento único. Tampoco se utilizan para fines de entrenamiento de modelos de ML. Los componentes de Catalyst cumplen completamente con todas las leyes aplicables de protección de datos y privacidad.
Debes especificar la ruta al archivo de imagen o documento que necesita ser procesado para OCR como parámetro del método open(). Esto abre el archivo y devuelve un objeto de archivo como respuesta. Formatos de archivo permitidos: ._jpg_, ._jpeg_, ._png_, ._tiff_, ._bmp_, ._pdf_ Límite de tamaño de archivo: 20 MB Debes pasar la ruta del archivo, el tipo de modelo y los idiomas como argumentos al método extract_optical_characters(). Sin embargo, los valores del tipo de modelo y el idioma son opcionales. Por defecto, se pasa como el tipo de modelo OCR, y los idiomas se detectan automáticamente si no se especifican. Para conocer más sobre la instancia de componente zia utilizada a continuación, consulta esta sección de ayuda. **Parámetros utilizados**
Nombre del parámetro Tipo de dato Definición
img Image Un parámetro obligatorio. Almacenará la imagen que debe ser analizada.
language String Un parámetro obligatorio. Almacenará el idioma a identificar.
modelType String Un parámetro obligatorio. Almacenará el valor predeterminado como "OCR".
copy
# Implementación de OCR
zia = app.zia()
img = open("sample.webp", "rb")
result = zia.extract_optical_characters(img, {"language": "eng", "modelType": "OCR"})

A continuación se muestra una respuesta de ejemplo:

copy
{
   "confidence":95,
   "text":"This is a lot of 12 point text to test the\nocr code and see if it works on all types\nof file format\n\nThe quick brown dog jumped over the\nlazy fox. The quick brown dog jumped\nover the lazy fox. The quick brown dog\njumped over the lazy fox. The quick\nbrown dog jumped over the lazy fox"
}
Info : Consulta la tabla de SDK Scopes para determinar el nivel de permiso requerido para realizar la operación anterior.

Última actualización 2026-03-30 13:40:30 +0530 IST

EN ESTA PÁGINA

ENLACES RELACIONADOS

OCR - API SDK Scopes