Optical Character Recognition

# Optical Character Recognition
Zia Optical Character Recognition detecta electrónicamente caracteres textuales en imágenes o documentos digitales, y los convierte en texto codificado por máquina. Zia OCR puede reconocer texto en nueve idiomas internacionales y 10 idiomas indios. Puedes consultar la lista de idiomas y códigos de idioma en la  documentación de la API.
Note:Catalyst no almacena ninguno de los archivos que subes en sus sistemas. Los archivos que subes se utilizan solo para procesamiento único. Tampoco se utilizan para fines de entrenamiento de modelos de ML. Los componentes de Catalyst cumplen completamente con todas las leyes aplicables de protección de datos y privacidad.
Debes especificar la ruta al archivo de imagen o documento que necesita ser procesado para OCR como parámetro del método open(). Esto abre el archivo y devuelve un objeto de archivo como respuesta.
Formatos de archivo permitidos: ._jpg_, ._jpeg_, ._png_, ._tiff_, ._bmp_, ._pdf_
Límite de tamaño de archivo: 20 MB
Debes pasar la ruta del archivo, el tipo de modelo y los idiomas como argumentos al método extract_optical_characters(). Sin embargo, los valores del tipo de modelo y el idioma son opcionales. Por defecto, se pasa como el tipo de modelo OCR, y los idiomas se detectan automáticamente si no se especifican.
Para conocer más sobre la instancia de componente zia utilizada a continuación, consulta esta sección de ayuda.
**Parámetros utilizados**
<table class="content-table">
        <thead>
                <tr>
                        <th class="w20p">Nombre del parámetro</th>
                        <th class="w20p">Tipo de dato</th>
      <th class="w60p">Definición</th>
                </tr>
        </thead>
        <tbody>
    <tr>
                        <td>img</td>
                        <td>Image</td>
                        <td>Un parámetro obligatorio. Almacenará la imagen que debe ser analizada.</td>
                </tr>
      <tr>
                        <td>language</td>
                        <td>String</td>
                        <td>Un parámetro obligatorio. Almacenará el idioma a identificar.</td>
                </tr>
      <tr>
                        <td>modelType</td>
                        <td>String</td>
                        <td>Un parámetro obligatorio. Almacenará el valor predeterminado como "OCR".</td>
                </tr>
        </tbody>
</table>
# Implementación de OCR
zia = app.zia()
img = open("sample.webp", "rb")
result = zia.extract_optical_characters(img, {"language": "eng", "modelType": "OCR"})
 
A continuación se muestra una respuesta de ejemplo:
{
   "confidence":95,
   "text":"This is a lot of 12 point text to test the\nocr code and see if it works on all types\nof file format\n\nThe quick brown dog jumped over the\nlazy fox. The quick brown dog jumped\nover the lazy fox. The quick brown dog\njumped over the lazy fox. The quick\nbrown dog jumped over the lazy fox"
}
 
Info : Consulta la tabla de SDK Scopes para determinar el nivel de permiso requerido para realizar la operación anterior.

Zia Optical Character Recognition detecta electrónicamente caracteres textuales en imágenes o documentos digitales, y los convierte en texto codificado por máquina. Zia OCR puede reconocer texto en nueve idiomas internacionales y 10 idiomas indios. Puedes consultar la lista de idiomas y códigos de idioma en la documentación de la API.

Note:Catalyst no almacena ninguno de los archivos que subes en sus sistemas. Los archivos que subes se utilizan solo para procesamiento único. Tampoco se utilizan para fines de entrenamiento de modelos de ML. Los componentes de Catalyst cumplen completamente con todas las leyes aplicables de protección de datos y privacidad.

Debes especificar la ruta al archivo de imagen o documento que necesita ser procesado para OCR como parámetro del método open(). Esto abre el archivo y devuelve un objeto de archivo como respuesta. Formatos de archivo permitidos: ._jpg_, ._jpeg_, ._png_, ._tiff_, ._bmp_, ._pdf_ Límite de tamaño de archivo: 20 MB Debes pasar la ruta del archivo, el tipo de modelo y los idiomas como argumentos al método extract_optical_characters(). Sin embargo, los valores del tipo de modelo y el idioma son opcionales. Por defecto, se pasa como el tipo de modelo OCR, y los idiomas se detectan automáticamente si no se especifican. Para conocer más sobre la instancia de componente zia utilizada a continuación, consulta esta sección de ayuda. **Parámetros utilizados**

Nombre del parámetro	Tipo de dato	Definición
img	Image	Un parámetro obligatorio. Almacenará la imagen que debe ser analizada.
language	String	Un parámetro obligatorio. Almacenará el idioma a identificar.
modelType	String	Un parámetro obligatorio. Almacenará el valor predeterminado como "OCR".

copy

         # Implementación de OCR
zia = app.zia()
img = open("sample.webp", "rb")
result = zia.extract_optical_characters(img, {"language": "eng", "modelType": "OCR"})

    

A continuación se muestra una respuesta de ejemplo:

copy

         {
   "confidence":95,
   "text":"This is a lot of 12 point text to test the\nocr code and see if it works on all types\nof file format\n\nThe quick brown dog jumped over the\nlazy fox. The quick brown dog jumped\nover the lazy fox. The quick brown dog\njumped over the lazy fox. The quick\nbrown dog jumped over the lazy fox"
}

    

Info : Consulta la tabla de SDK Scopes para determinar el nivel de permiso requerido para realizar la operación anterior.

Última actualización 2026-03-30 13:40:30 +0530 IST

Yes

Thank you for your feedback!

Send your feedback to us

Skip

Submit

OCR - API SDK Scopes

SDK de Python

Operaciones del SDK

Optical Character Recognition