Reconocimiento óptico de caracteres
Zia Optical Character Recognition detecta electrónicamente caracteres textuales en imágenes o documentos digitales, y los convierte en texto codificado por máquina. Zia OCR puede reconocer texto en 9 idiomas internacionales y 10 idiomas indios. Puedes consultar la lista de idiomas y códigos de idioma en la documentación de la API
Debes especificar la ruta al archivo de imagen o documento que necesita ser procesado para OCR, como se muestra en el código a continuación. También puedes formatear la respuesta que recibes como se muestra en el código de ejemplo. La respuesta también incluirá una puntuación de confianza, que define la precisión del procesamiento, además del texto reconocido.
Formatos de archivo permitidos: .jpg, .jpeg, .png, .tiff, .bmp, .pdf
Límite de tamaño de archivo: 20 MB
Debes especificar el tipo de modelo como OCR en setModelType(), y los códigos de idioma usando setLanguageCode. Estos valores son opcionales para el tipo de modelo OCR. Por defecto, se procesa como el tipo de modelo OCR, y los idiomas se detectan automáticamente si no se especifican.
Fragmento de código de ejemplo
import com.zc.component.ml.ZCContent;
import com.zc.component.ml.ZCLine;
import com.zc.component.ml.ZCML;
import com.zc.component.ml.ZCOCRModelType;
import com.zc.component.ml.ZCOCROptions;
import com.zc.component.ml.ZCParagraph;
import java.io.File;
File file = new File("/Users/amelia-421/Desktop/MyImage.webp");
//Especifica la ruta del archivo
ZCOCROptions options = ZCOCROptions.getInstance().setModelType(ZCOCRModelType.OCR).setLanguageCode("eng,tam");
//Establece el tipo de modelo y los idiomas
ZCContent ocrContent = ZCML.getInstance().getContent(file, options);
//Llama a getContent() con el objeto de archivo para obtener el texto detectado en el objeto ZCContent
//Para obtener la lista de párrafos individuales
paragraphs = ocrContent.getParagraphs();
for(ZCParagraph paragraph : paragraphs)
{
//Para obtener líneas individuales en el párrafo
List paraLines = paragraph.lines;
for(ZCLine line : paraLines)
{
//Para obtener palabras individuales en la línea
String words = line.words;
String text = line.text;
//Texto sin formato de la línea
}
String text = paragraph.text;
//Devuelve el texto sin formato del párrafo
}
String text = ocrContent.text;
//Devuelve el texto sin formato de la imagen
Última actualización 2026-03-24 17:38:39 +0530 IST
Yes
No
Send your feedback to us