Document Processor
Introducción
Este tutorial te ayudará a construir una aplicación React de Document Processor en Catalyst que implementa capacidades de AI/ML para detectar, procesar y extraer datos específicos de documentos escaneados e imágenes. La aplicación Document Processor construida en este tutorial podrá hacer lo siguiente:
-
Reconocer texto escrito a mano o impreso en documentos digitales escaneados o imágenes, y convertirlos a un formato legible por máquina (una respuesta JSON).
-
Escanear códigos de barras impresos (formatos 1D y 2D), y extraer la información codificada en ellos.
-
Escanear y procesar documentos de identificación digital como PAN, AADHAAR y otros documentos incluyendo libretas bancarias y cheques, y extraer los registros de campos de esos documentos. También ten en cuenta que PAN y AADHAAR son documentos de identificación específicos de la región de India.
La aplicación cliente se verá de la siguiente manera:
Puedes acceder a una aplicación funcional y probar su funcionalidad aquí: ¡Prueba la App!
La aplicación Document Processor aprovecha los siguientes servicios de Catalyst y sus componentes:
-
- Functions: Codificaremos una función Advanced I/O en Node.js. Contiene la lógica que te permite procesar y extraer datos de los documentos o imágenes de entrada. Hemos aprovechado el paquete SDK de Catalyst Zia Services para Node.js para este propósito.
-
- Web Client Hosting: Crearemos e inicializaremos el cliente web como una aplicación React en este tutorial usando plugins integrados de Catalyst. La aplicación cliente se alojará en Catalyst usando Web Client Hosting.
-
-
OCR: Este componente te ayuda a detectar y reconocer caracteres textuales en tus documentos digitales o imágenes de entrada, y convertirlos a texto codificado por máquina. Catalyst OCR puede reconocer textos en 10 idiomas principales.
-
Barcode Scanner: Este componente te permite escanear códigos de barras y extraer la información codificada en ellos. Puedes aprender más sobre los formatos de códigos de barras soportados en esta página.
-
Identity Scanner: El componente Identity Scanner te permite escanear y extraer datos de documentos de identificación comunes como tarjetas AADHAAR, tarjetas PAN, libretas bancarias y cheques. Consulta esta página para aprender más sobre los idiomas, formatos de archivo y tamaños de archivo soportados.
-
Usaremos la consola web de Catalyst y la Interfaz de Línea de Comandos (CLI) de Catalyst para construir esta aplicación.
Puedes obtener el código del tutorial de este repositorio git. Tendrás que reemplazar los archivos en el directorio del proyecto según se indica en las secciones de configuración de función y cliente de este tutorial.
Última actualización 2026-03-20 21:51:56 +0530 IST
