Axional OCR
OCR (reconocimiento Ć³ptico de caracteres) es una tecnologĆa de reconocimiento Ć³ptico nueva y avanzada. Extrae el texto de una imagen o documento escaneado para almacenarlo e indexarlo automĆ”ticamente en una base de datos, entre otras funciones. Como caracterĆstica general, este sistema de reconocimiento de datos se aplica utilizando expresiones regulares de reconocimiento de patrones dentro del texto.
Entre otras caracterĆsticas, Axional OCR facilita la entrada de datos para varios tipos de documentos que sirven como punto de partida para los procesos comerciales especĆficos de la empresa. Asimismo, simplifica el almacenamiento y archivo de la informaciĆ³n, eliminando la necesidad de acceder al documento fĆsico para poder examinarlo en detalle.
Axional OCR proporciona asĆ un eficiente sistema de entrada de informaciĆ³n para las bases de datos de la empresa, haciendo posible la integraciĆ³n de cualquier documento fĆsico estructurado. Este modelo Axional tiene como objetivo, mĆ”s especĆficamente, integrar automĆ”ticamente las facturas de proveedores digitalizadas en la base de datos del sistema ERP.
1 Requisitos previos: generaciĆ³n de PDF editar.
Para el correcto funcionamiento de la aplicaciĆ³n, es necesario que los documentos sean PDF digitales con capa de texto, es decir, documentos como documentos en papel escaneados o archivos PDF, que han sido transformados en textos digitalizados. El documento transformado se ve exactamente como el original, pero permite el reconocimiento de datos en los datos que se pueden buscar. Es fĆ”cil reconocer este tipo de archivos, ya que el texto es seleccionable.
Hoy en dĆa es muy comĆŗn recibir las facturas de los proveedores por correo electrĆ³nico, y es muy probable que estĆ©n en un PDF con formato de capa de texto. Cuando no se dispone de PDF con capa de texto, es necesario transformarlos. Esta transformaciĆ³n es un procedimiento externo a la aplicaciĆ³n. La generaciĆ³n de documentos puede ser realizada por un proveedor externo o utilizando una aplicaciĆ³n de escaneo de documentos con capacidades especiales. Por ejemplo, puede utilizar Tesseract como motor de OCR de cĆ³digo abierto. AdemĆ”s, la mayorĆa de las impresoras con escĆ”ner actuales tienen una aplicaciĆ³n OCR.
Una visiĆ³n global de su empresa para tomar las mejores decisiones.
Estructura
El proceso de integraciĆ³n de los datos obtenidos del documento PDF en el sistema se lleva a cabo en varias etapas consecutivas.
El funcionamiento de la aplicaciĆ³n tiene diferentes etapas:
- GeneraciĆ³n de PDF: procedimiento externo (ver apartado anterior).
- DefiniciĆ³n de carga de PDF: el sistema carga archivos PDF en el sistema utilizando una configuraciĆ³n previamente definida en funciĆ³n de cada tipo de documento. Esta configuraciĆ³n incluye carpetas especĆficas en el servidor donde colocar los archivos cargados o procesados.
- CreaciĆ³n de plantilla: cada tipo de documento a procesar debe tener una plantilla asignada. Esta plantilla se crea en base a un documento prototipo de cada tipo de documento. Por ejemplo, las facturas de los clientes deben tener asignada una plantilla, ya que cada uno de estos documentos debe tener una estructura repetitiva y contiene los mismos datos que nos interesan para la extracciĆ³n. Otro tipo de documento, por ejemplo, un DNI / DNI, debe tener su propia plantilla. Para cada tipo de documento diferente es necesario configurar una nueva plantilla.
- ExtracciĆ³n de datos: el sistema intentarĆ” cargar datos en base a un modelo de carga y extraer datos en base a una plantilla asignada.
- IntegraciĆ³n interna: los datos procesados āāse transferirĆ”n a una tabla interna predefinida (tabla de destino). Este es el Ćŗltimo paso del proceso de funcionamiento de Axional OCR.
Potencia tu empresa hoy
Nuestro equipo estĆ” listo para ofrecerte los mejores servicios