Axional OCR

OCR (reconocimiento Ć³ptico de caracteres) es una tecnologĆ­a de reconocimiento Ć³ptico nueva y avanzada. Extrae el texto de una imagen o documento escaneado para almacenarlo e indexarlo automĆ”ticamente en una base de datos, entre otras funciones. Como caracterĆ­stica general, este sistema de reconocimiento de datos se aplica utilizando expresiones regulares de reconocimiento de patrones dentro del texto.

Entre otras caracterĆ­sticas, Axional OCR facilita la entrada de datos para varios tipos de documentos que sirven como punto de partida para los procesos comerciales especĆ­ficos de la empresa. Asimismo, simplifica el almacenamiento y archivo de la informaciĆ³n, eliminando la necesidad de acceder al documento fĆ­sico para poder examinarlo en detalle.

Axional OCR proporciona asĆ­ un eficiente sistema de entrada de informaciĆ³n para las bases de datos de la empresa, haciendo posible la integraciĆ³n de cualquier documento fĆ­sico estructurado. Este modelo Axional tiene como objetivo, mĆ”s especĆ­ficamente, integrar automĆ”ticamente las facturas de proveedores digitalizadas en la base de datos del sistema ERP.

1 Requisitos previos: generaciĆ³n de PDF editar.
Para el correcto funcionamiento de la aplicaciĆ³n, es necesario que los documentos sean PDF digitales con capa de texto, es decir, documentos como documentos en papel escaneados o archivos PDF, que han sido transformados en textos digitalizados. El documento transformado se ve exactamente como el original, pero permite el reconocimiento de datos en los datos que se pueden buscar. Es fĆ”cil reconocer este tipo de archivos, ya que el texto es seleccionable.

Hoy en dĆ­a es muy comĆŗn recibir las facturas de los proveedores por correo electrĆ³nico, y es muy probable que estĆ©n en un PDF con formato de capa de texto. Cuando no se dispone de PDF con capa de texto, es necesario transformarlos. Esta transformaciĆ³n es un procedimiento externo a la aplicaciĆ³n. La generaciĆ³n de documentos puede ser realizada por un proveedor externo o utilizando una aplicaciĆ³n de escaneo de documentos con capacidades especiales. Por ejemplo, puede utilizar Tesseract como motor de OCR de cĆ³digo abierto. AdemĆ”s, la mayorĆ­a de las impresoras con escĆ”ner actuales tienen una aplicaciĆ³n OCR.

Una visiĆ³n global de su empresa para tomar las mejores decisiones.

Estructura

El proceso de integraciĆ³n de los datos obtenidos del documento PDF en el sistema se lleva a cabo en varias etapas consecutivas.

El funcionamiento de la aplicaciĆ³n tiene diferentes etapas:

  • GeneraciĆ³n de PDF: procedimiento externo (ver apartado anterior).
  • DefiniciĆ³n de carga de PDF: el sistema carga archivos PDF en el sistema utilizando una configuraciĆ³n previamente definida en funciĆ³n de cada tipo de documento. Esta configuraciĆ³n incluye carpetas especĆ­ficas en el servidor donde colocar los archivos cargados o procesados.
  • CreaciĆ³n de plantilla: cada tipo de documento a procesar debe tener una plantilla asignada. Esta plantilla se crea en base a un documento prototipo de cada tipo de documento. Por ejemplo, las facturas de los clientes deben tener asignada una plantilla, ya que cada uno de estos documentos debe tener una estructura repetitiva y contiene los mismos datos que nos interesan para la extracciĆ³n. Otro tipo de documento, por ejemplo, un DNI / DNI, debe tener su propia plantilla. Para cada tipo de documento diferente es necesario configurar una nueva plantilla.
  • ExtracciĆ³n de datos: el sistema intentarĆ” cargar datos en base a un modelo de carga y extraer datos en base a una plantilla asignada.
  • IntegraciĆ³n interna: los datos procesados ā€‹ā€‹se transferirĆ”n a una tabla interna predefinida (tabla de destino). Este es el Ćŗltimo paso del proceso de funcionamiento de Axional OCR.

Potencia tu empresa hoy

Nuestro equipo estĆ” listo para ofrecerte los mejores servicios