IntegraciĆ³n de documentos digitales (OCR)

IntegraciĆ³n de documentos digitales (OCR)

OCR (Optical Character Recognition) corresponde a una tecnologĆ­a de reconocimiento de caracteres Ć³ptico avanzado. Permite extraer el texto de una imagen o de un documento escaneado, de manera que puede ser introducido e indexado automĆ”ticamente en la base de datos, entre otras utilidades. Como caracterĆ­stica general, el sistema de reconocimiento de datos del documento se realiza mediante la aplicaciĆ³n de expresiones regulares de reconocimiento de patrones dentro del texto. Cada patrĆ³n se corresponde a un concepto o unidad de informaciĆ³n del documento.

Como caracterĆ­sticas,Ā Axional/OCRĀ complementa la entrada de todo tipo de documentos que actĆŗan como origen para los distintos procesos de negocio definidos en cada empresa. Asimismo permite simplificar el almacenamiento y archivo de la informaciĆ³n, eliminando la necesidad de disponer del documento fĆ­sico en el propio lugar donde se demande su examen detallado. Por tanto, es una entrada de informaciĆ³n eficiente a la base de datos para incorporar los datos contenidos de cualquier documento fĆ­sico y estructurado de la empresa. Este mĆ³dulo del sistemaĀ Axional/OCRĀ se utiliza concretamente para la incorporaciĆ³n automĆ”tica de facturas digitalizadas de proveedores al sistema de base de datos ERP de la empresa.

Como ventajas complementarias mencionar que la automatizaciĆ³n en introducciĆ³n de informaciĆ³n al sistema evita los errores inherentes a la entrada manual por parte de operarios y la implicaciĆ³n que por ello supone respecto a una mayor fiabilidad y eficiencia en la gestiĆ³n de la informaciĆ³n. AdemĆ”s, la automatizaciĆ³n conlleva un importante ahorro en recursos humanos.

Como caracterĆ­sticas generales del sistema OCR/Axional mencionar entre otros los siguientes puntos:

  • Procesamiento integral por lote de documentos.
  • OpciĆ³n de almacenamiento de archivos por unidades de documentos, el archivo de entrada se subdivide en unidades mediante parametrizaciĆ³n de patrĆ³n de corte.
  • Herramienta de subdivisiĆ³n manual del fichero en unidades de documentos.
  • AplicaciĆ³n automĆ”tica de plantilla en el documento mediante mĆŗltiples criterios de selecciĆ³n.
  • AplicaciĆ³n multi-plantilla por modelo de documento.
  • LocalizaciĆ³n iterativa de valores de campos.
  • Multicriterio de definiciĆ³n de regiĆ³n o patrĆ³n para cada valor a extraer.
  • EstandarizaciĆ³n de campos numĆ©ricos y de fecha segĆŗn lenguaje por regiĆ³n (anglosajĆ³n, europeo ā€¦).
  • ValidaciĆ³n de informaciĆ³n requerida y correspondencias entre maestros y datos clave extraĆ­dos.
  • Validaciones grupales de Ć­tems del documento segĆŗn criterios inherentes de equivalencia y afinidad entre los distintos Ć­tems.
  • CĆ”lculos de informaciĆ³n en Ć­tems preestablecidos.
  • Ajuste ā€˜ex-postā€™ de los valores obtenidos.
  • RetroalimentaciĆ³n del circuito de validaciĆ³n para autoaprendizaje en la conformaciĆ³n del texto extraido.
  • Control de estado y modificaciones de lote.
  • Control de estados y seguimiento de cambios en los documentos.
  • Enlace drill&across para acceder a los documentos resultantes.

 

PodrĆ” planificar recuentos guiados o ciegos, de cierre o rotativos contemplando todas las variables de inventario, tales como artĆ­culos, familias, localizaciĆ³n, rotaciĆ³n, categorĆ­as ABC, etc. Esta capacidad permite sistematizar generaciĆ³n automĆ”tica de regularizaciones de stock, maximizando, de esta manera, la fiabilidad de su inventario permanente.

A continuaciĆ³n se detallan todos los procesos que intervienen en el caso concreto de generaciĆ³n de la factura del proveedor en la Ā base de datos, desde la recogida de ficheros, pasando por la extracciĆ³n de la informaciĆ³n hasta la generaciĆ³n final de la factura.

  • En primera instancia, el proceso de recogida de facturas escaneadas realiza la incrustaciĆ³n de la capa de metacaracteres al fichero pdf para el posterior reconocimiento del texto de la factura. En este punto, el documento pdf siempre contendrĆ” la informaciĆ³n a disponibilidad para su posterior extracciĆ³n. SeguidamenteĀ en este punto, en el momento de introducir el documento en la base de datos, se realiza un filtro mediante patrĆ³n de corte para la sub-divisiĆ³n en unidades de factura de archivos del proveedor.

 

  • Seguidamente, mediante la plantilla (patrĆ³n del formato de factura de un proveedor), se realiza la bĆŗsqueda y extracciĆ³n de los metadatos contenidos en el texto del documento de factura digitalizado. Por tanto, se requiere un proceso previo de generaciĆ³n o predefiniciĆ³n de plantillas por formato de facturas. Las plantillas se debenĀ definir para especificar las correspondiente expresiones de bĆŗsqueda de metadatos y de este modo extraer puedan extraer la correspondiente informaciĆ³n del documento escaneado.
    Cabe destacar que la asignaciĆ³n de la plantilla a una factura de proveedor es un proceso automĆ”tico. Axiolab/OCR reconoce dentro del texto del documento digitalizado a que plantilla de proveedor es posible asignar el documento procesado. Al mismo tiempo, como caracterĆ­stica a destacar de este modulo, el sistema permite definir mĆŗltiples plantillas (multi-template) por proveedor de manera que el proceso evaluarĆ” que plantilla ofrece el mĆ”ximo nĆŗmero de concurrencias para optimizar la efectividad de la extracciĆ³n de la informaciĆ³n del fichero.

 

  • Una vez extraĆ­do el texto del documento mediante la aplicaciĆ³n de las expresiones de la plantilla, estos datos son indexados con la informaciĆ³n correspondiente en base de datos para su validaciĆ³n, paso previo para generaciĆ³n de la factura o del documento de destino enĀ Axional/ERP. Este proceso de validaciĆ³n confirma que se tiene disponible toda la informaciĆ³n requerida para generar definitivamente la factura. En este punto la informaciĆ³n de los diferentes items de informaciĆ³n es editable para poder realizar los ajustes oportunos en caso que el escaneado de la factura no hubiera sido suficientemente efectivo para la extracciĆ³n de la informaciĆ³n. Cabe destacar en este sentido que la efectividad de los procedimientos de reconocimiento de texto tienen sus limitaciones, especialmente si las fuente de informaciĆ³n es defectuosa.
    Es importante destacar como otra de las caracterĆ­sticas principales de este mĆ³dulo que el sistema se retro-alimenta a partir de los cambios y modificaciones realizadas manualmente por parte del operario. Esta auto-retroalimentaciĆ³n, permite al sistema aprender de los errores de digitalizaciĆ³n para una posterior interpretaciĆ³n correcta de la informaciĆ³n, en los siguientes procesamientos de un formato de factura o documento. Por tanto,la base de datos almacena por plantilla ciertas modificaciones para ser utilizadas, automĆ”ticamente, en el procesamiento de las posteriores facturas de esta plantilla.

 

  • Una vez que el proceso de validaciĆ³n de datos ha verificado que la informaciĆ³n es correcta, se procede a generar automĆ”ticamente la factura o documento destino. El proceso de generaciĆ³n de la factura, ademĆ”s, conformarĆ” los albaranes pendientes de facturaciĆ³n en caso que el formato de factura del proveedor contenga la informaciĆ³n de orden de compra o nota de entrega del proveedor. En caso que la factura no conforme con ninguna nota de entrega, el sistema propondrĆ” una factura directa de compra. El proceso identifica si el documento es un factura o rectificaciĆ³n de factura (nota de crĆ©dito o abono) a travĆ©s de la informaciĆ³n contenida en el documento. Al mismo tiempo tambiĆ©n identifica si la compra hace referencia a una inversiĆ³n o es un gasto.

 

  • GestiĆ³n de la factura generada: a partir de la factura generada se validan los importes mediante circuitos de workflow y autorizaciones conforme la factura del proveedor es correcta. Para terminar, cabe mencionar como Ćŗltima finalidad que el sistema controla duplicidades tanto en la entrada de archivos a procesar como duplicidades en generaciĆ³n de las facturas.

 

Axional/OCRĀ proporciona un entorno completo para la integraciĆ³n, tratamiento y archivo de documentos fĆ­sicos.

Potencie su empresa hoy

Nuestro equipo estĆ” listo para ofrecerte los mejores servicios