Captura de datos tabulares en formato de tabla (por ejemplo, procesamiento de facturas)

 

En Scan2x, es posible definir la funcionalidad OCR de un campo de metadatos como Tabla o Tabla con encabezados; para obtener más información sobre cómo hacer esto, consultelaPestaña de mejores prácticas de zonas de OCR .

Una vez que se define una zona de OCR de tabla, Scan2x formatea cualquier dato tabular que se encuentre dentro de la zona en el momento del escaneo como una tabla, lo que refleja la estructura del documento que se escanea.

Si el documento tiene una tabla con seis columnas, los datos resultantes después de OCR también tendrán seis columnas que coincidirán exactamente con el documento.

 

 

 

Si bien esto es aceptable para algunas operaciones y documentos, a menudo es necesario "normalizar" los datos procedentes de múltiples plantillas de documentos del mismo tipo en un formato común.

Consideremos un ejemplo de cuentas por pagar:

 

Al escanear las facturas de los acreedores de varios proveedores diferentes, es normal que cada proveedor tenga su propio diseño de factura. Las posiciones de los datos en la página cambiarán de un proveedor a otro, y los datos tabulares cambiarán tanto en la posición como en el contenido; por ejemplo, "Proveedor ABC" puede enumerar cada elemento de línea en seis columnas, mientras que "Proveedor DEF" puede enumerar cada elemento de línea en nueve columnas de datos.

 

Si Scan2x va a procesar cada una de estas facturas para proporcionar información a un sistema ERP, ese ERP esperará un formato común de datos entrantes independientemente de qué datos de facturas de proveedores se estén proporcionando.

Scan2x puede manejar esta normalización de datos al permitir que un campo de metadatos se defina como una tabla, en la que se puede definir el formato ERP estandarizado. A continuación, se encuentra disponible una pantalla de traducción que permite la transformación del formato de datos de cada plantilla al del ERP.

 

Captura de datos tabulares normalizados y coherentes de diferentes documentos

Cuando un campo de metadatos se define como una tabla, es posible definir columnas con nombres de columna. Esto es especialmente útil al capturar datos tabulares de diferentes formatos de documentos.

 

Tomemos las facturas como ejemplo. Las facturas de las distintas empresas se distribuirán de forma diferente y tendrán distintos tipos de tablas para los artículos de línea de la factura.

Incluso las columnas que contienen la misma información (por ejemplo, cantidad o descripción del artículo) tendrán diferentes encabezados de columna.

Si nuestra tabla de metadatos se deja sin una definición, la salida de los encabezados de la tabla como metadatos cuando se guarda el documento tendrá los nombres de columna definidos en el documento de origen.

 

Para garantizar encabezados de columna consistentes, Scan2x le permitirá definir sus propios nombres de columna y luego podrá asignar las columnas de la factura a sus propias columnas.

Si está utilizando los metadatos capturados de las facturas para importarlos a una aplicación posterior, es esencial normalizar sus datos tabulares en un formato de tabla estándar.

 

Haga clic en el botón Definir tabla en la pestaña de metadatos del Administrador de trabajos; esto aparece cuando selecciona un campo de metadatos definido como una tabla. Vea la siguiente captura de pantalla. 

 

 

 

 

Cuando hace clic en elbotón Definir tabla , aparece una cuadrícula como la de la captura de pantalla a continuación. La imagen siguiente muestra la definición de la tabla para el trabajo de Notas de entrega incluido con la demostración de Scan2x.

 

Agregue columnas a las definiciones de sus columnas ingresando cada una en la lista, como se muestra.

 

 

Clasificación. Puede utilizar este valor para ordenar las columnas de la tabla según sea necesario.

Campo. Ingrese el nombre de la columna de su tabla.

Tipo. Elija entre "Personalizado" y "Expresión (VBScript)". Personalizado es el valor predeterminado: tomará los datos OCR del documento exactamente como se leyeron en el documento. El uso de una expresión le permite utilizar VBScript para mejorar o enriquecer los datos OCR del documento.

Mapear a columna OCR. Utilice este valor para indicar a Scan2x qué columna de documento le gustaría asignar a su tabla.

Modo de línea. Puede especificar cuántos datos leídos del documento se insertarán en su columna.

 

 

 

Copyright © 2023 Avantech Software