Navigation: Scan2x French Handbook > Utilisation de ce manuel > Guide administrateurs (configuration de Scan2x) > Définition de la tâche de numérisation > Onglet « Métadonnées » > zones d’OCR >

Capture de données de tableaux au format de table (ex. traitement de factures)

 

 

 

 

Capture de données de tableaux au format de table (ex. traitement de factures)

 

Scan2x permet de définir la fonctionnalité OCR d’un champ de métadonnées sous forme de tables ou de tables avec en-têtes. Pour plus d’informations sur la méthode, voir la page 154. Une fois la zone OCR de la table définie, les données de tableau détectées dans la zone au moment de la numérisation sont formatées par Scan2x sous forme de tableau, ce qui reflète la structure du document à numériser. Si le document comporte une table contenant six colonnes, les données obtenues après l’OCR sont également dotées de six colonnes correspondant exactement au document.

 

 

Bien que cela soit acceptable pour certaines opérations et certains documents, il est souvent nécessaire de « normaliser » les données provenant de plusieurs modèles de documents de même type en un seul format commun. Prenons un exemple de comptabilité fournisseurs :

 

Lors de la numérisation des factures de différents fournisseurs, il est normal que chaque fournisseur dispose de sa propre mise en page. La position des données sur la page changera d’un fournisseur à l’autre, et les données de tableau changent à la fois de position et de contenu. Par exemple, le « Fournisseur ABC » peut répertorier chaque poste sur six colonnes, alors que le « Fournisseur DEF » peut répertorier chaque poste sur neuf colonnes de données.

 

Si Scan2x doit de traiter chacune de ces factures afin de fournir des données à un système ERP, ce dernier s’attend à un format commun de données entrantes, indépendamment des données de facturation du fournisseur.

 

Scan2x est capable de gérer cette normalisation des données en permettant de définir un champ de métadonnées sous forme de tableau dans lequel le format ERP standard peut être défini. Un écran de traduction est alors disponible, ce qui permet de convertir le format de données de chaque modèle en celui de l’ERP.

 

Capture de données de tableaux régulières et normalisées à partir de différents documents

Lorsqu’un champ de métadonnées est défini comme un tableau, il est possible de définir des colonnes avec des noms de colonnes. Cette fonctionnalité est particulièrement utile lorsque l’on capture des données sous forme de tableaux à partir de différents formats de documents.

 

Prenons les factures pour exemple. Les factures de différentes entreprises seront organisées différemment et auront des types de tableaux différents pour les lignes figurant sur la facture. Même les colonnes contenant les mêmes informations (par exemple, la quantité ou la description des éléments) auront des en-têtes de colonnes différents. Si notre tableau de métadonnées ne comporte pas de définition, les en-têtes de tableaux en sortie sous forme de métadonnées lors de l’enregistrement du document auront les noms de colonne définis dans le document source.

 

Afin d’assurer des en-têtes de colonnes homogènes, Scan2x permet de définir vos propres noms de colonnes et vous pouvez ensuite mapper les colonnes de la facture avec vos propres colonnes. Si vous utilisez les métadonnées capturées à partir des factures pour importation dans une application en aval, il est essentiel de normaliser vos données de tableau dans un format de tableau standard.

 

Cliquez sur le bouton Table de définition de l’onglet Gestionnaire des tâches : ce bouton s’affiche lorsque vous sélectionnez un champ de métadonnées défini comme un tableau. Voir la capture d’écran suivante.

 

 

 

Lorsque vous cliquez sur le bouton Table de définition, une grille apparaît comme l’illustre la capture d’écran ci-dessous. La capture ci-dessous présente la définition du tableau de la tâche Bordereaux de livraison incluse dans la démonstration Scan2x.

 

Ajoutez des colonnes à vos définitions de colonnes en saisissant chacune d’elles dans la liste, comme illustré ci-après.

 

Trier. Vous pouvez utiliser cette valeur pour trier les colonnes du tableau selon les besoins.

Champ. Saisissez le nom de votre colonne de tableau.

Type. Sélectionnez entre « Personnalisé » et « Expression (VBScript) ». La personnalisation est la valeur par défaut : les données enregistrées par OCR dans le document seront lues avec précision. L’utilisation d’une expression vous permet d’utiliser VBScript pour améliorer ou enrichir la reconnaissance optique des caractères (OCR) des données du document.

Carte vers la colonne OCR. Utilisez cette valeur pour indiquer à Scan2x quelle colonne de documents vous souhaitez mapper avec votre tableau.

Mode ligne. Vous pouvez spécifier la quantité de données lues à partir du document à insérer dans votre colonne.

 

 

 

Copyright © 2022 Avantech Software