Onglet « Post-traitement »

 

 

Cette fonction nécessite l’importation d’un modèle de document avant de pouvoir l’utiliser.

 

L’onglet Post-traitement permet de définir les règles à suivre par Scan2x après réception des images de page du scanner. Le nombre de règles pouvant être définies par document est illimité, et chaque règle peut être définie pour fonctionner sur une seule page ou même sur une petite partie d’une page du document.

 

Il est possible de définir des règles afin de modifier ou d’améliorer l’image reçue du scanner, et vous pouvez choisir d’indiquer si les modifications ne sont utilisées que durant le processus OCR (c’est-à-dire non enregistrées avec le document final dans sa destination finale) ou si elles sont réutilisées jusqu’à sa destination finale. Par exemple, considérons les cas suivants :

 

Le document numérisé comporte un numéro de commande en blanc sur un fond coloré.

 

 

Dans cet exemple, le numéro de commande que Scan2x doit récupérer à des fins de métadonnées est imprimé en blanc sur un fond coloré, ce qui peut gêner le processus OCR dans la mesure où il devient peu fiable. Dans ce cas, nous pouvons définir des règles qui inverseront les couleurs dans une zone ou remplaceront l’arrière-plan couleur uniquement par du blanc et l’impression blanche existante par du noir, ce qui laissera le texte de référence intact dans la zone correspondante. Le processus OCR sera ainsi doté d’une image noir et blanc idéale pour le processus de reconnaissance optique des caractères. Il n’est PLUS nécessaire de continuer à modifier la règle et, par conséquent, le remplacement des couleurs est éliminé à la suite de l’opération OCR, ce qui préserve l’image originale du document.

 

Le document numérisé est de mauvaise qualité.

 

 

Dans cet exemple, il est nécessaire d’augmenter le contraste de la post-numérisation du document afin d’améliorer la lisibilité générale du fait de la mauvaise qualité de l’article d’origine. Dans ce cas, nous pouvons créer une règle visant à accroître le contraste et à conserver les modifications apportées au document final dans sa destination.

 

Appuyez sur le bouton Add New (Nouveau) pour afficher l’écran de définition des règles concernant une nouvelle règle de post-traitement.

 

Configuration des règles de post-traitement

 

Chaque règle de post-traitement peut être configurée pour traiter une page entière ou une section de page. Dans la capture d’écran ci-dessus, la règle est configurée pour traiter uniquement la zone comprise dans le cadre rouge. Cette zone est définie en faisant glisser le cadre avec la souris ou le doigt de l’angle supérieur gauche vers le bas à droite. Si vous utilisez une interface avec écran tactile, appuyez deux fois sur l’écran avec le doigt dans le coin supérieur gauche du cadre prévu. Avec une souris, double-cliquez sur le coin supérieur gauche. Dans les deux cas, faites glisser le cadre vers le coin inférieur droit de la taille finale prévue.

 

 

L’extrémité gauche de l’écran contient les commandes de la règle. La partie supérieure affiche une zone de saisie de texte dans laquelle vous pouvez saisir un nom de règle. Ce nom n’est pas obligatoire ; toutefois, ce nom figure dans la liste des règles de l’onglet principal « Post-traitement », comme décrit ci-dessus – le nom descriptif de chacune des règles vous aidera à savoir quelles options de post-traitement vous avez sélectionnées en un clin d’œil.

 

Le bouton Prévisualisation en cours permet d’actualiser l’image après avoir effectué les réglages de règle. La fonction d’actualisation est une option manuelle qui vous permet d’effectuer plusieurs réglages en une seule fois, sans avoir à attendre l’exécution de la règle de post-traitement à chaque réglage. La liste déroulante 

 

Appliquer à permet d’indiquer si la règle actuelle doit affecter toutes les pages du document ou si elle doit être exécutée uniquement sur une page spécifique.  Les cases à cocher et les curseurs Luminosité et Contraste permettent d’augmenter ou de réduire ces paramètres en conséquence. Les cases doivent être cochées pour que les curseurs fonctionnent et que la fonction prenne effet.

 

La case à cocher Enregistrer document permet de spécifier si les fonctions de traitement de document définies ici sont utilisées uniquement pendant le processus OCR (c’est-à-dire pour « affiner » la zone sélectionnée afin d’améliorer la précision du processus OCR). Si la case n’est pas cochée, le traitement des documents ne sera pas reflété dans le document de sortie final. Par exemple, si une règle de post-traitement est configurée et que le texte jaune devient noir et que la case « Enregistrer document » n’est pas cochée, le document de sortie final contiendra du texte jaune. Si la case est cochée, le texte apparaît en noir dans le document final.

 

La fonction Appliquer le processus après OCR permet d’appliquer la règle après la fin du processus OCR, normalement lorsqu’un texte spécifique sur le document doit passer en OCR, puis être expurgé (suppression ou occultation) dans le document final. Un exemple d’utilisation de ce type de document est la numérisation de documents d’identité en Allemagne, où la législation interdit de stocker des numérisations de cartes d’identité présentant l’ensemble de la zone pouvant être lue en machine.

 

La fonction Inverser les couleurs permet de remplacer une couleur du document entrant par une autre couleur spécifique de votre choix. L’exemple de la capture d’écran ci-dessous montre une règle qui a été définie avec une zone (cadre rouge indiqué par la flèche) dans laquelle l’option « Inverser les couleurs » est passée de rouge à bleu.

 

 

La case à cocher et le curseur fonctionnent de la même façon que pour la luminosité et le contraste. Un clic sur les cadres de couleur affiche une boîte de dialogue de couleurs standard à choisir, tandis que le bouton Pipette à droite permet une sélection très précise de la couleur à remplacer dans le document proprement dit. En cliquant sur la pipette et en la faisant glisser sur la couleur que vous souhaitez identifier avant de relâcher la souris, il est possible de choisir la couleur exacte dont vous avez besoin. Cela fonctionne pour la couleur à remplacer et pour la couleur de remplacement. Le curseur contrôle l’intensité de la fonction d’inversion des couleurs.

 

Reportez-vous à la section consacrée au post-traitement dans la section Concepts du présent manuel à la page 68 pour plus de détails sur les raisons de son utilité.

 

La fonction Noir blanc applique un algorithme à la page, au document ou à la zone sélectionnée dans la règle pour la convertir en image binaire ou monochrome. Pour plus d’informations sur la manière dont cette fonction peut être utilisée efficacement, reportez-vous à la section ci-dessus.

 

Les quatre cases suivantes permettent d’appliquer différents filtres d’image qui peuvent être utiles pour des types de documents spécifiques. Une brève explication figure ci-après.

 

UnsharpMask (Masque flou). Le terme « unsharp » provient du fait que la technique utilise une image négative floue pour créer un masque de l’image d’origine. Le masque flou est alors associé à l’image positive (originale), ce qui crée une image moins floue que l’original. L’image résultante, bien que plus claire, peut constituer une représentation moins précise de l’objet de l’image.

 

 Amélioration des bords. L’amélioration des bords est un filtre de traitement d’image qui améliore le contraste d’une image afin de tenter d’améliorer son acutance (netteté apparente).

 

Le filtre fonctionne en identifiant les bords nets de l’image, par exemple le bord entre un sujet et l’arrière-plan d’une couleur contrastée et en augmentant le contraste de l’image dans la zone immédiatement autour du bord. Cela a pour effet de créer des hautes lumières claires et sombres subtiles de chaque côté des bords de l’image, appelées et surmodulation et sous-modulation, ce qui permet de mieux définir le bord.

 

Filtre. Suppression des points positifs et négatifs, lissage des bords.

 

Lisser. Exécute des algorithmes de lissage de l’image sur la zone d’intérêt afin d’éliminer le bruit aléatoire.

 

Invert Colours (Inverser les couleurs). Inverse toutes les couleurs de la zone.

 

Texte, Code à barre, QR Code. Il est possible de superposer du texte, des codes-barres ou des codes QR sur une image numérisée. Le contenu peut être fixe ou dynamique, en fonction des métadonnées du document. Cette fonctionnalité peut servir à récupérer un document numérisé avec, par exemple, la date de numérisation et le nom d’utilisateur ou l’ID de la personne qui l’a numérisée. Les calques de code QR servent à marquer chaque document avec une référence cryptée pour une conformité sécurisée ou simplement à automatiser les processus en aval pour les clients.  Tout cachet de document créé de cette manière s’affiche dans la zone définie décrite ci-dessus.

 

 

 

Copyright © 2022 Avantech Software