Onglet « Paramètres de la numérisation »

 

Pour définir la résolution de numérisation de cette tâche, saisissez la résolution requise dans la zone de texte DPI. Utilisez la liste déroulante Mode de numérisation pour sélectionner les numérisations couleur, en niveaux de gris ou en noir et blanc (binaire). En outre, il peut également exister des modes propriétaires supplémentaires en fonction des modèles de scanners.

 

La case Amélioration du texte et le menu déroulant associé permettent de sélectionner les modes Amélioration poussée de Canon pour la numérisation en noir et blanc. Lorsque cette case est cochée, les curseurs Luminosité et Contraste sont disponibles, ce qui permet de contrôler la fonction d’amélioration poussée du scanner Canon avec une précision personnalisée. Utilisez ce réglage pour améliorer la lisibilité du texte sur la reconnaissance optique des caractères pendant le processus de numérisation. Les commandes Éliminer la couleur et Améliorer la couleur permettent de désactiver ou de dynamiser les scanners rouge, vert et bleu sur les scanners de documents Canon.

 

L’option Nécessite un QR code sur la première page du document numérisé permet d’analyser la première page d’un document numérisé, afin de vérifier l’existence d’un code QR. En option, nous pouvons même vérifier que le code QR détecté contient une valeur spécifique telle que définie dans la zone de texte Valeur attendue du code QR. Si aucun code QR n’est détecté ou ne contient la valeur en option indiquée ci-dessus, Scan2x affiche un avertissement. Cette fonction est généralement utilisée dans les cas où la vérification et la validation du niveau de document sont nécessaires, afin de s’assurer que seuls les documents valides sont numérisés.  L’option Lecture du code barre sur la première page numérisée est utilisée de la même façon, mais avec cette option, il est possible de spécifier la variante de codes-barres utilisée à l’aide de la liste déroulante Type de code barre.

 

Scan2x permet de valider les cartes d’identité et les passeports conformes à la norme internationale établie par l’OACI (Organisation de l’Aviation Civile Internationale). Les documents contiennent une zone lisible en machine (MRZ), qui est automatiquement reconnue, interprétée et validée par Scan2x lorsque l’option Numériser les cartes d’identité ou Numériser les passeports est activée. Les champs de métadonnées sont créés automatiquement lorsque les modes Carte d’identité ou Passeport sont activés, afin de stocker les informations collectées à partir de la zone MRZ.

 

Le processus de validation implique la mise en correspondance du système avec les totaux de contrôle MRZ intégrés et le reste des données de la MRZ. Une fois les contrôles validés, le système vérifie également que la date d’aujourd’hui (c’est-à-dire la date de numérisation) est ultérieure ou égale à la date d’expiration officielle du document. En cas d’échec d’une de ces vérifications, l’utilisateur reçoit un message d’avertissement et Scan2x n’autorisera pas l’enregistrement du document.

 

En outre, il est également possible de vérifier l’identité du détenteur du document à l’aide des services Web afin de vérifier les bases de données externes.

 

Pour la numérisation de cartes d’identité, plusieurs sous-options sont disponibles. L’option Accepter les cartes d’identité expirées supprime l’avertissement utilisateur affiché lors de la détection d’une carte périmée. L’activation de l’option Fusionner en 1 page, demande à Scan2x de numériser les deux faces de la carte d’identité et de les fusionner en une seule page PDF avec le texte (si l’option est activée). Cela facilite l’affichage d’un document d’identité complet dans un système tiers en appelant une seule page. L’option Ajouter une attestation ajoute une bande au bas du document avec le texte « Copie certifiée conforme du document original acquis et vérifié par <nom d’utilisateur> à partir de l’ID d’unité : <ID unité Scan2x>, le <date> à <heure> ». En règle générale, l’option Ignorer les erreurs MRZ n’est pas activée, ce qui signifie que Scan2x doit trouver une zone lisible en machine à la page deux du document d’ID. Cela signifie toutefois qu’il n’est pas possible de traiter les documents qui n’ont pas de zone MRZ à l’aide de Scan2x. L’activation de la fonction Ignorer permet de numériser des documents d’identité non MRZ (par ex., permis de conduire) à l’aide de l’option de numérisation de carte d’identité.

 

L’option Numériser les chèques permet d’activer la détection automatique des chèques bancaires par Scan2x. Lorsque cette case est activée, Scan2x suppose que chaque document comporte exactement deux pages (c’est-à-dire le recto et le verso de chaque chèque). Il suppose également qu’il s’agit de rechercher une bande MICR au bas du recto du document (MICR signifie reconnaissance de caractères par encre magnétique). Quatre champs de métadonnées sont automatiquement créés pour la tâche, afin de stocker le numéro du chèque, le code du tri bancaire, le numéro de compte par rapport auquel le chèque a été émis et le montant du chèque. Le champ de montant n’est PAS numérisé par le logiciel Scan2x.

 

Scan2x fait appel à la technologie OCR pour reconnaître les données de la bande MICR, à l’aide d’un dictionnaire OCR spécial qui lit la police MICR, appelé MICR-B. Scan2x collecte les métadonnées suivantes à partir de la MICR:

Numéro de chèque

Code du tri bancaire

Numéro de compte

 

Les fonctions suivantes de Scan2x permettent d’améliorer la qualité de la numérisation finale. 

Fonction

Explication

Duplex

Lorsque cette option est activée, le scanner doit numériser simultanément les deux faces de la page. Un document d’une seule feuille avec du contenu sur une seule face donnera lieu à la création d’un PDF de deux pages, dont la deuxième page est vierge. Pour supprimer automatiquement cette page vierge, voir la fonction Supprimer les pages vierges.

Redressement automatique

La nature du papier est telle que des pages individuelles ou des documents entiers peuvent parfois passer de travers dans le scanner, d’où une image de travers. La fonction de redressement automatique tente de restaurer l’image numériquement par analyse du contenu du document.

Mode Folio

Crée une image A3 à partir de deux images A4 (par ex., un document A3 plié en deux et numérisé sur un scanner compatible A4)

Supprimer les pages vierges

En activant cette fonction, Scan2x supprime les pages de celles reçues par le scanner si elles sont totalement vierges.

Détecter la double alimentation

De nombreux modèles de scanners possèdent un ou plusieurs moyens de détecter et, parfois, de corriger activement les doubles départs. Une double alimentation inaperçue est extrêmement dangereuse pour toute activité d’archivage de documents, ce qui entraîne un archivage incomplet du document. De nombreux scanners utilisent des faisceaux à ultrasons pour détecter l’épaisseur du papier et/ou vérifier la longueur du papier afin d’essayer et de détecter les doubles départs. D’autres peuvent même retourner et « taquer » le papier entrant afin d’effectuer une numérisation réussie en cas de double alimentation. Cette fonction de Scan2x permet de configurer le scanner en fonction des fonctionnalités nécessaires pour détecter et prévenir les doubles départs.

Réduction effet rouge

La numérisation d’un document implique le passage de la page entre deux capteurs de scanner qui projettent de la lumière sur la page. Le papier fin peut parfois permettre à la lumière d’un capteur de scanner de traverser la feuille et d’interférer avec le détecteur de l’autre côté de la feuille, ce qui nuit à l’image. Cette fonctionnalité permet de détecter ce phénomène et de l’éliminer.

Document sauvegardé par OCR

Les scanners ne lisent pas les documents, ils les photographient et envoient les images au logiciel de numérisation qui les pilote, par exemple Scan2x. Il appartient ensuite au logiciel d’interpréter les parties pertinentes de l’image sous forme de texte afin d’obtenir les métadonnées du document. Scan2x permet également de lire et d’interpréter TOUT le texte du document numérisé et de l’enregistrer dans le PDF afin de permettre des recherches textuelles ultérieures pour n’importe quel contenu du document. La contrepartie toutefois est la vitesse à laquelle le document atteint sa destination – alors qu’un document prend normalement quelques secondes pour passer de Scan2x à sa destination finale (telle que définie dans la section Paramètres de sortie plus loin dans ce document), le processus OCR d’arrière-plan mis en œuvre par Scan2x lorsque cette option est activée peut prendre plus de temps. La durée dépend du nombre de pages du document, mais, en règle générale, le processus OCR complet prend de 10 à 20 secondes par page.

 

Le processus OCR s’effectue en arrière-plan sur Scan2x, et donc, quelle que soit la taille de votre document, l’expérience utilisateur ne sera pas compromise et la numérisation de nouveaux documents peut se poursuivre.

Sauvegarde auto

Il est possible de définir la tâche afin d’éviter l’aperçu du document lorsque tous les champs de métadonnées sont récupérés et que les validations sont respectées.

 

La fonction Rotation automatique examine chaque page et tente de déterminer si celle-ci a été présentée par inadvertance à l’envers sur le scanner. Dans ce cas, le document effectue une rotation de 180 degrés. Pour ce faire, il tente de déterminer l’orientation du texte sur la page pour que les pages comportant peu ou pas de texte ne soient pas pivotées automatiquement.

 

Certains modèles de scanners peuvent permettre une rotation automatique en interne, sans incidence sur leur vitesse de numérisation, d’autres ralentissent considérablement en cas de numérisation d’un document de plusieurs pages avec la rotation automatique activée. Scan2x permet donc de choisir si vous souhaitez effectuer une rotation automatique sur le scanner physique ou dans Scan2x. En règle générale, il est préférable d’utiliser le matériel du scanner sauf si la vitesse est sacrifiée par le modèle de scanner, car le processus est généralement plus rapide. Toutefois, la fonction de rotation automatique de Scan2x constitue une alternative très acceptable si nécessaire.

 

Certains modèles de scanners Canon à grande vitesse proposent des options d’imprinter. Les Imprinters sont de petites imprimantes jet d’encre capables de marquer une feuille lors de son passage physique dans le scanner, d’imprimer du texte qu’il est possible de définir et de personnaliser dans Scan2x à l’aide de l’option Texte Imprinter. Bien sûr, cette fonction ne fonctionne que sur les modèles d’imprimantes dotés d’une fonction « imprinter » et ne sera pas utilisée pour tous les autres modèles.

 

Il est parfois pratique de présenter intentionnellement les pages à l’envers ou latéralement sur le scanner. Cela peut être en raison d’une détérioration des documents (par exemple, perforations d’agrafage en haut à gauche de chaque document) qui provoque le bourrage de votre scanner. En présentant vos documents à numériser à l’envers, la partie endommagée est chargée dans le scanner en dernier, ce qui évite les bourrages.  Une autre raison pour la présentation des pages sur le côté sur scanner est la vitesse : il est toujours préférable de présenter le côté long du document si possible, car les scanners fonctionnent beaucoup plus rapidement. Toutefois, les raisons ci-dessus signifient que les numérisations produites ne sont pas correctement orientées et donc, Scan2x possède une fonction appelée Toujours faire pivoter les pages de, avec une liste déroulante pour sélectionner l’angle de rotation requis. Cette fonction permet de faire pivoter TOUS les documents numérisés par rapport à la valeur sélectionnée. Cette fonction est beaucoup plus rapide que la fonction de rotation automatique décrite ci-dessus, car aucune analyse du contenu des pages n’est effectuée pour chaque page numérisée.

 

Pour les scanners compatibles TWAIN prenant en charge les « imprinters », il est possible de spécifier le texte à imprimer sur les documents papier qui passent dans le scanner. Si votre scanner ne prend pas cette option en charge, ou s’il n’est pas nécessaire d’imprimer un texte sur le document, laissez la case Texte Imprinter vide. Les textes saisis peuvent être littéraux ou générés dynamiquement lors de la numérisation – utilisez des crochets « [ » pour spécifier les données dynamiques à imprimer lors de la numérisation.

 

La liste déroulante Compression PDF offre dix paramètres différents pour contrôler le niveau de compression appliqué à chaque numérisation, entre Pas de compression et Minimum. Les taux de compression sont plus efficaces avec les niveaux de gris et le contenu couleur sur les documents.  Des taux de compression plus élevés ont tendance à « flouter » légèrement les images couleur. Nous recommandons donc de tenir compte de leurs conséquences. Par exemple, les documents de nature professionnelle contenant des graphiques et/ou du texte couleur seront impactés au minimum par des paramètres de compression élevés et il est donc recommandé de définir une compression élevée. Toutefois, les documents comportant des photos (documents d’identité, passeports, permis de conduire, etc.) peuvent nécessiter l’exécution de certains tests avec le paramètre de compression choisi afin d’éviter de perdre trop de fidélité dans le format PDF final.

 

La liste déroulante Moteur OCR permet de choisir entre différents moteurs OCR. Scan2x est fourni par défaut avec deux moteurs OCR. Le Moteur OCR iDRS est un moteur de pointe d’IRIS, utilisé dans des produits de sociétés telles que Canon, HP, Adobe, Panasonic, Samsung et LG. Le Moteur OCR Tesseract est une version optimisée du moteur Open source Tesseract de Google. L’utilisation de l’un ou l’autre de ces moteurs n’entraîne aucuns frais supplémentaires. Le Moteur OCR ABBYY FineReader1 est un module en option de Scan2x. S’il est installé avec votre licence Scan2x, vous pouvez choisir ABBYY1 comme moteur OCR préféré pour cette définition de tâche.

 

Votre choix de moteur OCR vous permettra ensuite de choisir la langue que vous avez l’intention de reconnaître à l’aide de la liste déroulante Langue OCR. Sauf en cas de raison spécifique d’utiliser Tesseract ou ABBY, nous recommandons d’utiliser le paramètre par défaut du moteur iDRS.

 

 

 

Copyright © 2023 Avantech Software