|
Registerkarte „Scan-Einstellungen“
Zum Festlegen der Scan-Auflösung für diesen Auftrag geben Sie den erforderlichen DPI-Wert in das Textfeld DPI ein. Im Dropdown-Feld Scan-Modus können Sie zwischen Farb-, Grauskala- und Schwarz/Weiß- bzw. binären Scans wählen. Hier können auch noch weitere proprietäre Modi einzelner Scanner-Modelle enthalten sein.
Über das Kontrollkästchen Text erweitern und das zugehörige Dropdown-Feld können Sie die erweiterten Textverbesserungsmodi von Canon für Schwarz/Weiß-Scans wählen. Wenn dieses Kontrollkästchen aktiviert wird, werden die Schieberegler Helligkeit und Kontrast verfügbar, mit denen Sie die erweiterte Textverbesserungsfunktion für Canon-Scanner mit benutzerdefinierter Genauigkeit steuern können. Mit dieser Einstellung können Sie die Lesbarkeit des Texts für die OCR-Funktion während des Scanvorgangs verbessern. Mit den Funktionen Farbausfall und Farbverbesserung können Sie Rot-, Grün- und Blau-Scans auf Canon-Dokumentenscannern deaktivieren bzw. intensivieren.
Mit dem Kontrollkästchen Erfordert QR-Code auf der 1. Seite des gescannten Dokuments können Sie festlegen, dass die erste Seite jedes im Rahmen dieses Auftrags gescannten Dokuments gescannt wird, um zu verifizieren, dass ein QR-Code vorhanden ist. Optional kann auch geprüft werden, ob der QR-Code einen bestimmten Wert enthält, der im Textfeld Erwarteter QR-Code-Wert festgelegt wird. Wenn KEIN QR-Code gefunden wird oder der gefundene Wert den optional festgelegten Wert nicht enthält, gibt Scan2x eine Warnung an den Benutzer aus. Diese Funktion wird gewöhnlich verwendet, wenn eine Überprüfung und Verifizierung auf Dokumentebene erforderlich ist, um sicherzustellen, dass nur zulässige Dokumente gescannt werden. Das Kontrollkästchen Die Werte der Barcodes auf der 1. Seite des gescannten Dokuments einlesen wird auf dieselbe Weise verwendet. Hier kann jedoch im Dropdown-Feld Wobei BarCode-Typ die verwendete Barcode-Variante festgelegt werden.
Mit Scan2x können Personalausweise und Pässe überprüft werden, die dem von der ICAO (International Civil Aviation Organisation) festgelegten internationalen Standard entsprechen. Die Dokumente enthalten eine maschinenlesbare Zone (MRZ), die von Scan2x automatisch erkannt, interpretiert und validiert wird, wenn das Kontrollkästchen Gescanntes Dokument als Ausweis validieren oder das Kontrollkästchen Gescanntes Dokument als Reisepass validieren aktiviert wurde. Wenn der Personalausweis- oder Passmodus aktiviert wurde, werden automatisch Metadatenfelder erstellt, in denen die in der maschinenlesbaren Zone erfassten Informationen gespeichert werden.
Im Validierungsprozess vergleicht das System die integrierten MRZ-Prüfsummen mit dem Rest der Daten in der maschinenlesbare Zone. Wenn die Prüfsummen validiert wurden, prüft das System außerdem, ob das aktuelle Datum (d. h. das Datum des Scanvorgangs) größer oder gleich dem offiziellen Ablaufdatum des Dokuments ist. Falls eine dieser Prüfungen fehlschlägt, erhält der Benutzer eine Warnung und das Dokument kann nicht von Scan2x gespeichert werden.
Außerdem ist es möglich, weitere Prüfungen der Identität des Dokumentinhabers durchzuführen. Hierzu werden mithilfe der Webservices externe Datenbanken überprüft.
Für das Scannen von Personalausweisen sind eine Reihe von Unteroptionen verfügbar. Mit dem Kontrollkästchen Abgelaufene ID-Karten akzeptieren kann die Benutzerwarnung bei der Erkennung eines abgelaufenen Personalausweises umgangen werden. Wenn das Kontrollkästchen In 1 Seite zusammenführen aktiviert ist, führt Scan2x beide Seiten eines Personalausweises in einer PDF-Datei zusammen, gemeinsam mit dem Bescheinigungstext (falls aktiviert). Damit ist es möglich, in einem Drittsystem mit dem Aufruf einer einzigen Seite ein vollständiges Ausweisdokument anzuzeigen. Mit der Option Bescheinigung hinzufügen wird unten auf dem Dokument ein Streifen mit dem Text „True copy of original identity document as acquired and verified by <username> from Unit ID: <Scan2x Unit ID>, on <date> at <time>“ (Wahre Kopie des Original-Ausweisdokuments, erfasst und geprüft von <Benutzername> mit Geräte-ID <Scan2x-Geräte-ID> am <Datum> um <Uhrzeit>) hinzugefügt. Das Kontrollkästchen MRZ-Fehler ignorieren bleibt gewöhnlich deaktiviert, sodass Scan2x auf der zweiten Seite des Ausweisdokuments eine maschinenlesbare Zone erwartet. Das bedeutet jedoch, dass Dokumente, die keine maschinenlesbare Zone haben, nicht mit Scan2x verarbeitet werden können. Zum Scannen von Ausweisdokumenten ohne maschinenlesbare Zone mit der Scan-Option für Ausweise (z. B. Führerscheine) kann die Ignorieren-Funktion aktiviert werden.
Mit dem Kontrollkästchen Gescanntes Dokument als Scheck validieren können Sie das Scan2x-System zur automatischen Erkennung von Bankschecks aktivieren. Wenn dieses Kontrollkästchen aktiviert ist, geht Scan2x davon aus, dass jedes Dokument genau zwei Seiten lang ist (d. h. Vorder- und Rückseite jedes Schecks). Das System geht außerdem davon aus, dass es unten auf der Vorderseite des Dokuments nach einem MICR-Streifen suchen muss (MICR steht für Magnetic Ink Character Recognition bzw. Magnetschrift-Zeichenerkennung). Es werden automatisch vier Metadatenfelder für den Auftrag erstellt, in denen die Schecknummer, die Bankleitzahl, die Kontonummer, für die der Scheck ausgestellt wurde, und der Scheckbetrag gespeichert werden. Das Betragsfeld wird von Scan2x NICHT erfasst.
Scan2x nutzt die OCR-Technologie zur Erkennung der Daten im MICR-Streifen. Hierfür wird ein spezielles OCR-Wörterbuch verwendet, das zum Lesen der MICR-Schrift namens MICR-B dient. Scan2x erfasst folgende Metadaten aus dem MICR-Streifen:
•Schecknummer
•Bankleitzahl
•Kontonummer
Die folgenden Scan2x-Funktionen helfen, die Qualität des endgültigen Scans zu verbessern.
Funktion
|
Erklärung
|
Duplex
|
Wenn diese Option aktiviert ist, werden Vorder- und Rückseite des Dokuments gleichzeitig gescannt. Ein einseitiges Dokument, das nur auf einer Seite Inhalte hat, ergibt eine zweiseitige PDF-Datei, in der die zweite Seite leer ist. Siehe die Funktion Leere Seiten verwerfen zum automatischen Entfernen der leeren Seite.
|
Automatische Entzerrung
|
Aufgrund der Beschaffenheit von Papier kann es geschehen, dass einzelne Seiten oder auch ganze Dokumente leicht angewinkelt durch den Scanner geführt werden, was zu einem verzerrten Bild führt. Mit der Funktion „Automatische Entzerrung“ wird versucht, das richtige Bild durch das Analysieren des Dokumentinhalts wiederherzustellen.
|
Folio-Modus
|
Diese Funktion erstellt aus zwei A4-Bildern ein A3-Bild (z. B. ein gefaltetes A3-Dokument, das auf einem A4-fähigen Scanner gescannt wird).
|
Leere Seiten verwerfen
|
Wenn diese Funktion aktiviert ist, löscht Scan2x selektiv vollständig leere Seiten aus den vom Scanner empfangenen Seiten.
|
Doppeleinzug erkennen
|
Viele Scanner-Modelle können auf eine oder mehr Weisen den Doppeleinzug von Dokumenten erkennen und manchmal auch aktiv korrigieren. Ein unbemerkter Doppeleinzug ist für jede Dokumentarchivierung sehr gefährlich, da er dazu führt, dass unbemerkt ein unvollständiges Dokument archiviert wird. Viele Scanner verwenden Ultraschallstrahlen zur Erkennung der Papierstärke und/oder überwachen die Papierlänge, um Doppeleinzüge zu entdecken. Einige können das ankommende Papier sogar umdrehen und „rütteln“, um einen erfolgreichen Scan durchzuführen, wenn ein Doppeleinzug vermutet wird. Wenn diese Funktion in Scan2x aktiviert wird, wird der Scanner so eingestellt, dass alle verfügbaren Funktionen genutzt werden, um Doppeleinzüge zu erkennen und zu verhindern.
|
Verringerung des Durchtränkens
|
Beim Scannen eines Dokuments wird die Seite zwischen zwei Scanner-Sensoren geführt, die beide Licht auf die Seite werfen. Bei dünnem Papier kann es geschehen, dass das Licht eines Scanner-Sensors durch das Papier hindurchscheint und mit dem Sensor auf der anderen Seite des Blatts interferiert. Dies beeinträchtigt die Bildqualität. Wenn diese Funktion aktiviert wird, versucht das System dieses Phänomen zu erkennen und zu vermeiden.
|
OCR-gespeichertes Dokument
|
Scanner lesen Dokumente nicht, sondern erstellen vielmehr Fotos von ihnen und übergeben die Bilder an die Scananwendung, wie z. B. Scan2x. Die Software muss dann die relevanten Teile des Bilds als Text erkennen, um Metadaten für das Dokument zu erhalten. Scan2x liest und interpretiert auch optional den GESAMTEN auf dem gescannten Dokument enthaltenen Text und speichert ihn dann in der PDF-Datei, sodass nachfolgend Volltextsuchen innerhalb des gesamten Dokumentinhalts durchgeführt werden können. Diese Funktionalität schlägt sich jedoch in der Geschwindigkeit nieder, in der das Dokument sein Ziel erreicht. Während ein Dokument normalerweise in wenigen Sekunden von Scan2x an sein Ziel gelangt (wie unter Ausgabe-Einstellungen später in diesem Dokument eingerichtet), kann der OCR-Hintergrundprozess von Scan2x länger dauern, wenn diese Option aktiviert ist. Die Dauer hängt von der Anzahl der Seiten in dem Dokument ab. Gewöhnlich ist jedoch mit einer Dauer des vollständigen OCR-Prozesses von 10–20 Sekunden pro Seite zu rechnen.
Der OCR-Prozess läuft in Scan2x im Hintergrund ab, sodass die Benutzererfahrung unabhängig vom Dokumentumfang in keiner Weise davon betroffen ist und mit dem Scannen weiterer Dokumente fortgefahren werden kann.
|
Auftrag automatisch speichern
|
Der Auftrag kann so eingestellt werden, dass die Dokumentenvorschau übersprungen wird, wenn alle Metadatenfelder erfasst und die Validierungen erfolgreich durchgeführt wurden.
|
Die Funktion Automatisch rotieren untersucht jede Seite, um zu ermitteln, ob die Seite versehentlich verkehrt herum an den Scanner übergeben wurde. Falls dies der Fall ist, wird das Dokument um 180 Grad gedreht. Für diesen Vorgang wird die Ausrichtung des Texts auf der Seite überprüft, weshalb Seiten mit sehr wenig oder überhaupt keinem Text nicht automatisch gedreht werden.
Einige Scanner-Modelle sind fähig, eine automatische Drehung ohne Beeinträchtigung der Scan-Geschwindigkeit durchzuführen. Bei anderen wird die Geschwindigkeit erheblich verlangsamt, wenn beim Scannen eines Dokuments mit mehreren Seiten die Funktion „Automatisch rotieren“ aktiviert ist. Scan2x stellt daher eine Funktion bereit, mit der Sie wählen können, ob das Drehen von Dokumenten innerhalb der Scanner-Hardware oder in Scan2x vorgenommen werden soll. Es ist im Allgemeinen vorzuziehen, die Scanner-Hardware zu verwenden, außer wenn die Geschwindigkeit Ihres Scanner-Modells stark beeinträchtigt wird, da dieser Prozess gewöhnlich schneller ist. Die Scan2x-Funktion „Automatisch rotieren“ bietet jedoch eine sehr akzeptable Alternative, falls erforderlich.
Einige Hochgeschwindigkeits-Scanner-Modelle von Canon haben Imprinter-Optionen. Imprinter sind kleine Tintenstrahldrucker, die ein Blatt, während es physisch durch den Scanner geführt wird, markieren können. Dabei kann Text auf die Blätter gedruckt werden, der in Scan2x mit der Option Imprinter Text festgelegt und angepasst werden kann. Diese Funktion ist nur für Druckermodelle verfügbar, die mit der Imprinter-Funktion ausgestattet sind. Auf allen anderen Modellen wird die Funktion ignoriert.
Es kann manchmal erwünscht sein, dem Scanner Seiten verkehrt herum oder im Querformat zuzuführen. Ein Grund dafür kann eine Beschädigung des Dokuments (z. B. Löcher durch Heftklammern links oben auf dem Dokument) sein, die dazu führt, dass es zu einem Papierstau im Scanner kommt. Wenn die Dokumente verkehrt herum zugeführt werden, gelangt der beschädigte Teil zuletzt in den Scanner und es kommt nicht zum Papierstau. Ein weiterer Grund für das Zuführen von Seiten im Querformat ist die Geschwindigkeit des Scanvorgangs. Es empfiehlt sich immer, das Dokument mit seiner Längsseite einzuführen, da Scanner auf diese Weise wesentlich schneller arbeiten. Diese Vorgehensweisen führen jedoch dazu, dass die erstellten Scans nicht korrekt ausgerichtet sind. Deshalb verfügt Scan2x über die Funktion Seiten immer drehen nach, in deren Dropdown-Feld Sie den erforderlichen Drehwinkel auswählen können. Wenn Sie diese Funktion aktivieren, werden ALLE Dokumente IMMER wie ausgewählt gedreht. Diese Funktion ist wesentlich schneller als die oben beschriebene Funktion „Automatisch rotieren“, da der Seiteninhalt der gescannten Seiten nicht analysiert werden muss.
Bei TWAIN-kompatiblen Scannern, die Imprinter unterstützen, kann Text festgelegt werden, der vom Imprinter auf die durch den Scanner laufenden Papierdokumente gedruckt werden soll. Wenn Ihr Scanner kein Imprinting unterstützt oder es nicht erforderlich ist, Text auf Ihr Dokument zu drucken, lassen Sie das Feld Imprinter Text leer. Der eingegebene Text kann vorab festgelegt oder zum Zeitpunkt des Scannens generiert werden. Um dynamische Daten für den Druck zum Scan-Zeitpunkt einzurichten, verwenden Sie eckige Klammern „[“.
Die Dropdown-Liste Ausgabekomprimierung stellt zehn verschiedene Einstellungen bereit, mit denen der Grad der Komprimierung für jeden Scan festgelegt wird, von keinerlei Komprimierung bis zu minimaler Komprimierung. Komprimierung ist am effektivsten bei farbigen oder Grauskala-Inhalten von Dokumenten. Ein höherer Grad der Komprimierung führt zu leicht verschwommenen Farben, was bei der Verwendung dieser Optionen beachtet werden sollte. Beispiel: Geschäftsdokumente mit Farbdiagrammen und/oder farbigem Text werden von hohen Komprimierungseinstellungen nur minimal beeinträchtigt, sodass das Verwenden eines hohen Komprimierungsgrads empfohlen wird. Bei Dokumenten mit Fotos (z. B. Ausweisdokumente, Pässe, Führerscheine usw.) kann es jedoch erforderlich sein, einige Textdokumente mit der gewählten Komprimierungseinstellung zu scannen, um sicherzustellen, dass die erzielte PDF-Datei möglichst wahrheitsgetreu ist.
In der Dropdown-Liste der Option OCR-Engine können Sie zwischen verschiedenen OCR-Engines wählen. Scan2x verfügt standardmäßig über zwei OCR-Engines. Die iDRS OCR-Engine ist eine erstklassige Engine von IRIS, die in Produkten von Canon, HP, Adobe, Panasonic, Samsung und LG verwendet wird. Die Tesseract OCR-Engine ist eine optimierte Variante der Open Source-Engine Tesseract von Google. Für die Verwendung dieser beiden Engines werden keine zusätzlichen Gebühren erhoben. Die OCR-Engine Abbyy FineReader1 ist ein optionales Modul für Scan2x. Wenn es zusammen mit Ihrer Scan2x-Lizenz installiert wird, können Sie Abbyy1 als Ihre OCR-Engine der Wahl für diese Auftragsdefinition wählen.
Die Wahl einer OCR-Engine ermöglicht Ihnen auch die Wahl der Sprache, die erkannt werden soll, in der Dropdown-Liste OCR-Sprache. Sofern Sie keinen gezielten Grund für die Verwendung von Tesseract oder Abbyy haben, wird empfohlen, die Standardeinstellung der iDRS-Engine zu wählen.
|
|