Navigation: Administrator-Handbuch (Scan2x-Konfiguration) > Definition eines Scan-Auftrags > Registerkarte „Metadaten“ > OCR-Zonen  >

Erfassen tabellarischer Daten im Tabellenformat (z. B. Rechnungsverarbeitung)

 

 

 

 

Erfassen tabellarischer Daten im Tabellenformat (z. B. Rechnungsverarbeitung)

 

Sie können in Scan2x die OCR-Funktion eines Metadatenfelds als Tabelle oder Tabelle mit Spaltenüberschriften festlegen. Weitere Informationen hierzu finden Sie auf Seite 158. Wenn eine OCR-Zone definiert wurde, werden tabellarische Daten innerhalb der betreffenden Zone von Scan2x als Tabelle formatiert, um die Struktur des gescannten Dokuments widerzuspiegeln. Wenn das Dokument eine Tabelle mit sechs Spalten enthält, haben die resultierenden Daten nach der OCR-Verarbeitung ebenfalls sechs Spalten, die genau mit dem Dokument übereinstimmen.

 

 

Dieses Format ist für einige Vorgänge und Dokumente geeignet. Häufig ist es jedoch erforderlich, die Daten aus mehreren Dokumentvorlagen eines bestimmten Typs in einem gemeinsamen Format zu normalisieren. Ein Beispiel aus der Kreditorenbuchhaltung:

 

Die gescannten Eingangsrechnungen verschiedener Lieferanten verwenden zumeist unterschiedliche Layouts. Die Position der Daten auf der Seite ändert sich von Lieferant zu Lieferant und tabellarische Daten unterscheiden sich sowohl in Inhalt als auch in Position. Beispiel: „Lieferant ABC“ listet seine Positionen über sechs Spalten hinweg auf, während „Lieferant DEF“ neun Datenspalten verwendet.

 

Wenn Scan2x alle diese Rechnungen verarbeiten soll, um die Eingabe für ein ERP-System bereitzustellen, muss ein gemeinsames Datenformat für das ERP-System gefunden werden, unabhängig davon, um welche Lieferantenrechnung es sich handelt.

 

Scan2x kann die erforderliche Datennormalisierung durchführen, indem ein Feld mit Metadaten als Tabelle definiert wird, die in das standardisierte ERP-Format übernommen werden kann. In einem Konvertierungsbildschirm können dann die Datenformate der einzelnen Vorlagen in das des ERP-Systems umgewandelt werden.

 

Erfassen einheitlicher, normalisierter tabellarischer Daten aus verschiedenen Dokumenten

 

Wenn ein Metadatenfeld als Tabelle definiert ist, können Spalten mit Spaltennamen festgelegt werden. Dies ist besonders nützlich, wenn tabellarische Daten aus unterschiedlichen Dokumentenformaten erfasst werden.

 

Ein Beispiel hierfür sind Rechnungen. Die Rechnungen verschiedener Unternehmen haben unterschiedliche Layouts und unterschiedliche Tabellen für die Rechnungspositionen. Selbst Spalten mit denselben Informationen (z. B. Menge oder Produktbezeichnung) können unterschiedliche Spaltentitel haben. Wenn die Metadatentabelle keine Definition enthält, haben die Tabellentitel, die beim Speichern des Dokuments ausgegeben werden, die Spaltennamen des Quelldokuments.

 

Um einheitliche Spaltentitel sicherzustellen, können Sie in Scan2x eigene Spaltennamen festlegen und dann die Spalten der Rechnung Ihren eigenen Spalten zuordnen. Wenn Sie die aus den Rechnungen erfassten Metadaten in eine nachfolgende Anwendung importieren, ist es unerlässlich, die tabellarischen Daten in einem Standardtabellenformat zu normalisieren.

 

Klicken Sie auf der Metadaten-Registerkarte der Job Manager-Seite auf die Schaltfläche Tabelle definieren. Diese Schaltfläche wird angezeigt, wenn Sie ein Metadatenfeld wählen, das als Tabelle definiert ist. Siehe folgender Screenshot.

 

 

Wenn Sie auf die Schaltfläche Tabelle definieren klicken, wird eine Datentabelle ähnlich der folgenden angezeigt. Der Screenshot zeigt die Tabellendefinition für den Auftrag „Delivery Notes“ (Lieferscheine), der in der Scan2x-Demo enthalten ist.

 

Sie können Ihren Spaltendefinitionen weitere Spalten hinzufügen, indem Sie sie in die Liste einfügen, wie hier zu sehen.

 

 

Sortierung. Mit diesem Wert können Sie die Tabellenspalten nach Bedarf sortieren.

Feld. Geben Sie den Namen der Tabellenspalte ein.

Typ. Wählen Sie zwischen „Benutzerdefiniert“ und „Ausdruck (VBScript)“. Der Standardwert ist „Benutzerdefiniert“. Das bedeutet, dass die mit OCR erfassten Daten aus dem Dokument genau so verwendet werden, wie sie im Dokument vorhanden waren. Bei der Verwendung eines Ausdrucks können Sie die mit OCR erfassten Daten aus dem Dokument mit VBScript erweitern oder ergänzen.

Zuordnung zur OCR-Spalte. Mit diesem Wert geben Sie in Scan2x an, welche Dokumentspalte der Tabelle zugeordnet werden soll.

Line-Modus. Hier können Sie festlegen, wie viele der aus dem Dokument gelesenen Daten in die Spalte eingefügt werden sollen.

 

 

 

Copyright © 2022 Avantech Software