Wie aus Dokumenten Informationen werden

09.09.2009 | von Vereon AG

Uhr Lesedauer: 3 Minuten


09.09.2009, Nahezu alle administrativen Arbeitsabläufe werden heute computergestützt abgewickelt. Aber immer noch sind zahlreiche Papierdokumente beteiligt, deren enthaltene Daten korrekt und möglichst effizient in die digitalen Prozesse integriert werden müssen. RR Donnelley demonstriert, wie aus Papierdokumenten nicht simple Zahlen und Texte, sondern wertvolle Daten mit inhaltlicher Bedeutung automatisch extrahiert werden können.


Datenextraktion
Die Digitalisierung von Papierdokumenten geschieht in mehreren Schritten. Nachdem mit einem Scanner zunächst ein digitales Bild erzeugt wurde, folgt der aufwändigste Vorgang, die eigentliche Datenextraktion. Mittels sog. OCR-Techniken (Optical Character Recognition) wird dabei die Schrift automatisch erkannt. Bei qualitativ guten gedruckten Texten gelingt dies mit einer hohen Erkennungsrate sehr zuverlässig, bei minderer Vorlagenqualität sowie bei Handschriften stossen automatische Verfahren aber oft an ihre Grenzen. Nicht bzw. nicht ausreichend zuverlässig erkannte Texte werden manuell geprüft und ggf. korrigiert. Die so gewonnen Daten sind für viele Anwendungsgebiete bereits ausreichend. Sie können beispielsweise verwendet werden, um eine Volltextsuche durchzuführen. Ein mehrstufiger Prozess sorgt bei RR Donnelley (RRD) dafür, dass aus Papierdokumenten wertvolle Informationen extrahiert und zur weiteren Nutzung bereitgestellt werden können:

Analyse
Die Ausgangslage muss beurteilt werden. Ist ein bestehendes Papierarchiv zu digitalisieren? Oder müssen kontinuierlich eintreffende Dokumente bearbeitet werden? Sollen Daten automatisch erkannt und strukturiert werden? Oder reicht es, Bilder der Dokumente zu archivieren? Je nachdem sind geeignete Massnahmen und Voreinstellungen notwendig.

Arbeitsvorbereitung
Bei der Arbeitsvorbereitung (AVOR) werden Dokumente so aufbereitet, dass sie im folgenden Schritt effizient gescannt werden können. Hierzu werden Blätter aus Ordnern ausgeheftet, Büroklammern entfernt, Beschädigungen repariert, ungeeignete Formate ausgesondert und separat bearbeitet, bei Bedarf Trennblätter eingefügt und weitere notwendige Vorbereitungsarbeiten durchgeführt

Scanning
Beim eigentlichen Scanning-Vorgang werden die Dokumente automatisch dem Scanner zugeführt und je nach Bedarf ein- oder beidseitig, farbig oder schwarz- weiss «fotografiert». Das Resultat ist zunächst eine Menge von digitalen Bildern in der vorher definierten Auflösung.

Indexierung
Krönender Abschluss der Digitalisierung ist die «Sinngebung» von Informationen. Wenn das System automatisch erkennen kann, dass ein Teil des Dokuments etwa den Text «3422-07-B» enthält, ist das schon hilfreich. Aber erst wenn es herausfindet, dass es sich um die Rechnungsnummer handelt und ein anderer Bereich den Namen und die Anschrift des Rechnungsstellers enthält und wieder ein anderer Teil den Rechnungsbetrag usw., wird das volle Potenzial des Scanningprozesses genutzt. Die so gewonnenen, semantisch interpretierten Daten können dann in einer Datenbank abgelegt und für die automatische Weiterverarbeitung bereitgestellt werden. Selbstverständlich ist auch eine Verknüpfung mit dem Bild für die Archivierung möglich.

Validierung und Plausibilisierung

Aktenvernichtung
Auch die weitere Behandlung der Originaldokumente erfolgt gemäss den Wünschen der Kunden.

RR Donnelley Schweiz ist ein auf die Rechnungsbearbeitung und Dokumentenverwaltung spezialisiertes Unternehmen mit Geschäftsstellen in Zürich-Urdorf und Genf-Carouge. RR Donnelley & Sons hat seinen Hauptsitz in Chicago, beschäftigt weltweit 60'000 Mitarbeiter und erwirtschaftete 2007 einen Umsatz von 11.6 Mia USD. Der Konzern ist an der NYSE unter dem Symbol RRD gelistet.

Medienkontakt: Weitere Informationen: Jean-Claude Ruppen Director Marketing & Business Development jean-claude.ruppen @ rrdonnelley.ch Tel.: +41 44 735 33 30 www.rrdonnelley.ch

--- ENDE Pressemitteilung Wie aus Dokumenten Informationen werden ---

Über Vereon AG:

Vereon recherchiert und organisiert seit 2003 erfolgreich Kongresse, Fachtagungen und Seminare für Fach- und Führungskräfte in der Schweiz, Deutschland und dem Rest Europas rund um Themen wie Payment, E-Invoicing, Business Intelligence, Finanzen, Controlling, IT, Marketing, Vertrieb, Recht und Steuern sowie für die Energiebranche und im Geschäftsbereich Chem-Academy für die chemische und pharmazeutische Industrie.



Weitere Informationen und Links:




Help.ch

Ein Angebot von HELP.ch


Swiss-Press.com ist ein Angebot von www.help.ch und die spezialisierte Plattform für Pressemitteilungen aus der Schweiz. HELP.ch sorgt für hohe Reichweite, professionelle Veröffentlichung und maximale Sichtbarkeit Ihrer Unternehmensnews.

Medienpräsenz mit «Aktuelle News»: Nutzen Sie das Netzwerk von «Aktuelle News», um Ihre Presse- und Medienmitteilungen, Events und Unternehmensnews gezielt zu verbreiten.

Ihre Inhalte werden über News-Sites, Google, Social Media und Online-Portale einer breiten Öffentlichkeit zugänglich gemacht. Zum Netzwerk gehören führende Presseportale wie Aktuellenews.ch, News.help.ch, Swiss-Press.com und Tagesthemen.ch, Eventportale wie Eventkalender.ch und Swisskalender.ch sowie Online-TV-Plattformen wie Aktuellenews.tv und Handelsregister.tv. Insgesamt stehen über 30 Publikationskanäle zur Verfügung, um Ihre Mitteilungen optimal zu platzieren.