28 Apr.

Document Information Extraction – Workflow


E-Rechnung in Deutschland: So setzen Sie die Pflicht mit SAP Business One um

Document Information Extraction (DIE, deutsch: Dokumenten-Informationsextraktion) bezeichnet den Workflow, strukturierte Daten aus unstrukturierten Belegen — vor allem eingehenden Rechnungen, Lieferscheinen, Verträgen — automatisiert zu gewinnen. Ziel ist, dass eine PDF- oder Bilddatei in SAP Business One nicht nur archiviert, sondern direkt zu Feldern einer Eingangsrechnung wird: Lieferant, Belegnummer, Belegdatum, Steuerbetrag, Nettosumme, Belegzeilen, Bestellreferenz.

Kontext

Ein typischer Workflow läuft in drei Schritten. (1) Erfassung: Belege kommen per Scan, E-Mail (über Outlook-Plugins), SFTP-Download oder Upload durch den Sachbearbeiter. (2) Extraktion: Ein OCR-Dienst liest den Text, ein Layout-Modell oder LLM-Pipeline extrahiert semantisch die Pflichtfelder; für ZUGFeRD-/Factur-X-/XRechnungen wird die eingebettete XML-Nutzlast direkt verwendet, OCR entfällt. (3) Verbuchung: Die extrahierten Daten werden gegen SAP-B1-Geschäftspartner, Bestellungen, Steuerkennzeichen gemappt; bei Abweichungen zwischen Bestellung und Rechnung erfolgt Prüfungsworkflow. Produktseitig stehen für SAP B1 mehrere Wege offen: SAP Document Information Extraction als BTP-Service, SAP Document and Reporting Compliance für E-Rechnung, Drittprodukte wie CKS.DIGITAL 4.0 mit integrierter OCR-Erkennung (die Schlagwörter extrahiert und über Referenzfelder Belege zuordnet), sowie AI-basierte Produkte wie der B1-Helpster mit FIBU-Helper-Komponente, die Kontierungsvorschläge auf Basis extrahierter Felder liefern.

Abgrenzung

Document Information Extraction ist mehr als klassisches OCR: Es liefert strukturierte Felder, nicht nur Rohtext. Es ist auch nicht identisch mit E-Rechnungsempfang — ZUGFeRD- und XRechnung-Belege werden direkt aus der XML-Nutzlast verarbeitet, ohne Extraktion aus einem Bild. Gegenüber einem reinen Dokumentenarchiv (CKS.DMS, d.velop) fokussiert DIE den Weg vom Dokument zum Buchungsbeleg; die reine Archivierung ist ein eigener, ergänzender Schritt. Die Workflow-Qualität hängt stark von Datenmodell, Lieferanten-Varianz und Freigabeprozessen ab — ein 95-%-Automatisierungsgrad ist realistisch erreichbar, aber niemals selbstverständlich.


KI-im-Unternehmen

Warum Unternehmen bei KI im ERP zögern

Künstliche Intelligenz im ERP-Kontext weckt hohe Erwartungen, da signifikante Produktivitätsgewinne, eine tiefgreifende Automatisierung und fundiertere Entscheidungen in Aussicht stehen. Dennoch ...
Predictive Maintenance

Predictive Maintenance: Wie den Mittelstand zur intelligenten Fabrik macht

In der heutigen intelligenten Welt ist die Fähigkeit, Probleme zu lösen, bevor sie überhaupt entstehen, kein futuristisches Szenario mehr, sondern ...
RPA

RPA im ERP-Umfeld: Effizienzsteigerung durch digitale Prozesshelfer

In vielen ERP-Systemen laufen tagtäglich Prozesse ab, die zwar notwendig, jedoch nicht wertschöpfend sind. Mitarbeiter verbringen wertvolle Zeit damit, Bestellungen ...
Generative KI im ERP

Generative KI im ERP: Wie LLMs die Rolle von ERP-Systemen verändern

Mit dem Aufkommen generativer KI und großer Sprachmodelle (Large Language Models, LLMs) verändert sich die Rolle von ERP-Systemen grundlegend. Statt ...
ERP FUTURE

Mit APIs und Microservices die ERP-Zukunft vorbereiten

Viele mittelständische Unternehmen arbeiten noch immer mit ERP-Monolithen, die über Jahre gewachsen sind. Die Module dieser Systeme sind eng miteinander ...
DATA-QUALITY

Datenqualität & KI : KI kann nur so gut sein wie Ihre Daten

Unternehmen investieren heute massiv in KI-Technologien, intelligente Automatisierung und moderne ERP-Architekturen. Trotzdem scheitern viele Modernisierungsprojekte schon in frühen Phasen, weil ...
Wird geladen …