
Document Information Extraction (DIE, deutsch: Dokumenten-Informationsextraktion) bezeichnet den Workflow, strukturierte Daten aus unstrukturierten Belegen — vor allem eingehenden Rechnungen, Lieferscheinen, Verträgen — automatisiert zu gewinnen. Ziel ist, dass eine PDF- oder Bilddatei in SAP Business One nicht nur archiviert, sondern direkt zu Feldern einer Eingangsrechnung wird: Lieferant, Belegnummer, Belegdatum, Steuerbetrag, Nettosumme, Belegzeilen, Bestellreferenz.
Kontext
Ein typischer Workflow läuft in drei Schritten. (1) Erfassung: Belege kommen per Scan, E-Mail (über Outlook-Plugins), SFTP-Download oder Upload durch den Sachbearbeiter. (2) Extraktion: Ein OCR-Dienst liest den Text, ein Layout-Modell oder LLM-Pipeline extrahiert semantisch die Pflichtfelder; für ZUGFeRD-/Factur-X-/XRechnungen wird die eingebettete XML-Nutzlast direkt verwendet, OCR entfällt. (3) Verbuchung: Die extrahierten Daten werden gegen SAP-B1-Geschäftspartner, Bestellungen, Steuerkennzeichen gemappt; bei Abweichungen zwischen Bestellung und Rechnung erfolgt Prüfungsworkflow. Produktseitig stehen für SAP B1 mehrere Wege offen: SAP Document Information Extraction als BTP-Service, SAP Document and Reporting Compliance für E-Rechnung, Drittprodukte wie CKS.DIGITAL 4.0 mit integrierter OCR-Erkennung (die Schlagwörter extrahiert und über Referenzfelder Belege zuordnet), sowie AI-basierte Produkte wie der B1-Helpster mit FIBU-Helper-Komponente, die Kontierungsvorschläge auf Basis extrahierter Felder liefern.
Abgrenzung
Document Information Extraction ist mehr als klassisches OCR: Es liefert strukturierte Felder, nicht nur Rohtext. Es ist auch nicht identisch mit E-Rechnungsempfang — ZUGFeRD- und XRechnung-Belege werden direkt aus der XML-Nutzlast verarbeitet, ohne Extraktion aus einem Bild. Gegenüber einem reinen Dokumentenarchiv (CKS.DMS, d.velop) fokussiert DIE den Weg vom Dokument zum Buchungsbeleg; die reine Archivierung ist ein eigener, ergänzender Schritt. Die Workflow-Qualität hängt stark von Datenmodell, Lieferanten-Varianz und Freigabeprozessen ab — ein 95-%-Automatisierungsgrad ist realistisch erreichbar, aber niemals selbstverständlich.
Warum Unternehmen bei KI im ERP zögern
Predictive Maintenance: Wie den Mittelstand zur intelligenten Fabrik macht
RPA im ERP-Umfeld: Effizienzsteigerung durch digitale Prozesshelfer
Generative KI im ERP: Wie LLMs die Rolle von ERP-Systemen verändern
Mit APIs und Microservices die ERP-Zukunft vorbereiten