HuberSolution

Dokumenten-Automatisierung mit KI — Belegerkennung, Eingangsrechnungen, Verträge

Eingangsrechnungen, Lieferscheine, Verträge, Bestellbestätigungen — Dokumente sind das Klebeband, das Ihr Geschäft zusammenhält. Sie kommen als PDF, als Bild, als gescanntes Papier — und werden in den meisten Mittelständlern noch immer von Menschen abgetippt. Genau hier setzt KI-gestützte Dokumenten-Automatisierung an: Lesen, verstehen, in die richtigen Felder bringen — automatisch.

Dokumente, bei denen sich Automatisierung lohnt

  • Eingangsrechnungen — Lieferant, Datum, Beträge, Konten, Steuersätze automatisch erkannt und in BMD, DATEV oder dem Buchhaltungs-Modul Ihres ERP gebucht
  • Lieferscheine — Wareneingang automatisch erfasst, Bestände live aktualisiert
  • Bestellbestätigungen — Lieferantenbestätigungen mit der ursprünglichen Bestellung abgeglichen, Abweichungen markiert
  • Verträge — Laufzeit, Kündigungsfristen, Konditionen extrahiert; ein Dashboard warnt bei anstehenden Fristen
  • Anfragen & RFQs — eingehende Kundenanfragen werden klassifiziert und an die richtige Person geroutet
  • Personalunterlagen — Bewerbungen, Lebensläufe, Zeugnisse extrahiert und vorqualifiziert
  • Zertifikate & Prüfberichte — relevante Werte extrahiert, in QM-System geschrieben, bei Auffälligkeiten alarmiert

Wie das technisch funktioniert

Ein typischer Workflow läuft in 4 Stufen:

  1. Erfassung: Dokumente landen per E-Mail, Upload, gescanntem Eingang oder API in einem Eingangs-Pool
  2. OCR + KI-Extraktion: Texte werden ausgelesen, Felder werden vom LLM strukturiert erkannt — auch bei schlecht gescannten Belegen oder ungewöhnlichen Layouts
  3. Validierung: automatische Plausibilitätsprüfung (Lieferant in Stammdaten? Beträge plausibel? Mehrwertsteuer korrekt?). Bei Unsicherheit: Vorschlag an einen Menschen, mit Markierung der unsicheren Stellen
  4. Buchung: in Ihr ERP / Buchhaltungs-System / DMS — voll oder mit menschlicher Freigabe, je nach Risiko

Tech-Stack, den wir typischerweise einsetzen

  • OCR: Tesseract (Open Source), Google Document AI, AWS Textract, Azure Document Intelligence
  • KI-Strukturierung: Claude oder GPT mit strukturiertem Output (JSON-Schema), spezielle Modelle wie Mistral OCR, Donut, LayoutLMv3
  • Workflow-Engine: Python (Celery, Airflow) oder n8n für Sichtbarkeit
  • Speicher: S3-kompatibel, on-premise mit MinIO, oder direkt im ERP-DMS
  • Buchungs-Adapter: ABAS, SAP, Infor LN, BMD, DATEV, Sage — je nach Ihrem System

Wo KI heute schon richtig gut ist

  • Strukturierte Standard-Belege (Rechnungen, Lieferscheine) → 90–95 % Erkennungsrate
  • Mehrsprachige Dokumente (DE/EN/FR/IT) → ohne Mehraufwand
  • Tabellen, auch mit verschmolzenen Zellen → robuster als klassisches OCR
  • Handschriftliche Notizen → besser als jede klassische Lösung

Wo KI noch unsicher ist

  • Sehr individuelle Branchendokumente (Speziallaboratoriums-Berichte, branchenspezifische Formulare) → benötigen ein paar Hundert Beispiele zum Feintuning
  • Sicherheitskritische Verträge → menschliche Freigabe bleibt Pflicht
  • Sehr schlecht eingescannte Dokumente (verwischt, abgeschnitten) → Pre-Processing nötig

Referenzprojekt: Eingangsrechnungs-Pipeline

Ein Handelsunternehmen mit ca. 800 Eingangsrechnungen pro Monat — bisher voll manuelle Erfassung in BMD durch zwei Mitarbeiter, ca. 40 Stunden/Monat reine Tipp-Arbeit.

Was wir gebaut haben: Rechnungen kommen per E-Mail oder als Upload in eine Web-App. KI extrahiert Lieferant, Datum, Beträge, Steuersätze und schlägt eine Kontierung basierend auf historischen Buchungen vor. Mitarbeiter prüft eine kompakte Übersichtsseite, korrigiert bei Bedarf, klickt „Buchen“. Daten gehen direkt nach BMD.

Ergebnis nach 3 Monaten: Erfassungszeit pro Rechnung von 3 Min auf 25 Sek. Etwa 30 h/Monat eingespart. Fehlerrate halbiert. ROI nach 7 Monaten.

Was Dokumenten-Automatisierung realistisch kostet

  • Einzelner Dokumenttyp (z. B. nur Eingangsrechnungen): 8.000 – 22.000 €
  • Mittlere Pipeline (3–4 Dokumenttypen, ERP-Anbindung): 25.000 – 60.000 €
  • Umfassendes DMS-Projekt (mehrere Quellen, Validierung, Audit-Trail): 60.000 – 150.000 €

Laufende Kosten: API-Calls bei kommerziellen OCR/LLMs (typ. 0,01–0,10 € pro Dokument) oder ein lokaler Server für selbstgehostete Modelle.

Häufige Fragen

Brauchen wir spezielle Hardware oder Scanner?

Nein. Bestehende Multifunktionsgeräte oder einfache Smartphone-Scans reichen. Auch reine PDF-Eingänge per Mail funktionieren problemlos.

Wie ist das mit Datenschutz, wenn Rechnungen Kundendaten enthalten?

Bei sensiblen Bereichen empfehlen wir lokale OCR + lokale LLMs — keine Daten verlassen Ihr Netzwerk. Bei weniger kritischen Belegen sind EU-gehostete Cloud-APIs (Azure Document Intelligence, Google Document AI EU-Region) ein guter Kompromiss.

Müssen wir alle bisherigen Prozesse umstellen?

Nein. Wir docken an Ihre bestehenden Workflows an. Mitarbeiter sehen weiterhin die ihnen vertrauten Oberflächen — nur die Tipp-Arbeit verschwindet.

Was, wenn die KI mal falsch liegt?

Genau dafür bauen wir eine Validierungs-Stufe ein: unsichere Werte werden markiert, Mensch bestätigt oder korrigiert mit einem Klick. Die Korrekturen werden gelernt und reduzieren die Quote über die Zeit.

Verwandte Themen: KI-Lösungen Übersicht · Prozessautomatisierung · ERP-Integration

Lust, kurz drüber zu reden?

Das Erstgespräch ist kostenlos und unverbindlich — 30 Minuten, in denen wir Ihre Situation anhören und eine erste Einschätzung geben. Kein PowerPoint, kein Verkaufspitch, kein Druck.

P
Kurze Frage?Ich helfe Ihnen gerne weiter — einfach klicken!