SWXtract liest Daten aus PDFs und XML-Dateien vollautomatisch aus und klassifiziert sie — Rechnungen, Gutschriften, Mahnungen, Lieferscheine, Bestellungen. Azure Document Intelligence und GPT Vision Fallback. ZUGFeRD und XRechnung nativ. Ergebnis: strukturierte Daten, direkt verwendbar für Bali, SAP, DATEV oder Ihr ERP.
Eingehende Dokumente manuell erfassen kostet Zeit und erzeugt Fehler — egal ob Rechnung, Gutschrift oder Mahnung. SWXtract liest die Daten direkt aus der Datei, erkennt den Dokumenttyp automatisch und liefert ein strukturiertes Ergebnis. Was die KI nicht mit ausreichender Sicherheit erkennt, landet zur Prüfung im Review-Ordner.
Azure Document Intelligence erkennt alle Standardfelder aus PDFs und XML — Nummer, Datum, Fälligkeit, Lieferant, Steuer, Gesamtbetrag, Positionen. Mit Konfidenz-Bewertung pro Feld.
SWXtract erkennt den Dokumenttyp automatisch: Rechnung, Gutschrift, Mahnung, Lieferschein, Bestellung, Unbekannt. Jede Klasse landet in einem eigenen konfigurierbaren Zielordner.
Wenn Azure DI ein Feld nicht sicher erkennt, ergänzt GPT Vision automatisch — ohne die bereits erkannten Felder zu überschreiben. Nur fehlende Werte werden durch KI ergänzt.
Eingebettetes XML in PDFs wird automatisch erkannt und hat Vorrang vor der Bildextraktion. Unterstützt alle fünf ZUGFeRD-Konformitätsprofile und XRechnung CII / UBL.
Extraktion & KI
Eingabeformate
Ausgabe & Integration
SWXtract besteht aus einem grafischen Konfigurationseditor für die Einrichtung und einem CLI-Tool für den automatisierten Produktivbetrieb.
Grafische Oberfläche für alle 44 Einstellungen — aufgeteilt auf 6 Tabs. Kein JSON editieren, kein Azure-Portal im Browser suchen.
Kommandozeilenversion für automatisierten Betrieb. Läuft per Windows Task Scheduler, PowerShell oder als Batch-Job unbeaufsichtigt durch.
Lizenzmodell und Preis richten sich nach Einsatzszenario und Volumen. Schreiben Sie uns — wir erstellen ein Angebot auf Basis Ihres Bedarfs.
Angebot anfragenJa, für die KI-gestützte Extraktion wird ein Azure-Abonnement mit Document Intelligence (S0) benötigt. Der Free-Tier erlaubt 500 Seiten pro Monat kostenlos. Das Azure-Konto richten Sie einmalig ein — SWXtract benötigt nur Endpoint-URL und API-Key.
SWXtract verarbeitet PDF-Rechnungen und XML-Dateien (XRechnung CII und UBL). Eingebettete ZUGFeRD-Daten in PDFs werden automatisch erkannt und vorrangig ausgelesen — ohne Bildanalyse, direkt aus dem XML.
Das CLI-Tool lässt sich per Windows Task Scheduler oder PowerShell automatisiert starten. Die Ausgabe erfolgt als JSON oder CSV — passend für Bali, SAP, DATEV, Microsoft Dynamics und andere ERP-Systeme. Wir dokumentieren die Integration für Ihr System.
SWXtract setzt automatisch das NeedsReview-Flag und leitet das Dokument in einen separaten Prüfordner. Optional ergänzt GPT Vision fehlende Felder als zweiter Extraktionspass. Kein Datenverlust, kein stilles Scheitern — jede Unklarheit ist im Ergebnis dokumentiert.
Schreiben Sie uns — wir zeigen Ihnen SWXtract anhand Ihrer eigenen Belege und erstellen ein Angebot auf Basis Ihres Einsatzszenarios.
Kontakt aufnehmen