Geschäftsdokumente automatisch auslesen.
Ohne manuelle Erfassung.

SWXtract liest Daten aus PDFs und XML-Dateien vollautomatisch aus und klassifiziert sie — Rechnungen, Gutschriften, Mahnungen, Lieferscheine, Bestellungen. Azure Document Intelligence und GPT Vision Fallback. ZUGFeRD und XRechnung nativ. Ergebnis: strukturierte Daten, direkt verwendbar für Bali, SAP, DATEV oder Ihr ERP.

Was SWXtract löst

Eingehende Dokumente manuell erfassen kostet Zeit und erzeugt Fehler — egal ob Rechnung, Gutschrift oder Mahnung. SWXtract liest die Daten direkt aus der Datei, erkennt den Dokumenttyp automatisch und liefert ein strukturiertes Ergebnis. Was die KI nicht mit ausreichender Sicherheit erkennt, landet zur Prüfung im Review-Ordner.

📄

Geschäftsdokumente automatisch auslesen

Azure Document Intelligence erkennt alle Standardfelder aus PDFs und XML — Nummer, Datum, Fälligkeit, Lieferant, Steuer, Gesamtbetrag, Positionen. Mit Konfidenz-Bewertung pro Feld.

🗂️

Automatische Dokumentklassifikation

SWXtract erkennt den Dokumenttyp automatisch: Rechnung, Gutschrift, Mahnung, Lieferschein, Bestellung, Unbekannt. Jede Klasse landet in einem eigenen konfigurierbaren Zielordner.

🤖

GPT Vision als Fallback

Wenn Azure DI ein Feld nicht sicher erkennt, ergänzt GPT Vision automatisch — ohne die bereits erkannten Felder zu überschreiben. Nur fehlende Werte werden durch KI ergänzt.

📋

ZUGFeRD und XRechnung nativ

Eingebettetes XML in PDFs wird automatisch erkannt und hat Vorrang vor der Bildextraktion. Unterstützt alle fünf ZUGFeRD-Konformitätsprofile und XRechnung CII / UBL.

Vollständiger Funktionsumfang

Extraktion & KI

  • Azure Document Intelligence (prebuilt-invoice) als Hauptextraktionsmodell
  • GPT Vision als zweiter Extraktionspass bei unvollständigen Ergebnissen
  • Drei Extraktionsmodi konfigurierbar: Azure Only, GPT Only, Azure + GPT
  • Konfidenz-Bewertung pro Feld — niedrige Werte triggern NeedsReview
  • Automatische Dokumentklassifikation: Rechnung, Gutschrift, Mahnung, Lieferschein, Bestellung, Unbekannt

Eingabeformate

  • PDF-Rechnungen (beliebiges Layout)
  • ZUGFeRD PDFs (eingebettetes CII-XML automatisch erkannt)
  • XRechnung CII und UBL als eigenständige XML-Dateien
  • Netzwerkpfade (UNC) für Eingabe- und Ausgabeordner

Ausgabe & Integration

  • JSON-Export (vollständig mit Warnings, NeedsReview-Flag)
  • CSV-Export für Excel und Tabellenauswertung
  • XML-Export mit allen extrahierten Feldern und Konfidenzwerten
  • ERP-Integration via Task Scheduler oder PowerShell
  • MCP-Server für Claude Code (direkte KI-Assistent-Integration)

Technische Basis

Laufzeitumgebung
.NET 8 · Windows x64
Self-Contained EXE — kein .NET vorab nötig
KI-Dienste
Azure Document Intelligence · GPT Vision
Azure S0-Abonnement erforderlich (Free-Tier: 500 S./Monat)
Standards
EN 16931 · ZUGFeRD 2.3 · XRechnung 3.x
KoSIT-Validierung optional (Java erforderlich)
Bedienung
ConfigUI (WPF) + CLI-Tool
GUI für Einrichtung, CLI für automatisierten Betrieb
Distribution
~100 MB (CLI ~45 MB + ConfigUI ~50 MB)
Windows 10 / 11, 64-bit
ERP-Integrationen
Bali SAP DATEV Microsoft Dynamics Task Scheduler PowerShell

Zwei Komponenten, ein Produkt

SWXtract besteht aus einem grafischen Konfigurationseditor für die Einrichtung und einem CLI-Tool für den automatisierten Produktivbetrieb.

SWXtract.ConfigUI.exe
Konfigurationseditor

Grafische Oberfläche für alle 44 Einstellungen — aufgeteilt auf 6 Tabs. Kein JSON editieren, kein Azure-Portal im Browser suchen.

  • ✓ Azure-Zugangsdaten komfortabel eintragen
  • ✓ Ordnerpfade per Dateidialog wählen
  • ✓ Verarbeitung direkt aus der UI starten
  • ✓ Log-Viewer mit Filter und Token-Statistik
  • ✓ Automatische Konfigurationsbackups
SWXtract.exe
CLI-Tool

Kommandozeilenversion für automatisierten Betrieb. Läuft per Windows Task Scheduler, PowerShell oder als Batch-Job unbeaufsichtigt durch.

  • ✓ Einzelne Datei oder ganzen Ordner verarbeiten
  • ✓ Ausgabe als JSON, CSV oder XML
  • ✓ Exit-Codes für Scripting und Monitoring
  • ✓ Geeignet für tägliche automatische Verarbeitung
  • ✓ Integration in Bali, SAP, DATEV, Dynamics dokumentiert
Preis
Auf Anfrage

Lizenzmodell und Preis richten sich nach Einsatzszenario und Volumen. Schreiben Sie uns — wir erstellen ein Angebot auf Basis Ihres Bedarfs.

Angebot anfragen

Häufige Fragen

Brauche ich ein Azure-Konto?

Ja, für die KI-gestützte Extraktion wird ein Azure-Abonnement mit Document Intelligence (S0) benötigt. Der Free-Tier erlaubt 500 Seiten pro Monat kostenlos. Das Azure-Konto richten Sie einmalig ein — SWXtract benötigt nur Endpoint-URL und API-Key.

Welche Dateiformate werden unterstützt?

SWXtract verarbeitet PDF-Rechnungen und XML-Dateien (XRechnung CII und UBL). Eingebettete ZUGFeRD-Daten in PDFs werden automatisch erkannt und vorrangig ausgelesen — ohne Bildanalyse, direkt aus dem XML.

Wie integriert sich SWXtract in unser ERP-System?

Das CLI-Tool lässt sich per Windows Task Scheduler oder PowerShell automatisiert starten. Die Ausgabe erfolgt als JSON oder CSV — passend für Bali, SAP, DATEV, Microsoft Dynamics und andere ERP-Systeme. Wir dokumentieren die Integration für Ihr System.

Was passiert, wenn die KI ein Feld nicht erkennt?

SWXtract setzt automatisch das NeedsReview-Flag und leitet das Dokument in einen separaten Prüfordner. Optional ergänzt GPT Vision fehlende Felder als zweiter Extraktionspass. Kein Datenverlust, kein stilles Scheitern — jede Unklarheit ist im Ergebnis dokumentiert.

SWXtract testen oder Angebot anfragen.

Schreiben Sie uns — wir zeigen Ihnen SWXtract anhand Ihrer eigenen Belege und erstellen ein Angebot auf Basis Ihres Einsatzszenarios.

Kontakt aufnehmen