Document Cropping und Field Detection Algorithmen

PXL Vision

18 Apr 2024

Reading time

7 min

Das Herzstück des Prozesses der Identitätsprüfung sind zwei grundlegende Technologien: Document Cropping (Dokumentenbeschneidung) und Field Detection Algorithmen (Feld-Erkennungs-Algorithmen). Diese Technologien sind nicht nur Werkzeuge, sondern das Rückgrat moderner Systeme der Identitätsprüfung, die ständig verbessert und erneuert werden, um den wachsenden und sich ändernden Anforderungen der modernen Zeit gerecht zu werden. Durch die Verfeinerung der Genauigkeit und Anpassungsfähigkeit der Systeme werden zuverlässigere und effizientere Identifizierungsergebnisse erzielt. Dies führt zu einem reibungsloseren Identitätsprüfungsprozess und einer insgesamt besseren Benutzererfahrung.

In diesem Artikel möchten wir diese Technologien erläutern und zeigen, wie wir sie bei PXL Vision kürzlich verbessert haben.

Document Cropping Verbesserungen

Das Document Cropping ist ein Verfahren, das bei der digitalen Identitätsprüfung verwendet wird. Es dient dazu, lediglich das Ausweisdokument aus einem Bild auszuschneiden. Wenn Sie beispielsweise ein Foto mit Ihrem Handy machen und Ihr Ausweis irgendwo auf dem Bild zu sehen ist, erkennt die Technologie das Ausweisdokument automatisch und sorgt dafür, dass es in der Mitte des Bildes zu sehen ist. Dadurch wird der gesamte Prozess der Identitätsprüfung schneller und einfacher.

Optimiertes Document Cropping

Wir bei PXL Vision optimieren unsere Technologien kontinuierlich. Unser firmeninternes Team nutzt fortschrittliche Computer-Vision-Technologien, um benötigte Dokumente innerhalb eines Bildes genau zu lokalisieren:

Unterscheidung vom Hintergrund: Unser System nutzt intelligente technische Methoden, um Dokumente von allen möglichen geschäftigen Szenen und Hintergründen zu unterscheiden. Stellen Sie sich vor, Ihr Ausweis liegt auf einem Schreibtisch, auf dem neben dem ID-Dokument auch noch Dinge wie Tastatur, Zeitungen oder sogar andere Dokumente liegen. Trotz dieser visuellen Unklarheit kann unser System ihn erkennen. Nicht nur Trennschärfe, sondern auch Beleuchtung kann eine Herausforderung sein. Unabhängig von den Lichtverhältnissen kann unser System Dokumente genau finden und fokussieren. Egal ob schwach beleuchtet oder bei hellem Licht mit glänzenden Reflexionen.

Adaptives Lernen: Die maschinellen Lernalgorithmen von PXL Vision werden kontinuierlich anhand eines Datensatzes verfeinert, der für reale Bedingungen sehr repräsentativ ist. Dieser Datensatz umfasst verschiedene Dokumententypen und Erfassungsszenarien, wie zum Beispiel unterschiedliche Hintergründe und Lichtverhältnisse. Dadurch wird das System robust und vielseitig.

Document Cropping bei Krankenversicherungskarten als eine Herausforderung

Unser Ziel bei PXL Vision ist es, unseren Kunden eine möglichst hohe Conversion Rate bei der Identitätsprüfung zu ermöglichen. Die Unterstützung einer Vielzahl von ID-Dokumenten trägt ebenfalls zu diesem Ziel bei. Unsere Technologie zum Document Cropping ist auf Hunderttausende von Dokumenten in der Produktion trainiert und ist selten die Ursache für eine fehlgeschlagene Identitätsprüfung.

Im Zuge der Unterstützung von immer mehr internationalen Dokumenten stieß man jedoch auf eine neue Herausforderung: Dokumente mit Magnetstreifen. Magnetstreifen auf Dokumenten mögen ungewöhnlich klingen, da sie sich selten auf Pässen oder ID-Dokumenten befinden. Auf Krankenversicherungskarten und kanadischen Führerscheinen sind sie jedoch recht häufig zu finden. Als internationaler Anbieter digitaler Identitäten war es unerlässlich, sich an diesen Umstand anzupassen.

Nachdem wir diesen Use Case untersucht und getestet hatten, wurde unser Zuschneidemodell so trainiert, dass es Dokumente mit magnetischen Streifen mit allen möglichen Hintergründen berücksichtigt. Indem wir herausfanden, wie wir mit diesen magnetischen Streifen umgehen, wurde das System leistungsfähiger. Jetzt kann es mit mehr Arten von Dokumenten umgehen und ist einfacher und zuverlässiger in der Anwendung. Unsere Lösung zur Identitätsprüfung ermöglicht das Auslesen von schweizerischen und deutschen Krankenversicherungskarten.

Dadurch können Prozesse der Patientenregistrierung im E-Health-Bereich unterstützt werden. Durch die sichere Extraktion aller relevanten Daten von schweizerischen und deutschen Krankenversicherungskarten, einschließlich Namen, Versicherungsnummern und anderer wichtiger Details, kann das Onboarding von Patienten für verschiedene Verwaltungsdienste im Gesundheitssektor vereinfacht werden.

Europäische Gesundheitskarte mit Magnetstreifen

Kanadischer Führerschein mit Magnetstreifen

Die folgenden Verbesserungen wurden an dem erweiterten Document Cropping vorgenommen:

Verbesserung der Genauigkeit beim Scannen von ID-Dokumenten: Um von Anfang an klare, gut fokussierte Bilder von Ausweisdokumenten zu erhalten. Dieser Start bedeutet, dass jeder nachfolgende Schritt im Prozess des ID-Scans genauer ist.

Verbesserung der Conversion Rates: Unser automatisches, präzises Document Cropping reduziert den Bedarf an manuellen Korrekturen und minimiert menschliche Fehler. Dadurch wird der Prozess des ID-Scans rationalisiert, was zu weniger Abbrüchen und höheren Conversion Rates führt.

Verbesserung der Benutzerfreundlichkeit: Unser System ist für eine Vielzahl von Dokumenten geeignet, ohne dass manuelle Anpassungen erforderlich sind, und bietet eine nahtlose und benutzerfreundliche Erfahrung.

Larger image for an Id document taken by the user

Größeres Bild für ein vom Benutzer aufgenommenes ID-Dokument

Erkennen von ID-Dokumenten in einem größeren Bild

Ausgeschnittenes Bild

Verbesserung des Field Detection Algorithmus

Nach dem Zuschneiden des Dokuments ist die Field Detection ein wichtiger Teil des Online-Scannens von ID-Dokumenten. Dabei geht es darum, bestimmte Bereiche auf diesen Dokumenten zu finden, die wichtige Details wie Namen, ID-Nummern und Daten enthalten. Es ist wichtig, dass dieser Schritt genau durchgeführt wird, da er die Voraussetzungen dafür schafft, dass der Computer diese Informationen später korrekt lesen und extrahieren kann. Dieser Prozess des Lesens und Extrahierens von Textinformationen durch den Computer wird als OCR bezeichnet, was für Optical Character Recognition steht.

Unsere Techniken für den Field Detection Algorithmus?

Präzision bei der Erkennung:

Wir setzen modernste Bildverarbeitungs- und Computer-Vision-Technologien ein, um die Bereiche eines Dokuments, die wichtige Informationen enthalten, genau zu identifizieren und hervorzuheben.

Adaptive Algorithmen:

Unsere Algorithmen sind flexibel, d. h. sie können verschiedene Arten von ID-Dokumenten verarbeiten, unabhängig davon, wie sie angelegt oder gedreht sind. Dadurch wird sichergestellt, dass die Software immer die wichtigen Stellen auf einer Vielzahl von Dokumenten finden und genau lesen kann.

Vorteile des fortschrittlichen Field Detection Algorithmus

Die Fortschritte bei der Field Detection bringen erhebliche Vorteile mit sich:

Optimierte OCR-Genauigkeit: Indem wir sicherstellen, dass sich die OCR-Technologie auf die richtigen Bereiche eines Dokuments konzentriert, verbessern wir die Effizienz und Genauigkeit des Prozesses der Informationsextraktion erheblich.

Geringere Fehlerquoten: Unser zielgerichteter Ansatz minimiert die Verarbeitung unwesentlicher Bereiche des Dokuments, wodurch die Fehlerwahrscheinlichkeit sinkt und die Qualität der extrahierten Daten steigt.
Optimierte KYC-Prozesse: Unsere verbesserten Field Detection Algorithmen tragen mit schnelleren Verarbeitungszeiten von Dokumenten und weniger Abbrüchen zu reibungsloseren (KYC-)Prozessen bei, was letztlich zu höheren Conversion Rates führt.

Erkennung von beschnittenen Dokumenten

Fazit

Die kombinierte Weiterentwicklung der Algorithmen für das Document Cropping und die Field Detection stellt einen bedeutenden Fortschritt auf dem Gebiet der digitalen Identitätsprüfung dar. Durch die Integration modernster Computer-Vision- und Machine-Learning-Techniken wurde das Document Cropping erheblich verfeinert und der Prozess des ID-Scans optimiert, um sowohl die Effizienz als auch die Benutzerfreundlichkeit zu verbessern.

Gleichzeitig wurde durch die Entwicklung von Field Detection Algorithmen unter Verwendung der neuesten Bildverarbeitungstechnologie die Genauigkeit der optischen Zeichenerkennung (OCR) erheblich verbessert. Durch die genaue Identifizierung und Fokussierung auf Schlüsselbereiche von Ausweisdokumenten minimieren diese Algorithmen Fehler und rationalisieren KYC-Prozesse (Know Your Customer), was die Conversion Rates insgesamt erhöht.

Gemeinsam unterstreichen diese technologischen Verbesserungen das kontinuierliche Engagement für die Verbesserung der digitalen Identitätsprüfung, um sicherzustellen, dass sie sowohl zuverlässig als auch zugänglich bleibt. Dieses Engagement verbessert nicht nur die Sicherheit und die Einhaltung von Vorschriften in allen Branchen, sondern ebnet auch den Weg für eine Zukunft, in der digitale Transaktionen nahtlos in unser tägliches Leben integriert sind und das Vertrauen und den Komfort im digitalen Zeitalter erhöhen.