Headerbild zu OCR vs IDP (Intelligent Document Processing)

OCR vs IDP: Diese Vorteile bietet Intelligent Document Processing

IDP als KI-Upgrade für die klassische OCR

Hinweis: Dieser Blogbeitrag stammt aus der Zeit vor dem Zusammenschluss und wurde von X-INTEGRATE realisiert – heute Teil von ATVANTAGE. Unsere Erfahrung bleibt – nur unser Name hat sich geändert. Hier finden Sie weitere Informationen rund um die Fusion.

IDP (Intelligent Document Processing) wird für Unternehmen spätestens dann interessant, wenn sie mit OCR (Optical Character Recognition) nicht ans Ziel kommen. So versucht man mit Technologien wie OCR schon seit Jahrzehnten, unstrukturierte Dokumente wie PDFs, E-Mails oder Bilddateien in strukturierte Daten zu verwandeln. Damit sollen nachfolgende Prozesse automatisierbar gemacht werden. Außerdem sinkt die Fehlerquote, wenn Daten nicht mehr manuell übertragen werden müssen, etwa von einer Rechnung ins ERP-System. Soweit die Theorie.

Die Realität zeigt allerdings: Traditionelle OCR-Tools stoßen schnell an ihre Grenzen – insbesondere dann, wenn bestimmte Teile innerhalb eines Dokumentes einem bestimmten Objekttyp zugewiesen oder tabellarische Strukturen interpretiert werden müssen, um z.B. Bestelleingänge inkl. genauer Bestellmengen erkennen zu können. Hier kommt der Intelligent Document Processing-Ansatz ins Spiel. In diesem Blogbeitrag gebe ich Ihnen einen Überblick, was IDP ist, wie es funktioniert, wann sich der Einsatz lohnt – und vor allem, welche Vorteile es gegenüber OCR bietet.

Was ist IDP – und was hat es OCR voraus?

Intelligent Document Processing oder intelligente Dokumentenverarbeitung erlaubt Ihnen die automatisierte Datenerfassung aus Geschäftsdokumenten. So lassen sich mit dem Ansatz simple bis komplexe Formen in strukturierte Daten umwandeln. Dabei kombiniert IDP klassische OCR-Beleglesung mit neuen technischen Verfahren wie Machine Learning, Deep Learning und Natural Language Processing (NLP) aus dem Bereich der Künstlichen Intelligenz (KI).

Wenn OCR mit KI flirtet

Mit traditioneller OCR gemein hat IDP nur die Erkennung von Textzeichen gemein. Während diese aber schon an kleinsten Variationen scheitert, kann IDP auch mit Variationen umgehen und verarbeitet komplexe, unstrukturierte bis hin zu handgeschriebenen Dokumenten. OCR ist unfähig, selbst hinzuzulernen und abhängig von Vorlagen, IDP hingegen benötigt diese nicht zwingend. Und während man bei OCR alleine unaufhörlich nachbessern muss, ist menschliche Interaktion zur Verifizierung beim IDP-Ansatz nur noch spezifisch erforderlich.

Gegenüberstellung von IDP (Intelligent Document Processing) und OCR: Während OCR nur Textzeichen erkennt, bietet IDP noch viel mehr. Zum Beispiel: Kontexterkennung und vollständige Automatisierung.
IDP und OCR im Vergleich

Wie funktioniert IDP?

Pre-Processing

Schritt 1: Pre-Processing

In einem ersten Schritt automatisiert IDP die Datenerfassung aus unstrukturierten Dokumenten beliebigen Formats und unabhängig davon, ob sie im Mailpostfach, Scanner oder DMS-/ERP-/CRM-System eingehen – das sogenannte Pre-Processing. Flexible Erfassungs- und Vorverarbeitungsfunktionen sorgen für eine Sortierung der Dokumente und ihre schnelle Prozessintegration.

Understand

Schritt 2: Understand

Der KI-Einsatz erlaubt es anschließend, aus Dokumenten relevante Daten automatisch zu erkennen, zu klassifizieren und strukturiert zu extrahieren – auch komplexe Objekte wie verschachtelte Tabellen und Raster. Vor allem (und das ist der große Unterschied) werden nicht nur Daten erkannt, sondern IDP versteht und interpretiert auch ihren Kontext. Die Engine sucht zum Beispiel nach einer „Region of Interest“ auf dem Dokument, d.h. die Bereiche, die von Interesse sind, wie z.B. Firmierung, Liefertermin, Produktname, Menge usw. Dort identifiziert sie ein passendes Muster, schneidet den Bereich aus und überführt ihn in prozessierbare Strukturen. Dieser Part heißt folglich „Understand“. Die KI-Engine, OCR-Verfahren sowie anpassbare Automatisierungsregeln arbeiten kombiniert, um die meisten Dokumente automatisiert zu prozessieren. Alle nicht erkannten Dokumente werden dem Fachbereich für ein Datentraining zur Verfügung gestellt, um sie künftig automatisch zu erkennen.

Extract

Schritt 3: Extract

In der Extract-Phase schließlich stellt die IDP-Engine die nun strukturierten Daten Folgesystemen via API oder anderen Schnittstellenformaten zur korrekten Verarbeitung zur Verfügung.

Pre-Processing

Was sind Anwendungsfälle von IDP?

Kandidaten für IDP-Einsatz sind alle Dokumente bzw. dokumentenbasierte Prozesse mit intensiver menschlicher Interaktion: Rechnungseingangsautomatisierung, Auftragserfassung, Bestelleingänge und Änderungen, behördliche Formulare, Versicherungsdokumente oder Gesundheitsakten. In all diesen Szenarien sorgt IDP für einen höheren Durchsatz, verkürzt Prozesslaufzeiten und steigert die Genauigkeit und Effektivität der Datenerfassung, auch mit neuen Formaten oder Sprachen. Zudem lassen sich neue Datenquellen einfach einbinden und nutzen. Mehr Vorteile also, als sie jede herkömmliche OCR-Technologie zu bieten vermag.

Mitarbeiter erledigt Papierarbeit, sinnbildlich für Anwendungsfälle von IDP

Fazit: IDP als KI-Upgrade für OCR

Es zeigt sich: Obwohl OCR zweifellos seine Daseinsberechtigung hat, stößt es bei so manchem Anwendungsfall an seine Grenzen. Gerade bei komplexen, unstrukturierten oder handgeschriebenen Dokumenten mit intensiver menschlicher Interaktion lohnt es sich, den Einsatz von IDP in Erwägung zu ziehen.

Sie brauchen Unterstützung rund um Intelligent Document Processing? Als erfahrener Prozessautomatisierer und KI-Experte führt X-INTEGRATE passgenaue Lösungen ein. Dabei ist offen, ob eine bestehende SaaS-Lösung eingesetzt, individuelle Machine Learning Modelle trainiert oder gar eine Kombination gestaltet wird. Überzeugen Sie sich von unserer Expertise und buchen einen zweistündigen kostenlosen Termin, um mit einem unserer Experten über ihr Vorhaben zu sprechen.

Über den Autor: Matthias Bauer

Matthias Bauer ist seit 2020 als Teamlead Data Science bei der X-INTEGRATE (Teil der TIMETOACT GROUP) und bringt mehr als 15 Jahre Expertise als Solution Architect mit. Daten dafür nutzen, Großes zu schaffen und Mehrwerte zu erzielen – in seinen Worten: Data Thinking – ist seine Leidenschaft. Matthias ist erfahren in Artificial Intelligence, Data Science und Data Management; dabei bedient er von Data Warehousing bis hin zu Data Virtualization ein breites Spektrum an datenbezogenen Fragestellungen.  

Matthias Bauer
CTO Data Analytics & AI ATVANTAGE GmbH

Sprechen Sie uns gerne an!

Sie interessieren sich für Intelligent Document Processing? Oder haben allgemein Fragen zu unseren Services rund um Prozessautomatisierung und AI? Schreiben Sie uns einfach eine Nachricht – wir melden uns schnellstmöglich bei Ihnen zurück!

* Pflichtfelder

Wir verwenden die von Ihnen an uns gesendeten Angaben nur, um auf Ihren Wunsch hin mit Ihnen Kontakt im Zusammenhang mit Ihrer Anfrage aufzunehmen. Alle weiteren Informationen können Sie unseren Datenschutzhinweisen entnehmen.

Bitte Captcha lösen!

captcha image
Headerbild zu Intelligente Dokumentenverarbeitung / Intelligent Document Processing
Service 11.08.21

Intelligent Document Processing (IDP)

Intelligent Document Processing (IDP) umfasst die Erfassung, Erkennung und Klassifikation von Geschäftsdokumenten und Daten aus unstrukturierten und halbstrukturierten Texten.

News 06.08.21

Intelligent Document Processing ab sofort noch effizienter!

Wir verbessern unsere Leistung aus diesen Gründen im Gebiet Intelligent Document Processing stetig und haben nun mit den Experten der PLANET artificial intelligence GmbH aus Rostock einen starken Partner an unserer Seite.

Logo R+V color
Referenz

Optimiertes Qualitätsmanagement für R+V Versicher

Die neue QM-Lösung erlaubt die automatisierte Datenbeschaffung aus Drittsystemen.

Unternehmen

Anfahrt zur TIMETOACT GROUP in Köln

Egal ob mit dem Auto, mit dem Zug oder mit dem Flugzeug: Wir zeigen Ihnen, wie Sie am besten zu ins in den Mediaparkt nach Köln kommen.

Teamarbeit mit Tasse und Tastatur
Referenz

HCL Connections und ICEC vereinen sich zu einem globalen, cl

SikaWorld 2.0 in der Schweiz – Connections und das Connections Engagement Center vereinen sich zu einem globalen, cloud-basierten Social Intranet für 15.000 User.

Referenz

Beratung zur ivv Kollaborationsstrategie

Die zukünftige Kollaboration der ivv ist geprägt durch moderne Kommunikations- und Kollaboration-Werkzeuge und für das organisationsübergreifende Arbeiten im Verbund und mit Externen definiert.

Event

Webcast: KI für Versicherer

Dr. Matthias Quaisser erläutert Ihnen praktische Projekterfahrung und Erfolgsfaktoren von KI und erzählt von fachliche Anwendungsfälle von KI bei Versicherern.

May 14
Event 06.05.20

Webcast: Versicherung und Data Science

Marc Bastian zeigt Ihnen ein Beispiel einer analytischen Infrastruktur für KI Anwendungsfälle, praktische Projekterfahrung und Erfolgsfaktoren.

Event

Webcast: Cloud Transformation & "run your App"

Lernen Sie mit Jochen Schneider die Cloud 1.0 (Cloud 1.0 (Lift&Shift), Cloud 2.0 (Microservices, Big Data) und Cloud 3.0 (Multi Cloud Management, Big Compute) kennen.

Event

Webcast: Das kognitive Versicherungsunternehmen

Lernen Sie von Dr. Jürgen Huschens das Konzept des Kognitive Enterprise kennen, die Adaption auf die Versicherungsindustrie und vieles mehr.

Event

Webcast: VA-IT Anforderungen umsetzen

Unsere Experten Kerstin Gießer und Carsten Hufnagel von der TIMETOACT berichten Ihnen, wie VA-IT-Anforderungen schnell und Modular umgesetzt werden können.

Standort

Hannover

Finden Sie u.a. novaCapta GmbH und PKS Software GmbH in Hannover: Heiligerstraße 7, 30159 Hannover

Analytics und Business Intelligence
Service

Analytics & Business Intelligence

Analytics & Business Intelligence hat in den vergangenen Jahren zunehmend an Bedeutung gewonnen.

Standort

Dresden

Finden Sie u.a. IPG Information Process Group GmbH Deutschland in Dresden: Gertrud-Caspari-Str. 13; 01109 Dresden; +49 7531 957 3020; info@ipg-group.com

Standort

Berlin

Finden Sie u.a. IPG Information Process Group AG GmbH Deutschland und CLOUDPILOTS Software & Consulting GmbH in Berlin

Process Integration & Automation
Service

Process Integration & Automation

Unternehmensprozesse digitalisieren und verbessern sowie auf Veränderungen agil reagieren – diesen Herausforderungen sehen sich immer mehr Unternehmen gegenübergestellt.

Referenz

Von Notes zu Microsoft 365

TIMETOACT GROUP führt bei der HOCHBAHN einen Wechsel des bisherigen Lotus-Notes E-Mail-Systems auf eine moderne cloudbasierte Microsoft 365 Plattform.

Unternehmen

CLOUDPILOTS Software & Consulting GmbH

CLOUDPILOTS berät und begleitet Unternehmen bei dem Transformationsprozess von Geschäftsprozessen und -anwendung in die Cloud und unterstützt bei der Implementierung von Cloud basierten IT-Services (SaaS).

Social 16.02.21

FAST-elovend 2021 – unsere virtuelle Karnevalsfeier

Kölle Alaf! Auch dieses Jahr feierten die Jecken der TIMETOACT GROUP Fastelovend - aber nur FAST so wie immer. Denn nach unserer (digitalen) Weihnachtsfeier ließen wir uns auch Karneval nicht nehmen und feierten Karneval einfach virtuell.

Social 04.03.21

Fit im Home Office

Um unsere KollgInnen im Home Office bestmöglich zu unterstützen, haben wir im Rahmen unseres betrieblichen Gesundheitsmanagement ein Online Seminar zum Thema "Fit im Home Office" angeboten, um ihnen ihren Alltag ein Stück weit zu erleichtern.

Bleiben Sie mit dem TIMETOACT GROUP Newsletter auf dem Laufenden!