Data Lake & Advanced Analytics

Konsolidierung und Analyse von komplexen Unternehmens- und Kundendaten.

Projektsteckbrief

Ziel
Aufbau eines Data Lakes zur Konsolidierung und Bereinigung von Produktstammdaten und zur Analyse von Kundenbewegungsdaten

Dauer
12 Monate

System
IBM Cloud, Watson Services, Spark

Branche
Electronic​

Typ
B2B

Onboarding
2018 - 2019

Künstliche Intelligenz nutzen: Durch Datenanalyse Mehrwerte generieren

Der Kunde ist eine Kooperation von mittelständischen Elektrofachgroßhändlern mit mehr als 200 Verkaufsstellen in Deutschland und Österreich.

Die Herausforderung: Zusammenführung und Konsolidierung der Daten der Gesellschafter sowie die analytische Nutzung zur Optimierung von Einkauf, Logistik und Verkauf; dies unter besonderer Berücksichtigung der Datenhoheit der Gesellschafter sowie der DSGVO.

Die Lösung: Aufbau eines Systems zur Anbindung der verschiedenen datentragenden Systeme der Gesellschafter sowie zur Bereinigung, Klassifizierung und Verknüpfung der unterschiedlichen Datenbestände unter Einbeziehung spezialisierter Machine Learning-Algorithmen.

Entwicklung und Training von KI-Modellen und -Algorithmen in den Feldern Data Cleansing und Data Classification, Textmining und Image Analysis, Predictions und Recommendations, Forecasting und Reporting.

Der Mehrwert

Die Nutzbarmachung der Daten aller ermöglicht es dem einzelnen Gesellschafter, tiefere und genauere Einblicke in das Nutzer- und Käuferverhalten zu bekommen, als er sie aus seinen eigenen Daten gewinnen könnte. Predictions und Forecasts gewinnen durch die breitere Datenbasis an Genauigkeit und fördern den Absatz über die verschiedenen Kanäle von der Fläche bis zum Online-Shop.

Die Konsolidierung der Daten aller Gesellschafter erhöht die Datenqualität und reduziert Redundanzen und Dubletten zwischen den Systemen. Die offene und primär auf Opensource-Produkten realisierte Architektur ermöglicht die notwendige Flexibilität und Skalierbarkeit in der Anbindung und Verarbeitung verschiedenster Datenquellen.

Ein zentraler “Single-Point-of-Truth” zur Konsolidierung und Speicherung aller unternehmens- und kundenrelevanten Daten.

Die Technik

  • Zur Anbindung der verschiedenen Gesellschaftersysteme sowie der Steuerung der Data Cleansing und Data Mapping Prozesse wird eine Java-basierte Online-Applikation eingesetzt. Sie integriert zudem die notwendigen Data Governance-Regeln und übernimmt die Anonymisierung und Deanonymisierung der Gesellschafter- und Kundendaten.
  • Der performante und skalierbare “Data Lake” wird mittels MongoDB-Instanzen umgesetzt.
  • Advanced Analytics und die Entwicklung der KI-Modelle und -Algorithmen wird mittels Apache Spark realisiert.
  • Das gesamte System läuft innerhalb einer Private Cloud der IBM Cloud in Deutschland.
Übersicht der Funktionsweise: Zentrale Datenverarbeitung (nach DSGVO) mit Anbindung der Gesellschaftersysteme und Kunden - Zentraler Data Lake als Datenpool  - Advanced Analytics und KI-Modell & Algorithmen Entwicklung  mit Apache Spark - gehostet auf der IBM Cloud

Kontakt

Boxhandschuhe als Symbol für Entscheidung zwischen Data Lake und Data Warehouse
Blog 15.02.22

Data Lake vs Data Warehouse: Welche Lösung ist die Richtige?

Geht es um die Speicherung großer Datenmengen, kommt man um die Begriffe Data Lake und Data Warehouse kaum herum. Welche der beiden Lösungen für welchen Anwendungsfall geeignet ist!

Blog

So verändert Data Analytics die Industrie

Mit dem Einsatz von Data Analytics in der Industrie tun sich für Unternehmen zahlreiche neue Möglichkeiten auf.

Vogelperspektive Laptop Tastaturen
Training_Master

IBM Cognos Analytics – Data Modeling

Vogelperspektive Laptop Tastaturen
Training_Anfrage

IBM Cognos Analytics – Data Modeling

Vogelperspektive Laptop Tastaturen
Training_Termin

IBM Cognos Analytics – Data Modeling

Vogelperspektive Laptop Tastaturen
Training_Termin

IBM Cognos Analytics – Data Modeling

Mitarbeiterinnen der novaCapta im Büro in Hannover
Blog 12.04.22

Das Einmaleins zum Aufbau eines Intranets

Ein Intranet muss sorgfältig geplant, regelmäßig betreut und gezielt weiterentwickelt werden. Unser Einmaleins enthält die wichtigsten Organisationstipps für den Aufbau eines neuen Intranets.

Blog 20.05.22

In 6 Schritten zur passenden Data Analytics-Lösung

Um Innovation im Unternehmen voranzutreiben, braucht es eine state-of-the-art Data Analytics-Lösung. Erfahren Sie in sechs Schritten, wie Sie die für Sie passende Lösung finden!

Anonyme Referenz
Referenz

Aufbau von Infrastruktur und Middleware Plattform

Ein deutscher Onlinehändler hat eine Infrastruktur mit dem WebSphere Enterprise Service Bus (ESB) als zentrales Element etabliert. Entwickler der X-INTEGRATE trugen zur Qualitätsverbesserung bei.

novaCapta: Ihr Partner für die digitale Transformation mit Microsoft Technologien
Lösung

Knowledge Management erfolgreich aufbauen

Wir unterstützen Sie mit unserem Fachwissen dabei, eine optimal auf Ihr Unternehmen abgestimmte, lebendige Wissensplattform zu erstellen.

Hands of man using online virtual app on mobile phone. Millennial guy chatting on smartphone, using banking services, reading text message, typing, shopping, making call, browsing internet. Close up
Blog 28.05.18

Struktureller Aufbau eines Angular Modules

Dieser Blogbeitrag beschäftigt sich mit dem strukturellen Aufbau eines Angular Modules und der Kommunikation der einzelnen Komponenten.

Event

Data Fabric: Basis für Analytics und KI der nächsten Stufe

Im Webinar erfahren Sie, warum das Thema Data Fabric für Versicherer so wichtig ist. Wir erklären Ihnen, was die Data Fabric genau ist und welche Funktionalität sie für Data Science sowie den IT-Betrieb aufweist. In einer praktischen Demo zeigen wir Ihnen konkret Anwendungsfälle aus der Versicherungsbranche. Darüber hinaus erfahren Sie, in welchen Schritten Sie Ihre eigene Data Fabric einführen können.

Hand pointing closely at detailed data and analytical graphs displayed on a laptop screen during a business meeting, emphasizing critical information analysis.
Blog 19.03.25

Überblick: Microsoft Fabric als All-in-One Data & Analytics

Unser Experte Hans Lindner erläutert die Funktionsweise von Microsoft Fabric und beleuchtet, welche Vorteile die Plattform hat bzw. wann sich der Einsatz lohnt - inkl. konkreter Tipps für den Start.

EMI Music Logo
Referenz

Aufbau einer Integrationsumgebung bei EMI Music Germany

X-INTEGRATE bietet EMI Music Germany eine Prozessintegrationslösung auf Basis von IBM WebSphere MQ. Lesen Sie hier die Erfolgsgeschichte!

Leistung

Web Analytics

Für eine perfekte User Experience benötigt man ein kreatives Händchen, Zeit und Personal. Lohnen sich diese Investitionen überhaupt? Standard-KPIs wie Conversion Rate, durchschnittlicher Warenkorbwert und Bounce Rate sind interessant.

CLOUDPILOTS, Google Workspace, G Suite, Google Cloud, GCP, MeisterTask, MindMeister, Freshworks, Freshdesk, Freshsales, Freshservice, Looker, VMware Engine
Produkt

Google Analytics

Mit Google Analytics werden Websitedaten mit kostenlosen Tools an einem Ort umfassend analysiert. Mit drei einfachen Schritten die eigene Kundschaft besser verstehen.

Service 22.09.25

Analytics & Planning

Analytics & Planning

News 17.07.25

Aufbau eines globalen Full-Service-Atlassian-Champions

Weitere Stärkung der Atlassian-Kompetenzen von catworkx in Amerika, DACH und Europa mit Herzum

business people team meeting in modern office design planning ideas concept
Blog 25.10.23

Viva Engage: Unternehmenseigenes Social Network aufbauen

Im sechsten Teil unserer Microsoft Viva Serie zeigen wir Ihnen, wie Sie Viva Engage als unternehmensinternes Social Network nutzen können.

Referenz

EMW Stahl Service – Aufbau eines digitalen Service-Centers

Kundenzentrierung als Leitlinie für ein modernes Kunden- und Informationsmanagement.

Bleiben Sie mit dem TIMETOACT GROUP Newsletter auf dem Laufenden!