Puzzleteil zur Visualisierung von Integration

Einlesen großer Dateien mit Camel

Wissensbeitrag

Wenden wir uns einmal der Situation zu, dass eine relativ große Datei über eine simple Java Anwendung zerlegt und die so gewonnen Daten in eine Datenbank geschrieben werden sollen. Dazu gibt es verschiedene Ansätze, die sowohl Vor- als auch Nachteile aufweisen.

Möglichkeit 1: plain Java

Java bietet hierzu eine relativ simple Möglichkeit: Den FileReader. Mit diesem FileReader wird die Datei in das Java Programm eingelesen, in welchem dann verschiedene Bearbeitungsschritte vorgenommen werden können. Zum Schluss wird die Datei in die Datenbank geschrieben. Einen Haken hat diese einfache Prozedur allerdings: Der FileReader lädt die gesamte Datei in den Puffer. Dadurch entstehen – je nach Dateigrößen – immens große Laufzeiten. Im Worst-Case führt dieses Verfahren sogar zu einem Programmabsturz und wird damit vollständig unbrauchbar.

Tippen auf Tastatur

Ein Workaround für dieses Problem besteht darin, jeweils nur einzelne Zeilen mit Hilfe des Java-Integrierten Scanner Tools auszulesen und zu bearbeiten. So wird ein geringerer Anteil an Speicher auf einmal benötigt. Nun ergibt sich jedoch das Problem, dass diese Anwendung nachträgliche Anpassungen oder Erweiterungen deutlich schwierig gestaltet. Ein weiterer Nachteil besteht darin, dass erst immer eine komplette Zeile bearbeitet werden muss bevor die nächste Zeile eingelesen wird:

Zeile auslesen -> Bearbeitung und Daten herausfiltern -> Datenbank füllen

Der gesamte Vorgang muss außerdem an einem Stück passieren, da zwischendurch nicht einfach pausiert werden kann.

Plain Java eignet sich somit eher dafür, kleinere Dateien zu verarbeiten. Für größere Dateien empfehle ich andere Varianten – wie zum Beispiel über ActiveMQ und Camel, Open Source-Techniken.

Möglichkeit 2: Open Source (Apache ActiveMQ & Camel)

Rechner mit Programmiercode

Mit Apache Camel besteht in Verbindung mit ActiveMQ die Möglichkeit, oben angesprochene Thematik in zwei „Routen“ zu teilen und diese gleichzeitig laufen zu lassen. „Routen“ sind dabei Handlungsstränge in Camel, welche zum Beispiel eine Datei von A nach B schieben und zwischendurch noch andere Bearbeitungsschritte durchführen:

– Route 1 liest die Zeilen einzeln aus und schreibt diese auf eine Queue

– Route 2 nimmt sich die Messages aus der Queue und schreibt die gewollten Daten in die Datenbank

Ein Vorteil hierbei ist, dass die Routen simultan bearbeitet werden. Das bedeutet, dass Route 2 dauerhaft auf die Queue achtet. Sobald von Route 1 eine Message auf die Queue geschrieben wird, wird diese dadurch von Route 2 bearbeitet. Die fertig bearbeiteten Daten wandern im Anschluss direkt in die Datenbank.

Ein zweiter Vorteil dieser Variante: Asynchronität. Sollte Route 2 zum Beispiel einmal nicht auf die Queue lauschen, kann Route 1 trotzdem noch Messages in die Queue einreihen. Sobald Route 2 wieder verfügbar ist, holt sie sich die bereits vorhandenen Messages einfach ab. Letztlich kann diese Lösung noch durch Transaktionssicherheit ergänzt werden (ein weiterer Vorteil, den Camel von Haus aus bietet), sodass bei einem Ausfall die Daten trotzdem erhalten bleiben.

Ebenso ermöglicht diese Variante eine deutlich einfachere, nachträgliche Anpassung bzw. Erweiterung um zum Beispiel weitere Anbindungen, wie: Die Daten nicht nur in eine Datenbank schreiben, sondern verschiedene Daten zusätzlich noch an andere Stellen weiterzuleiten um beispielsweise eine Stückzahl einer Bestellung ans Lager weiterzugeben.

Welche Varianten nutzen Sie zum Einschreiben von Dateien in Datenbanken? Ich freue mich auf Ihre Erfahrungen, Meinungen und – selbstverständlich – auch Fragen zu diesem Thema.

Webinar on demand

Provisionierung in großen Entwicklungsumgebungen

In dem Webinar on demand wird ein zentrales Administrationssystem für Entwicklungsergebnisse auf Basis von Jira Service Management vorgestellt.

Blog 29.03.22

Interview mit Dagmar Groß-Böker

„Hybride Arbeitsmodelle haben wir Corona zu verdanken“ Corona hat eine Vielzahl von Unternehmen stark gebeutelt, sowohl aus Sicht der Mitarbeiter, als auch aus der Perspektive der Organisationsleitung. Doch die Pandemie habe auch ihre gute Seite, sagt die HR-Expertin Dagmar Groß-Böker. Im Gespräch mit Joubin Rahimi, Geschäftsführer der synaigy GmbH, erzählt sie, welchen Nutzen ihrer Meinung nach Corona für die Zukunft der Arbeit gebracht hat und woran es Führungskräften in unsicheren Zeiten oft noch mangelt.

Presse 14.10.22

Fachbeitrag: Ereignisgesteuerte Architekturen - Großes Event

Mit Ereignisgesteuerte Architekturen lassen sich Daten asynchron und in Echtzeit verarbeiten. Mehr dazu in unserem Fachbeitrag im IT-Administrator.

Wissen

Message Broker: Kleines Fixpack mit großer Wirkung

Anfang Oktober 2012 wurde Fixpack 1 für WebSphere Message Broker Version 8 veröffentlicht. Der folgende Blogeintrag beschäftigt sich mit einigen der Neuerungen, die andeuten könnten, wohin sich der Message Broker in Zukunft entwickelt.

News 19.08.24

BE.INSIDE 2024: Zwischen New Work, AI und Beach Vibes

Die BE.INSIDE 2024 bietet eine Plattform für Fachleute und Entscheider, um die Zukunft der Arbeitswelt im Zeitalter von KI und GenAI zu gestalten – mit Fokus auf Innovation, Networking und praxisnahem Wissenstransfer in einer außergewöhnlichen Location.

Blog 16.09.24

Business Innovation und Digitale Transformation mit AI

Die Implementierung von AI bietet enormes Potenzial für Unternehmen – von Effizienzsteigerungen bis hin zu völlig neuen Geschäftsmodellen. Doch wie jede technologische Revolution birgt sie auch Risiken und Fallstricke. In diesem Blogbeitrag werfen wir einen Blick auf die Potenziale von AI für Unternehmen und auf die häufigsten Fehler, die Sie bei der Einführung vermeiden sollten.

News 26.09.24

BE.INSIDE 2024 Ein Tag voller Inspiration am Blackfoot Beach

Erleben Sie die Highlights der BE.INSIDE 2024: Spannende Keynotes, interaktive Roundtables und Networking an einem Ort, der Urlaubsfeeling versprüht. Am 17. September lockte das Event der TIMETOACT GROUP rund 200 Gäste aus verschiedenen Branchen an den Blackfoot Beach in Köln. Erfahren Sie mehr über einen Tag voller Impulse und Austausch.

Social

Gemeinsam sind wir stark! - ITCS-Messe in Köln 2024

Das haben wir im September auf der ITCS-Messe in Köln wieder einmal bewiesen. Als Team haben wir die Vielfalt unserer Group präsentiert und für viel Aufmerksamkeit gesorgt! Besonders stolz sind wir auf die inspirierenden Vorträge von Hermann, Lisa und Matthias über Künstliche Intelligenz und den Zusammenhalt in der TIMETOACT GROUP sowie Vanessa, die ihren Weg als Frau in der IT auf der Women in Tech Bühne geteilt hat. Auch Benedict und Sophia haben mit ihrem Beitrag über das perfekte Rezept für Design -& Frontend-Projekte überzeugt und Innovationen gezeigt.🚀 Ein weiteres Highlight war der spannende Vortrag zu effizienten visuellen Regressionstests im CI/CD-Kontext von Marius🛠️ Ein großer Dank geht auch an Johanna, die den gesamten Tag so engagiert die Women in Tech Bühne moderiert hat.

Standort

Barcelona

Finden Sie die catworkx S.L. Spain: Av. Diagonal 640, Planta 6 08017 Barcelona, Spanien, +34 936 07 24 80, info-es@catworkx.com

Blog 09.07.24

Ein Erfahrungsbericht zur Praxis von Lean-Agile-Prinzipien

Spiele sind nicht nur Zeitvertreib; sie sind mächtige Werkzeuge, um abstrakte Konzepte greifbar zu machen. Während eines Workshops setzten wir verschiedene Spiele ein, die nicht nur Spaß machten, sondern auch tiefe Einsichten in Lean- und Agile-Prinzipien ermöglichten. Die Entscheidungen, die die Teilnehmer während des Spiels trafen, spiegelten oft die realen Herausforderungen und Chancen wider, mit denen Unternehmen konfrontiert sind.

Referenz 31.07.24

McKesson: Spend Management senkt 15 % Software-Kosten

Durch die strategische Beratungs- und Serviceleistung des Spend-Management-Teams von TIMETOACT erzielte das Unternehmen Ersparnisse von 15 % bei einem der größten Software-Hersteller ein.

News 21.08.24

TIMETOACT GROUP geht Partnerschaft mit HONICO ein

Die TIMETOACT GROUP hat im Bereich IT Asset Management eine strategische Partnerschaft mit HONICO geschlossen, um ihre Position als führender IT-Dienstleister weiter auszubauen.

Event Archive 22.10.24

AI Meetup 2024

Führende AI-Experten der TIMETOACT GROUP und aus unserem Partnernetzwerk laden Sie zu einem spannenden Abend im schönen Hauptquartier des AI Village ein, an dem wir das Thema Künstliche Intelligenz (AI) aus pragmatischer Sicht auf den Prüfstand stellen und konkrete Anwendungsbereiche aus der Praxis näher beleuchten.

Nov 26
News 04.11.24

EverIT wird Teil von catworkx und TIMETOACT GROUP

Köln/Budapest, 4. November 2024 – catworkx (Teil der TIMETOACT GROUP), führender Anbieter für die Enterprise-Integration auf Basis der Atlassian-Plattform, übernimmt EverIT, einen spezialisierten Atlassian-Partner mit Sitz in Ungarn. Gemeinsam werden die Unternehmen auf ihrer langjährigen Beziehung aufbauen und die führende Marktposition von catworkx in Mittel- und Osteuropa ausbauen sowie das globale Angebot von catworkx stärken. Über die Details der Transaktion haben die Parteien Stillschweigen vereinbart.

Referenz 13.11.24

Turck Holding schafft effizientere IT-Struktur

Mehr Effizienz und Struktur durch eine nachhaltige IT-Strategie: Die Turck Holding GmbH stellt ihre IT-Organisation neu auf und richtet diese mit Unterstützung der TIMETOACT GROUP zukunftssicher aus. Erfahren Sie mehr.

Event

Webcast: Smarte Erkennung von Kostennoten

Unsere Speaker Madeline Jolk und Frank Trila von der TIMETOACT berichten Ihnen alles rund um das Thema Erkennung von Kostennoten.

Analytics und Business Intelligence
Service

Analytics & Business Intelligence

Analytics & Business Intelligence hat in den vergangenen Jahren zunehmend an Bedeutung gewonnen.

Process Integration & Automation
Service

Process Integration & Automation

Unternehmensprozesse digitalisieren und verbessern sowie auf Veränderungen agil reagieren – diesen Herausforderungen sehen sich immer mehr Unternehmen gegenübergestellt.

Security, Identity & Access Management
Service

Security, Identity & Access Management

Immer wieder hört man von Hackerangriffen auf Unternehmen – und Ziel sind sensible Unternehmensdaten.

Managed Services & Managed Support
Service

Managed Services & Managed Support

Durch unsere Managed Service Team aus Spezialisten der TIMETOACT GROUP entlasten Sie Ihr IT-Department. Wir sorgen dafür, dass Sie effizienter, zuverlässiger und schneller arbeiten können

Bleiben Sie mit dem TIMETOACT GROUP Newsletter auf dem Laufenden!