Pentaho veröffentlicht „Den Data Lake füllen“ - die Big Data-Blaupause für Hadoop

Neue Referenzarchitektur beschleunigt maßgeschneiderte Datenintegration und Analyse-Pipeline für Hadoop

June 28, 2016, HADOOP SUMMIT, SAN JOSE, CA —

Pentaho, ein Unternehmen der Hitachi Group, hat heute die Blaupause „Den Data Lake füllen” vorgestellt,  die Unternehmen die Entwicklung eines modernen Onboarding-Prozesses für die Aufnahme von Big Data in Hadoop-Data Lakes ermöglicht – und zwar flexibel, skalierbar und wiederholbar. Datenmanagement-Experten können sich jetzt der aufwendigen Vorbereitung von Daten entledigen und mehr Zeit in hochwertigere Projekte investieren.

Laut Ventana Research verbringen Unternehmen, die in Big Data-Projekte involviert sind, 46 Prozent ihrer Zeit mit der Vorbereitung ihrer Daten und 52 Prozent ihrer Zeit mit der Überprüfung der Datenqualität und -konsistenz. Mit der Blaupause „Den Data Lake füllen“ können Unternehmen die sich ändernden Datenquellen verwalten, wiederholbare und skalierbare Prozesse etablieren und eine angemessene Kontrolle und Governance gewährleisten. Dieses Konzept bietet Entwicklern die Möglichkeit, Aufnahmeprozesse problemlos zu skalieren und jeden Schritt der Daten-Pipeline zu automatisieren.

„Bei tausenden von Datenquellen unterschiedlicher Art ist die manuelle Programmierung von Transformationen für jede einzelne Datenquelle sehr zeitaufwändig und bringt eine äußerst schwierige Verwaltung und Wartung mit sich“, so Chuck Yarbrough, Senior Director of Solutions Marketing bei Pentaho, ein Unternehmen der Hitachi Group. „Entwickler und Datenanalysten müssen einen Prozess etablieren können, der viele heterogene Datenquellen unterstützt. Dies beinhaltet die unmittelbare Erkennung von Metadaten und deren Verwendung für die dynamische Erstellung von Anweisungen zur Automatisierung der Transformationslogik.

Wie im von Pentaho in Auftrag gegebenen Forrester Consulting -Bericht konstatiert, kombinieren im Durchschnitt 52 Prozent der Firmen mindestens 50 verschiedene Datenquellen für ihre Analysefunktionen, über ein Drittel (34 %) kombinieren mindestens 100 und 12 % kombinieren mindestens 1.000 Datenquellen. Während viele Unternehmen Python oder andere Skriptsprachen verwenden, um sich ihren Weg durch diese Datenquellen zu programmieren, vermindert die „Den Data Lake füllen“-Architektur die Abhängigkeit von fest programmierten Datenaufnahmeverfahren und setzt neben der Kosteneinsparung und der erheblichen Reduzierung des Wartungsaufwands ein sehr großes Potenzial an betrieblichen Effizienzgewinnen frei.

„Eine der größten Herausforderungen in der Big Data-Welt von heute stellt die einfache und automatisierte Datenaufnahme in Hadoop-Data Lakes dar. Unser Team hat begeistert daran gearbeitet, wiederholbare Methoden zu entwickeln, unter Anwendung derer die Big Data-Analyse-Pipeline optimiert und Big Data-Analysen durch mehr Agilität und Automatisierung vereinfacht werden können“, so Yarbrough.

Pentaho hat vier weitere Blaupausen entwickelt, mit denen Unternehmen ihre Big Data-Projekte im Handumdrehen optimieren und den damit verbundenen Herausforderungen begegnen können. Hier erfahren Sie mehr: Data Warehouse-Optimierung, Monetarisierung von Daten, Optimierte Datenaufbereitung und 360-Grad-Ansicht von Kunden.

Ressourcen

Folgen Sie uns auf LinkedInTwitter und Facebook


Über Pentaho, ein Unternehmen von Hitachi Group Company

Pentaho, ein Unternehmen von Hitachi Group Company, ist ein führender Anbieter von Datenintegrations- und Business Analytics-Lösungen mit einer leistungsstarken Open Source-basierten Plattform mit der Unternehmen entscheidende Einblicke in Big Data erhalten. Pentahos umfassende Datenintegrations- und Business Analytics-Plattform ist komplett in andere Umgebungen einbettbar und stellt geschützte Daten für Analysen jeglicher Art bereit. Pentaho hilft Organisationen und Unternehmen aus unterschiedlichsten Bereichen, all ihre Daten zu nutzen - ob Big Data oder Internet of Things - und entscheidende Einblicke daraus zu erlangen, um neue Einnahmequellen zu identifizieren, effizienter zu wirtschaften, besseren Service zu bieten und Risiken zu minimieren. Pentahos Lösungen wurden über 15.000-mal installiert und sind heute im kommerziellen Einsatz bei über 1.500 Kunden wie u.a. ABN-AMRO Clearing, EMC, NASDAQ, RichRelevance und Staples. Weitere Informationen finden Sie unter: www.pentaho.com/de.

Pentaho Media Contact

Round Earth Consulting
44-20 72 93 27 58
admin@roundearthconsulting.com