Pentaho veröffentlicht „Den Data Lake füllen“ - die Big Data-Blaupause für Hadoop

Neue Referenzarchitektur beschleunigt maßgeschneiderte Datenintegration und Analyse-Pipeline für Hadoop

June 28, 2016, HADOOP SUMMIT, SAN JOSE, CA —

Pentaho, ein Unternehmen der Hitachi Group, hat heute die Blaupause „Den Data Lake füllen” vorgestellt,  die Unternehmen die Entwicklung eines modernen Onboarding-Prozesses für die Aufnahme von Big Data in Hadoop-Data Lakes ermöglicht – und zwar flexibel, skalierbar und wiederholbar. Datenmanagement-Experten können sich jetzt der aufwendigen Vorbereitung von Daten entledigen und mehr Zeit in hochwertigere Projekte investieren.

Laut Ventana Research verbringen Unternehmen, die in Big Data-Projekte involviert sind, 46 Prozent ihrer Zeit mit der Vorbereitung ihrer Daten und 52 Prozent ihrer Zeit mit der Überprüfung der Datenqualität und -konsistenz. Mit der Blaupause „Den Data Lake füllen“ können Unternehmen die sich ändernden Datenquellen verwalten, wiederholbare und skalierbare Prozesse etablieren und eine angemessene Kontrolle und Governance gewährleisten. Dieses Konzept bietet Entwicklern die Möglichkeit, Aufnahmeprozesse problemlos zu skalieren und jeden Schritt der Daten-Pipeline zu automatisieren.

„Bei tausenden von Datenquellen unterschiedlicher Art ist die manuelle Programmierung von Transformationen für jede einzelne Datenquelle sehr zeitaufwändig und bringt eine äußerst schwierige Verwaltung und Wartung mit sich“, so Chuck Yarbrough, Senior Director of Solutions Marketing bei Pentaho, ein Unternehmen der Hitachi Group. „Entwickler und Datenanalysten müssen einen Prozess etablieren können, der viele heterogene Datenquellen unterstützt. Dies beinhaltet die unmittelbare Erkennung von Metadaten und deren Verwendung für die dynamische Erstellung von Anweisungen zur Automatisierung der Transformationslogik.

Wie im von Pentaho in Auftrag gegebenen Forrester Consulting -Bericht konstatiert, kombinieren im Durchschnitt 52 Prozent der Firmen mindestens 50 verschiedene Datenquellen für ihre Analysefunktionen, über ein Drittel (34 %) kombinieren mindestens 100 und 12 % kombinieren mindestens 1.000 Datenquellen. Während viele Unternehmen Python oder andere Skriptsprachen verwenden, um sich ihren Weg durch diese Datenquellen zu programmieren, vermindert die „Den Data Lake füllen“-Architektur die Abhängigkeit von fest programmierten Datenaufnahmeverfahren und setzt neben der Kosteneinsparung und der erheblichen Reduzierung des Wartungsaufwands ein sehr großes Potenzial an betrieblichen Effizienzgewinnen frei.

„Eine der größten Herausforderungen in der Big Data-Welt von heute stellt die einfache und automatisierte Datenaufnahme in Hadoop-Data Lakes dar. Unser Team hat begeistert daran gearbeitet, wiederholbare Methoden zu entwickeln, unter Anwendung derer die Big Data-Analyse-Pipeline optimiert und Big Data-Analysen durch mehr Agilität und Automatisierung vereinfacht werden können“, so Yarbrough.

Pentaho hat vier weitere Blaupausen entwickelt, mit denen Unternehmen ihre Big Data-Projekte im Handumdrehen optimieren und den damit verbundenen Herausforderungen begegnen können. Hier erfahren Sie mehr: Data Warehouse-Optimierung, Monetarisierung von Daten, Optimierte Datenaufbereitung und 360-Grad-Ansicht von Kunden.

Ressourcen

Folgen Sie uns auf LinkedInTwitter und Facebook


Über Hitachi Vantara

Hitachi Vantara, eine hundertprozentige Tochtergesellschaft der Hitachi, Ltd., unterstützt datenbasierte Spitzenunternehmen dabei, den Wert ihrer Daten zu erkennen und einzusetzen, um intelligente Innovationen voranzubringen und Ergebnisse zu erzielen, die einen Nutzen für die Geschäftswelt und die Gesellschaft bringen. Wir verbinden Technologie, geistiges Eigentum und Branchenkenntnisse, um Datenverwaltungslösungen zur Verfügung zu stellen, die es Unternehmen ermöglichen, ihren Kunden einen besseren Service zu bieten, neue Einnahmequellen zu erschließen und die Geschäftskosten zu senken. Nur Hitachi Vantara steigert Ihren Innovationsvorteil durch eine Kombination aus umfassenden Kenntnissen der Informationstechnologie (IT), Operational Technology (OT) und profundem Fachwissen. Wir arbeiten mit Unternehmen auf der ganzen Welt zusammen, um aus Daten aussagekräftige Ergebnisse zu machen. Besuchen Sie uns unter: www.HitachiVantara.com.