Pentaho 7.0

Visuelle Datenaufbereitung
überall in der Pipeline

Watch Video Free Trial

Pentaho 7

DATENVORBEREITUNG FÜR ANALYSEN

Was wäre, wenn Sie von überall in der Daten-Pipeline auf Analysen zugreifen könnten? Nicht nur, nachdem Daten für ein Geschäftsanalyse-Tool vorbereitet und exportiert wurden? Arbeiten Sie mit der einzigen Plattform auf dem Markt, die eine Datenvorbereitung mit Analyse bietet, ohne dass Sie erst zwischen Tools hin und her wechseln müssen – damit Daten schneller für neue Einblicke bereit sind.

  • Analyse bei der Datenvorbereitung: ETL-Entwickler und mit der Datenvorbereitung betraute Mitarbeiter können Analysen schnell stichprobenartig überprüfen. Sie erhalten bei jedem Schritt des Datenvorbereitungsprozesses Zugriff auf Diagramme, Grafiken, Visualisierungen oder auch Ad-hoc-Analysen.
  • Freigabe von Analysen während der Datenvorbereitung: Veröffentlichen Sie während der Datenvorbereitung Datenquellen für das Unternehmen. Mit der Möglichkeit, Daten sofort mit Quellen zu teilen, kann die IT besser dem Unternehmen zuarbeiten. Weil weniger Schritte anfallen, sind die richtigen Analysen schneller verfügbar.

NEUE SPARK-FUNKTIONEN

Immer mehr Unternehmen entscheiden sich für Spark, um Big Data schnell und flexibel zu verarbeiten und zu analysieren. Da jedoch nur wenige Entwickler Spark beherrschen, profitiert die Produktion oft nicht so stark von Spark wie eigentlich möglich. Diese Updates sollen dazu beitragen, dass mehr Mitarbeiter die Vorteile von Spark nutzen und als Teil eines größeren datengesteuerten Geschäftsprozesses einsetzen können.

  • Spark mit SQL-Zugriff: Durch den Zugriff auf SQL mit Spark als Datenquelle innerhalb der Pentaho Data Integration können ETL-Entwickler und Datenanalysten einfacher Spark-Daten abfragen und mit anderen Daten zur Vorbereitung und Analyse integrieren.
  • Erweiterte Spark-Orchestrierung: Jetzt gibt es eine visuelle Koordinierung und Planung für Spark-Anwendungen, die eine größere Anzahl unterschiedlicher Bibliotheken nutzen, wie z. B. Spark Streaming und Spark SQL sowie SparkML und Spark MLlib für maschinelles Lernen. Auch unterstützt Pentaho nun die Orchestrierung von in Python geschriebenen Spark-Anwendungen.

ERWEITERTE HADOOP-SICHERHEIT

Visuelle Entwickler-Tools für Big Data müssen die Anforderungen von Security Frameworks erfüllen, die wichtige Datenquellen im Unternehmen vor unberechtigtem Zugriff schützen. Mit Hadoop-Sicherheitstechnologien vereinfachen Sie die Big Data Governance und senken Risiken, die mit der erweiterten Pentaho-Integration einhergehen könnten.

  • Erweiterte Kerberos-Integration: Dank der neuen Funktionen können Sie jetzt die Big Data-Integration mehreren Nutzern zugänglich machen, da bei der neuen Pentaho Version mehrere Anwender auf Kerberos-fähige Cloudera Cluster zugreifen können.
  • Sentry-Kompatibilität: PDI bietet gemeinsam mit Sentry einen rollenbasierten Zugriff auf bestimmte Hadoop-Datenbestände. Dadurch sind das Tracking und die Durchsetzung von Berechtigungskonzepten auf kleinster Detailebene möglich.

ERWEITERTE METADATEN-EINSPEISUNG

IT-Teams verbringen unzählige Stunden mit der Programmierung von Aufnahme- und Verarbeitungs-Jobs, um unterschiedlichste Big Data-Quellen einspeisen zu lassen. Steigern Sie die IT-Produktivität beim Ausbau vieler Datenmigrations- und Onboarding-Prozesse durch die Automatisierung und Skalierung von Big Data-Pipelines mit Metadaten-Einspeisung. 

  • Metadaten-Einspeisung auf mehrere Schritte erweitert: Dank Unterstützung der Metadaten-Einspeisung für über 30 zusätzliche PDI-Schritte können IT-Teams während der Laufzeit mehr unterschiedliche Datentransformationen automatisch generieren. Zu den neuesten einspeisungsfähigen Schritten gehören Abläufe in Hadoop, Hbase, JSON, XML, Vertica, Greenplum und anderen Big Data-Quellen.

WEITERE VERBESSERUNGEN

Pentaho 7.0 umfasst zahlreiche weitere Verbesserungen, mit denen Sie Ihre Investition zukunftssicher machen und Big Data noch besser nutzen können.

  • Unterstützung von Kafka: Senden und empfangen Sie Daten von Kafka, das beliebte verteilte Messaging-System für Big Data und IoT.
  • Unterstützung von Avro und Parquet: Geben Sie Dateien in Avro und Parquet aus. Beides sind weit verbreitete Formate zum Speichern von Daten in Hadoop. 
  • Einfachere Konfiguration, Entwicklung und Verwaltung: Sie können jetzt schneller und einfacher einen einheitlichen Server für die Datenintegration und Geschäftsanalysen konfigurieren, bereitstellen und verwalten, um Implementierungen und Produktionsumgebungen von Pentaho zu unterstützen.