Datenverarbeitung/Big DataNewsSecurity

MapR veröffentlicht Apache-Spark-Distribution

MapR Technologies erweitert sein Angebot um eine Apache-Spark-Distribution. Die ab sofort verfügbare Distribution für den Einsatz im Unternehmen soll die Fähigkeiten des Frameworks mit den Features der MapR-Plattform kombinieren und so dessen Benutzung einfacher und verlässlicher machen. Weltweit setzen immer mehr Unternehmen auf Spark. Mit seinem neuen Produkt will MapR dazu beitragen, die weitere Verbreitung von Spark in der Big-Data-Welt zu erleichtern.

In der neuen Distribution enthalten ist die neueste Version von Apache Spark. Features wie In-Memory-Processing für Big Data ermöglichen die schnellere Entwicklung von Anwendungen und die Wiederverwendung von Code über Batch-, Interactive- und Streaming-Anwendungen hinweg. MapR wird die Distribution auch als Quick Start Solution anbieten, die vorgefertigte Templates sowie Konfiguration und Installation umfasst. Zu den üblichen Einsatzbereichen von Spark gehören der Aufbau von Datenpipelines und die Entwicklung von Analyse-Anwendungen, die auf maschinellem Lernen basieren.

Die Spark-Distribution erfüllt auch anspruchsvolle Aufgaben, darunter erweiterte Analysen wie Batch-Processing, maschinelles Lernen, prozedurales SQL und Graph Computing. Spark profitiert dabei von den patentierten Features der MapR-Plattform. Web-Scale-Storage, hohe Verfügbarkeit, Mirroring, Snapshots, NFS, Integrated Security und Global Namespace erleichtern die Benutzung im Unternehmenskontext und sorgen für mehr Verlässlichkeit. Durch die native Integration entsteht die vielleicht einzige verlässliche Plattform für Spark-Workloads. Erweitert werden kann die Distribution um Echtzeit-Streaming und Operational Analytics – mit MapR-Streams, MapR-DB und Hadoop als möglichen Add-ons.

“Wie Umfragen zeigen, werden die Nutzerzahlen von Apache Spark in Zukunft stark wachsen: 16 Prozent der Unternehmen nutzen Spark bereits, weitere 47 Prozent denken darüber nach, es zu tun. Spark wird die nächste Big-Data-Welle vorantreiben”, sagt Nik Rouda, Senior Analyst bei ESG. “Allerdings benötigen Unternehmen eine verlässliche Plattform, die den Herausforderungen ihres Tagesgeschäfts gewachsen ist. MapR beschleunigt die Durchsetzung von Spark, indem es diese Plattform nun anbietet.”

“Immer mehr unserer Kunden entscheiden sich für Spark als primäre Compute-Engine”, sagt auch Anoop Dawar, Vice President Product Management bei MapR Technologies. “Wir haben die neue Distribution entwickelt, um die Nutzung von Spark zu erleichtern. Entstanden ist eine integrierte Compute- und Storage-Engine für Analysen, Batch-Processing und die Echtzeit-Verarbeitung von Daten.”

Mit der neuen Distribution erweitert MapR sein Engagement in der Open-Source-Community. “Die Distribution ist ein Beleg für fortgesetzte Bereitschaft von MapR, auf Open Source zu setzen”, sagt John Tripier, Senior Director of Business Development bei Databricks. “MapR hat schon frühzeitig erkannt, welch großen Einfluss Spark auf die Big-Data-Welt nehmen wird. Wir freuen uns darüber, dass das Potenzial von Spark nun einem noch größeren Kreis an Personen und Unternehmen zur Verfügung steht.” MapR Platform including Spark ist im Rahmen der MapR Converged Community Edition und der MapR Converged Enterprise Edition verfügbar.

Weitere Informationen: https://www.mapr.com

Die mobile Version verlassen
%%footer%%