Datenverarbeitung/Big DataNews

Neo4j präsentiert Cypher for Apache Spark für openCyper-Projekte

CAPS für openCypher

Neo4j stellt dem openCypher-Projekt ab sofort eine frühe Version des Language Toolkits Cypher for Apache Spark (CAPS) zur Verfügung. Big-Data-Analysten können damit leichter Graph-Abfragen in ihren Workflows nutzen, Graph-Algorithmen einbinden und Verbindungen innerhalb ihrer Daten besser aufdecken. Nach SAP HANA, Redis, AgensGraph und Neo4j unterstützt damit nun auch Apache Spark die deklarative Graph-Abfragesprache Cypher. Damit stehen Entwicklern weitere Tools unter der Apache 2.0 Lizenz innerhalb des openCyper-Projekts zur Verfügung.

Angesichts der wachsenden Bedeutung von graphbasierten Anwendungen und Analyse-Projekten möchten Big-Data-Analysten zunehmend die Verknüpfungen zwischen verschiedenen Daten analysieren und verstehen. Beispielhaft hierfür sind eBay mit ihrem Empfehlungssystem sowie Telia und Comcast im Bereich Smart Home.

Data Scientists konnten Graph Pattern Matching bei der Nutzung von Spark bislang nicht uneingeschränkt nutzen. Mit Cypher for Apache Spark wird dies künftig einfacher. Existierende Datenquellen lassen viel schneller mit Graph-Anwendungen verbinden.

„Cypher for Apache Spark ist ein wichtiger Schritt, um die Verbreitung der Graphtechnologie sowie die Entwicklung von Cypher als universelle Abfragesprache weiter voranzutreiben“, erklärt Philip Rathle, Vice President of Products bei Neo4j. „Um Cypher für Apache Spark verfügbar zu machen, haben wir uns angesehen, wie Spark mit unveränderlichen Datensätzen arbeitet. In Abstimmung mit der openCypher Community haben wir die Möglichkeit geschaffen, Graphabfragen über die Ergebnisse von vorherigen Graphabfragen durchzuführen. Eine API erlaubt es, Graphen aufzuteilen, zu transformieren, oder in verschiedenen Versionen festzuhalten und solche Graphen in komplexe Abläufe einzubinden. Dadurch lassen sich Graphdaten, einschließlich der Daten aus Data Lakes von Anwendern flexibler verarbeiten. Cypher für Apache Spark ist die erste Anwendung von Cyper, in der man als Abfrageergebnis sowohl Datentabellen, als auch Graphen erhält.“

Darüber hinaus bietet Cypher für Apache Spark neue Funktionen für multiple Graphen und modulare Abfragen, die in der Zusammenarbeit mit der Anfang 2017 gegründeten openCypher Implementers Group entstanden sind. Das openCyper-Projekt bietet die Möglichkeit, in einer sehr frühen Phase an der Open Source Entwicklung von Cypher for Apache Spark unter der Apache 2.0 Lizenz mitzuwirken.

Weitere Informationen: www.neo4j.com