Archive / BigData

RSS feed for this section

Spark, HBase and Gradle

While I read the book Learning Spark, I really missed a Gradle build file for my Spark job. As a huge Gradle fan, I put together a build file. Concurrently I’m playing around with Spark and HBase. So here is my build.gradle, which also contains dependencies to HBase. View the code on Gist. HTH!

BigData Tutorials and Tools

„Hadoop: the Definitive Guide.“ is the most important text on Hadoop. Online you’ll find other useful tutorials. So here just a quick list of good Big Data tutorials: Hadoop https://developer.yahoo.com/hadoop/tutorial/ https://github.com/templedf/javaone14_handsonhadoop  (Slides) Spark http://ampcamp.berkeley.edu/big-data-mini-course-home/ Quick Start VMs Cloudera and Hortonworks offers you VM Images (single-node cluster). That’s really cool. Cloudera Quickstart VM Hortonworks Sandbox Reference: […]

Vortrag Architektur Insights auf slideshare veröffentlicht

Folien jetzt veröffentlicht Ich habe die Foilen zum Talk „Etracker Architektur Insights“, den ich im Oktober 2014 auf der code.talks gehalten habe, nun auf slideshare veröffentlicht. Mit der Präsentation bekommt ihr eine umfangreiche Übersicht wie die Themen Big Data und NoSQL im Webanalyse-Umfeld gehandhabt werden und welche Architekturprinzipien Anwendung finden. Hier ist der Link: http://bit.ly/1MiKIyo Viel […]

Rohdatenarchiv-Blogartikelserie veröffentlicht

Rohdatenarchiv im Webanalyse-Umfeld Ich habe eine Artikelserie zum Thema Rohdatenarchiv für den etracker Blog geschrieben. In den Artikeln beschreibe wie ein Rohdatenarchiv und zweistufiges NoSQL-Datenbankkonzept im Webanalyse-Umfeld vom Nutzen ist. Die Artikel könnt ihr hier lesen: Rohdatenarchiv [Teil 1]: Was ist das? Rohdatenarchiv [Teil 2]: Was kann ich damit machen? Rohdatenarchiv [Teil 3]: Und was ist […]