Schon wieder ist mehr als ein Jahr vergangen, in dem dieses Blog mehr oder weniger komplett brach lag. Und in der Zwischenzeit ist so viel passiert!
Im Rahmen meines Jobs beim Institut für Verkehrsforschung am Deutschen Zentrum für Luft- und Raumfahrt (DLR) in Berlin habe ich nicht nur an der theoretischen und praktischen (Weiter-)Entwicklung von großmaßstäblichen Verkehrsnachfragemodellen gearbeitet, sondern habe daneben natürlich auch die daraus und auch aus anderen Projekten resultierenden Erkenntnisse (mit-)publiziert. Bei dieser Forschung habe ich hauptächlich mit R, Shiny, PostgreSQL/PostGIS, QGIS und vereinzelt ein paar Zeilen Python gearbeitet. Und ich liebe sie alle, wann immer ich mit ihnen arbeiten darf. Aber ich fand es zunehmend schwierig und anstrengend, Daten einfach, schnell, und trotzdem optisch ansprechend zu visualisieren. Natürlich lassen sich mit R und ggplot
druckreife Plots erstellen, und Shiny und Leaflet erlauben die Generierung von interaktiven Grafiken und Karten. Aber manchmal ist es einfach nicht zielführend, sich mit den Feinheiten der jeweiligen Einstellungen und dem Schreiben des notwendigen Codes zu beschäftigen. Ich empfand es insbesondere in der höchst spannenden Phase der explorativen Datenanalyse (quasi dem ersten Date mit neuen Daten im Rahmen des Analyseprozesses…) als sehr störend, dass ich mich so viel mit Code und anderen technischen Aspekten beschäftigen musste, was mich von der eigentlichen Arbeit mit den Daten abgelenkt hat, nämlich dem Verstehen der Daten. Um nochmals die Dating-Analogie zu bemühen wäre das so, als würde man sich mehr damit beschäftigen, was man zum Essen bestellt oder worüber der nächste Small-Talk gehen soll, als sich mit dem (Gesprächs-)Partner zu beschäftigen und sich nur auf ihn/sie zu fokussieren. Wahrlich kein Erfolgsrezept…
Natürlich schaut man dann mal links und rechts vom bekannten Weg, und so habe ich auch einige alternative Werkzeuge gefunden, die sich genau mit dem Thema Datenvisualisierung beschäftigen. Diese sind jedoch meist ähnlich umständlich zu bedienen und benötigen in der Regel ebenfalls ein nicht unbeträchtliches Maß an Programmierung. Aber dann gab es da diese eine Firma, die ich schon seit geraumer Zeit auf meinem Radar – und auch auf meiner Liste von zu lesenden Blogs – hatte, die versprach, alles anders zu machen: Tableau. Um es kurz zu machen, nachdem ich herausgefunden hatte, dass Tableau auch ein Büro in Deutschland hat, habe ich mich Ende 2015 dort beworben und arbeite jetzt seit einiger Zeit als Sales Consultant aus unserem Frankfurter Büro. (Um genau zu sein, war gestern mein 6-monatiges Jubiläum!)
Dieser Schritt ging einher mit einer Menge Grübeln meinerseits und kritischer Fragen meiner Freunde, Familienmitglieder, Arbeits- und Fachkollegen. Im Wesentlichen gab es zwei Themen: a) Möchtest du jetzt wirklich deine akademische Karriere beenden, nachdem du so viel Zeit und Geld in deinen Doktortitel und dein wissenschafttliches Standing investiert hast? Und b) Warst du nicht immer ein großer Verfechter von Open Source Software? Wie kannst du dann jetzt für einen kommerziellen Softwarehersteller arbeiten? Beides sind absolut valide Einwände, und beschreiben im Wesentlichen auch die Gedanken, die mir über und über durch den Kopf gegangen sind. Das Großartige an Tableau ist aber, dass die Firma ursprünglich von von drei Akademikern gegründet wurde (und auch bis heute größtenteil von ihnen geführt wird), dass sie ein Produkt vertreibt, das ursprünglich aus ihrer Forschung enstanden ist, und dass bis heute eine Menge auf ihrem Gebiet führende Experten und Wissenschaftler dort arbeiten und dafür sorgen, dass die Produkte immer auf dem aktuellsten Stand der Forschung sind. Die schiere Menge exzellent ausgebildeter und wirklich cleverer Köpfe und Menschen mit Doktortitel ist sowohl beeindruckend als auch dafür verantwortlich, dass ich mich hier sehr wohl fühle. Was den zweiten Punkt angeht – ja, das ist durchaus korrekt: Tableau kostet Geld. Obwohl es im Portfolio sogar komplett kostenlose Produkte gibt, solange nur die Ergebnisse, die damit gewonnen werden, mit der Öffentlichkeit geteilt werden. Zudem ist Tableau sehr aktiv in der Förderung und Unterstützung von Schülern, Studenten, Lehrpersonal und Forschern im Rahmen des Academic Programs. Und auch was die kommerziellen Produkte angeht, investiert Tableau rund ein Drittel aller Einnahmen in die Forschung und Weiterentwicklung (R&D) – ein solcher Wert ist in der Softwareindustrie einmalig.
Nun gibt es ein paar Dinge, die dieser Artikel sein soll, und einige die er nicht sein soll. Ich möchte mich beispielsweise hier nicht für meine Entscheidung rechtfertigen (auch wenn der letzte Absatz schon sehr danach klingt…). Genauso wenig soll dieser Artikel oder gar das gesamte Blog eine Marketingplattform für Tableau sein oder werden. (Ich werde übrigens auch nicht für das Schreiben dieses meines privaten Blogs bezahlt.) Was ich dagegen tun will ist, meine Entdeckungen aus und Gedanken zu der Arbeit mit Daten festzuhalten und zu teilen. Für Tableau zu arbeiten bedeutet glücklicherweise nicht, komplett losgelöst von der Welt der Data Science, der Visualisierung oder Analyse zu sein. Ganz im Gegenteil: Tableau fügt sich hervorragend in bestehende ebenso wie neue Datenanalyse-Workflows ein. Es ist keine eierlegende Wollmilchsau für alles, was mit Daten zu tun hat, sondern spielt vielmehr hervorragend im Ensemble mit anderen Werkzeugen und Plattformen. Ich persönlich war vollends überzeugt, als ich von den geographischen Funktionalitäten und der R Integration in Tableau erfahren habe. Und so öffne ich, gleichwohl ich nun für Tableau arbeite, noch sehr gerne und oft R Studio, QGIS, pgAdmin und all’ meine anderen Lieblingswerkzeuge für Data Science. Das Ziel soll also sein, in der Zukunft viele Inhalte über Datenanalyse und Visualisierung im Allgemeinen hier zu veröffentlichen! (Naja, das hatte ich ja schon mehrfach versprochen… *räusper*)
Um diesen Neustart des Blogs auch visuell zu würdigen, habe ich ihm zudem auch gleich ein neues, saubereres, responsives und auch auf Mobilgeräten schneller ladendes Design verpasst. Da ich jetzt wieder (morgen seit genau zwei Jahren!) in Deutschland lebe und arbeite, habe ich mich darüber hinaus auch dafür entschieden, teilweise sowohl auf English als auch auf Deutsch zu schreiben. Ich werde voraussichtlich nicht alle zukünftigen Inhalte in beiden Sprachen veröffentlichen und ich werde ganz sicher nicht die bereits bestehenden Artikel übersetzen. Aber der ein oder andere deutsche Artikel sollte in der Zukunft dabei sein.
Es fühlt sich gut an, wieder zurück zu sein – ich hoffe, ich werde die Zeit finden, über all’ die Dinge zu schreiben, die ich gerne mitteilen möchte.