CiAgICA8IS0tIExpbmtlZEluIC0tPgogICAgPHNjcmlwdCB0eXBlPSJ0ZXh0L2phdmFzY3JpcHQiPgogICAgICAgIF9saW5rZWRpbl9wYXJ0bmVyX2lkID0gIjEyMzUwNzMiOwogICAgICAgIHdpbmRvdy5fbGlua2VkaW5fZGF0YV9wYXJ0bmVyX2lkcyA9IHdpbmRvdy5fbGlua2VkaW5fZGF0YV9wYXJ0bmVyX2lkcyB8fCBbXTsKICAgICAgICB3aW5kb3cuX2xpbmtlZGluX2RhdGFfcGFydG5lcl9pZHMucHVzaChfbGlua2VkaW5fcGFydG5lcl9pZCk7CiAgICA8L3NjcmlwdD48c2NyaXB0IHR5cGU9InRleHQvamF2YXNjcmlwdCI+CiAgICAgICAgKGZ1bmN0aW9uKCl7dmFyIHMgPSBkb2N1bWVudC5nZXRFbGVtZW50c0J5VGFnTmFtZSgic2NyaXB0IilbMF07CiAgICAgICAgICAgIHZhciBiID0gZG9jdW1lbnQuY3JlYXRlRWxlbWVudCgic2NyaXB0Iik7CiAgICAgICAgICAgIGIudHlwZSA9ICJ0ZXh0L2phdmFzY3JpcHQiO2IuYXN5bmMgPSB0cnVlOwogICAgICAgICAgICBiLnNyYyA9ICJodHRwczovL3NuYXAubGljZG4uY29tL2xpLmxtcy1hbmFseXRpY3MvaW5zaWdodC5taW4uanMiOwogICAgICAgICAgICBzLnBhcmVudE5vZGUuaW5zZXJ0QmVmb3JlKGIsIHMpO30pKCk7CiAgICA8L3NjcmlwdD4KICAgIDxub3NjcmlwdD4KICAgICAgICA8aW1nIGhlaWdodD0iMSIgd2lkdGg9IjEiIHN0eWxlPSJkaXNwbGF5Om5vbmU7IiBhbHQ9IiIgc3JjPSJodHRwczovL3B4LmFkcy5saW5rZWRpbi5jb20vY29sbGVjdC8/cGlkPTEyMzUwNzMmZm10PWdpZiIgLz4KICAgIDwvbm9zY3JpcHQ+CiAgICA8IS0tIEVuZCBMaW5rZWRJbiAtLT4KICAgIA==
Generic filters
Exact matches only
Search in title
Search in excerpt
Search in content

Analysen: Aufsteiger des Jahres

Nach einer Kennzahl sortierte Rangfolgen werden im Geschäftsalltag häufig eingesetzt. Wir schauen uns heute einmal Möglichkeiten an, solche Ranglisten unter Berücksichtigung zusätzlicher Anforderungen zu erweitern und eingängig zu visualisieren.

Sei es die Forbes-Liste der reichsten Menschen der Welt oder seien es die Umsätze der Konkurrenzfirmen in unserer Branche – Rangfolgen werden häufig eingesetzt, um etwa die Top-10-Personen oder die Top-10-Unternehmen zu einem bestimmten Zeitpunkt oder für einen gegebenen Zeitraum sortiert anzuzeigen.

Was ist zu tun, wenn wir zusätzliche Informationen unterbringen wollen?

Da wir bei unseren vorgestellten Ansätzen möglicherweise auch auf außerhalb der sichtbaren Top 10 und somit tiefer platzierte Elemente zugreifen wollen und weiterhin für dieses Blog keine kostenpflichtigen Daten verwenden möchten, schauen wir hier in unserem Beispiel exemplarisch auf die am häufigsten vergebenen Vornamen der Stadt Wien, bei denen – nach Geschlecht getrennt – für die Jahre 2010 bis 2017 die jeweils 100 häufigsten Vornamen aufgeführt sind (Quelle am Seitenende!).

Für 2017 sehen die Top 10 der Jungen- und der Mädchennamen folgendermaßen aus:

Top 10 der Jungen- und Mädchennamen 2017 in Wien

Top 10 der Jungen- und Mädchennamen 2017 in Wien

Die Vornamen wurden phonetisiert, d. h., dass beispielsweise die Schreibweisen Jakob und Jacob unter Jakob und Sarah und Sara unter Sara geführt werden.

Hier haben wir eine Grafische Tabelle verwendet, die über die beiden Geschlechter mittels Small Multiples iteriert wurde. Die Einstellung zur Verwendung der Top 10 lässt sich im Ranking-Reiter der Tabelle setzen:

Einstellung für Top 10

Einstellung für Top 10

Konzentrieren wir uns einmal auf die Jungen im Zeitverlauf. Mittels Small Multiples über die Jahre 2013 bis 2016 ergeben sich die jeweiligen Top 10 der Jungennamen:

Top 10 Jungennamen von 2013 bis 2016

Top 10 Jungennamen von 2013 bis 2016

Die Jahre 2013 bis 2016 sind hier übrigens nicht fest eingestellt, sondern über in der Periodenansichtsdimension angelegte Zeitanalyseelemente relativ zum ausgewählten aktuellen Jahr angegeben. Zum Beispiel verweist {cp} auf die laufende Periode und {pp2} auf die Vorvorperiode:

Einstellungen der Small Multiples zur Dynamisierung des Zeitraums

Einstellungen der Small Multiples zur Dynamisierung des Zeitraums

Ändert man nun das aktuelle Jahr auf 2017, ist sofort der Zeitraum 2014 bis 2017 sichtbar:

Top 10 Jungennamen von 2014 bis 2017

Top 10 Jungennamen von 2014 bis 2017

Eine Eigenschaft dieser Tabelle wird als störend empfunden: Lukas hat sich etwa im Jahre 2016 noch auf dem vierten Platz – gemeinsam mit Muhammed – befunden. Wo ist er im Jahre 2017 gelandet? Oder was ist mit Benjamin und Felix passiert, die in 2015 ein kurzes Gastspiel geben, aber ansonsten unsichtbar bleiben?

Eine Möglichkeit wäre, eine höhere Anzahl von Top-Elementen zu verwenden. Will man aber wirklich die ersten 22 Elemente sehen, nur um herausfinden zu können, wo Felix im Jahr 2016 abgeblieben ist? Noch dramatischer: Er hätte ja auch auf Platz 57 fallen können.

Wir wollen deshalb nun nur die Namen zeigen, die mindestens einmal in den letzten vier Jahren unter den Top 10 zu finden waren. Theoretisch könnte diese Liste zwar auch bis zu 40 Elemente enthalten, aber praktisch liegt doch eine gewisse Trägheit bei der Namensgebung vor und es gibt von Jahr zu Jahr relativ wenige Neueinsteiger und Abgänge.

Wir ersetzen in der Grafischen Tabelle die Ebenenauswahl durch einen MDX-Ausdruck, der die Vereinigung der Top-10-Listen der letzten vier Jahre berechnet. Mehrfach auftretende Vornamen werden automatisch nur einmal verwendet. <view2> ist ein Platzhalter für das aktuell in der Filterleiste eingestellte Jahr, die TimeUtility-Ausdrücke stehen für die bereits oben erwähnten Elemente {pp3}, {pp2}, {pp1} und {cp}:

Mindestens einmal in den letzten vier Jahren unter den Top 10

Mindestens einmal in den letzten vier Jahren unter den Top 10

Mit dieser Einstellung ergibt sich das folgende Bild, wobei wir die Beschriftung der Anzahlen auf eine senkrechte Ausrichtung geändert haben und in der Filterleiste „männlich“ ausgewählt haben:

Mindestens einmal in den letzten vier Jahren unter den Top 10

Hier sieht man beispielsweise, dass die Verwendung des Vornamens Felix im Jahr 2016 auf 84 Namensgebungen abgesackt ist.

Nicht ersichtlich ist jedoch, welchen Rang Felix in den Jahren 2014, 2016 und 2017 eingenommen hat. Wir definieren deshalb über die MDX-Rank-Funktion den jeweiligen Platz eines Vornamens (im verwendeten Datensatz war der Rang schon berechnet worden und wäre somit bereits verfügbar, aber davon ist im allgemeinen Fall nicht auszugehen!). Zusätzlich färben wir die NUMBER-Zellen ein:

Häufigkeiten der Namen mit Rang

Häufigkeiten der Namen mit Rang

Nun ist ersichtlich, dass sich Felix im Lauf der Jahre auf den Plätzen 14, 9, 22 und wieder 14 befunden hat.

Eine letzte Steigerung wollen wir noch versuchen. Manchmal hat man ein ausgezeichnetes Element, dessen zeitliches Auf und Ab besonders interessiert, z. B. die eigene Firma im Vergleich zur Konkurrenz oder Jeff Bezos zu den anderen Milliardären oder hier in diesem Beispiel bei den Mädchen der Name Hannah:

Betonung des Verlaufs der Platzierungen von Hannah, der Aufsteigerin des Jahres 2017

Betonung des Verlaufs der Platzierungen von Hannah, der Aufsteigerin des Jahres 2017

Wie haben wir diese Darstellung erreicht? Wir haben unter den dargestellten Elementen dasjenige mit dem größten Zuwachs der Anzahl von 2016 bis 2017 berechnet, also die Aufsteigerin des Jahres mit Anwesenheit in den Top Ten. Eine Kennzahl wurde definiert, die auf den negativen Wert der Häufigkeit springt, wenn ein Name in der Tabelle diesem ausgewählten Namen entspricht. Dadurch wird das Feld rot hinterlegt. Über die benutzerdefinierte Formatierung der Kennzahl haben wir das Vorzeichen unterdrückt.

Alle Definitionen passen sich dynamisch an. Stellt man das Geschlecht auf männlich ein, wird der spezielle Verlauf von Jakob, dem Aufsteiger des Jahres 2017 bei den Jungennamen hervorgehoben:

Eingebettete Historie von Aufsteiger Jakob

Eingebettete Historie von Aufsteiger Jakob

Alternativ hätte man dasjenige Element, das hervorgehoben werden soll, übrigens auch über die Filterleiste einstellen und auslesen können.

Sicherlich gehört das geschilderte Vorgehen nicht mehr zum Standard und ist dem fortgeschrittenen Anwender mit MDX-Kenntnissen vorbehalten. Die Farbe Rot bedeutet hier ausnahmsweise nicht „schlecht“, kann aber gefahrlos eingesetzt werden, da die Häufigkeiten auf jeden Fall positiv sind. Es sollte demonstriert werden, dass über das bereits reichhaltige Repertoire der implementierten Rankingmethoden hinaus der Einsatz von MDX genügend Flexibilität bietet, um auch fortgeschrittene Anforderungen zu erfüllen.

Hätte es alternative Darstellungen geben können? Mit der Zeitreihenanalyse etwa hätte man die 15 Verläufe bei den Jungen auch darstellen können.

Darstellung mit Zeitreihen: alle (oben), interaktiv (unten)

Darstellung mit Zeitreihen: alle (oben), interaktiv (unten)

Die Darstellung aller Zeitreihen mit insgesamt 15 Namen ist reichlich unruhig, die interaktive Auswahl eines einzelnen Namens lässt sich ganz gut durchblicken.

Auch mit Bissantz’Numbers ergibt sich eine gut nachvollziehbare Darstellung. Die Schwierigkeit, die Essenz der Ranglisten über die Jahre hinweg zu erfassen, liegt darin begründet, ein ausgewähltes Element von Spalte zu Spalte über verschiedene Zeilen verfolgen zu müssen.

Deshalb nehmen wir einen festen Zeilenaufriss und stellen die Dynamik durch Bissantz’Numbers dar, hier wieder für Mädchennamen:

Entwicklung der beliebtesten Mädchennamen mit Bissantz'Numbers

Entwicklung der beliebtesten Mädchennamen mit Bissantz’Numbers

Die Namen sind nach dem aktuellsten Jahr 2017 sortiert. Die Dynamik eines einzelnen Namens lässt sich leicht verfolgen, da nur waagerecht entlang der Zeile geschaut werden muss. Zusätzlich sind auch die Ränge unaufdringlich als Beigabe ablesbar.

Steht Interaktivität im Vordergrund, bietet sich natürlich auch die platzsparende Darstellung über Sparklines an; in Verbindung mit dem Zoom kann dann bei Bedarf auf die Details zugegriffen werden:

Sparklines für die Entwicklung der Anzahlen (A), Details mit dem Zoom (B)

Sparklines für die Entwicklung der Anzahlen (A), Details mit dem Zoom (B)

Hier müssten aber die Ränge in einer zusätzlichen Spalte genannt werden.

Datenquelle: Stadt Wien – data.wien.gv.at
Daten „Vornamen Wien – Top 100 phonetisiert“ als CSV-Datei und weitere Angaben auf Seite https://www.data.gv.at/katalog/dataset/stadt-wien_vievornamenwien
Wir geben keine Garantie für die Korrektheit der hier dargestellten Daten!