Relevanz: Klappe zu!

Je mehr Ebenen und je mehr Elemente eine Hierarchie aufweist, umso schwerer fällt es, durch reines Betrachten der komplett aufgeklappten Pivottabelle die vorhandenen Besonderheiten zu entdecken. Da kommt ein Assistent, der die uninteressanten Zweige bei Bedarf schließt, wie gerufen.

Nehmen wir einmal an, dass uns in einem Verlagshaus die Kündigungsquoten einer Zeitschrift interessieren. In Relevanz: Den Zufall zu Fall bringen hatten wir bereits einen Ansatz vorgestellt, unterschiedliche Dimensionen nach ihrem Einfluss auf eine Quote zu sortieren. Die jeweiligen Hierarchien waren jedoch flach und jede Dimension wies nur eine relevante Ebene auf.

Die aufgeklappte Tabelle der Kündigungsquoten

Hier konzentrieren wir uns hingegen auf eine einzige Dimensionshierarchie, die dafür aber mehrere Ebenen zu bieten hat. In unserem Beispiel ist dies die Hierarchie der Wohnorte der Kunden. Unser Ziel ist es, einen schnellen Überblick über die Struktur der Kündigungsquoten in den Großstädten zu gewinnen.

Der von uns erdachte Algorithmus geht vom momentanen Zustand aus (im Beispiel die komplett dargestellte Hierarchie) und prüft von rechts nach links, ob die Quoten der Nachfolger eines Knotens zueinander ähnlich sind und somit keine relevante Zusatzinformation liefern. Falls diese Annahme zutrifft, wird der Zweig geschlossen. Ein Knoten auf einer um ein Level höher angesiedelten Ebene wird in der nächsten Iteration nur untersucht, wenn sämtliche seiner Kinder eingeklappt wurden.

Unsere Methode fußt auf solider Statistik und wir bewerten mit Methoden der Modellauswahl, ob wir mit dem Zusammenklappen eines Astes auf der sicheren Seite stehen. Je größer die Anzahlen, desto relevanter werden auch kleine Unterschiede. Dazu bedarf es prinzipiell keiner weiteren Parameter. Nach der ersten internen Iteration sähe die Tabelle folgendermaßen aus:

Tabelle nach der ersten für den Anwender nicht sichtbaren Iteration

Abgesehen von Bayern wurden alle Zweige der Bundesländer zusammengeklappt. In Bayern selbst waren die Unterschiede der Quoten der Städte unter Berücksichtigung der Anzahlen zu groß.

In einer weiteren internen Iteration wird der Bereich Ost zugeklappt und die vereinfachte Tabelle, die dem Anwender letztendlich präsentiert wird, sieht folgendermaßen aus:

Die automatisiert vereinfachte Tabelle, die dem Anwender präsentiert wird.

Wir benutzen bewusst einen Bottom-Up-Ansatz, da es ja sein könnte, dass sich die Quoten in Ost und West sehr ähneln, obwohl die Quoten in den Bundesländern voneinander stark abweichen und ein Top-Down-Ansatz dann bereits bei Deutschland keinen Anlass sähe, nach Ost und West aufzuklappen.

Nehmen wir als zweites Beispiel den Anteil der Frauen an der Leserschaft, dann sähe die maximale Tabelle folgendermaßen aus:

Der Anteil der Frauen an der Leserschaft.

Der Algorithmus fasst diese Quoten zur Quintessenz “Hier gibt es nichts zu sehen!” zusammen:

Fazit: Der Anteil der Frauen hängt nicht von der geographischen Lage ab.

Der Algorithmus stellt sicher, dass in einem zugeklappten Zweig keine Überraschungen lauern können, aber es wäre denkbar, dass der Anwender laxere Vorstellungen des Begriffs Ähnlichkeit besitzt und auch noch größere Abweichungen ignorieren möchte. Durch die Einführung eines Parameters ließe sich auch diese Anforderung einbauen, sodass auch noch bei eigentlich leichteren Abweichungen ein Zweig zusammengeklappt wird und tendenziell kleinere Tabellen generiert werden.

Natürlich kann der Algorithmus auch so eingesetzt werden, dass er von einer beliebigen Ausgangskonstellation gestartet wird, sodass beispielsweise nach dem manuellen Schließen eines Zweiges der Algorithmus erneut ausgeführt werden kann und unter Umständen die Pivottabelle weiter vereinfacht.

Denkbar wäre es auch, den Grad der akzeptierten Unterschiedlichkeit der Quoten anhand der manuell geschlossenen Zweige zu lernen und bereits bei der Fortsetzung des Algorithmus anzuwenden.

Dienstag, 1. Juli 2014

Quoten Relevanz Navigation Hierarchie

Veranstaltungs-Tipp

On-Demand-Webinar 22. April 2024 Webinar: Selfservice mit DeltaMaster und Microsoft Excel

Mit Selfservice-BI lassen sich Managementinformationen ergänzen, z. B. aus Excel- oder Access-Dateien. Wie auf Basis einer Excel-Tabelle eine DeltaMaster-Anwendung entsteht, sehen Sie im Webinar [...]

Anmeldung

Mit Selfservice-BI lassen sich Managementinformationen ergänzen, z. B. aus Excel- oder Access-Dateien. Wie auf Basis einer Excel-Tabelle eine DeltaMaster-Anwendung entsteht, sehen Sie im Webinar.

On-Demand-Webinar 2. Mai 2024 Webinar: DeltaMaster ETL

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

Anmeldung

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

On-Demand-Webinar 7. Mai 2024 Webinar: Berichtserstellung mit DeltaMaster

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Anmeldung

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Über den Autor

Dr. Achim Lewandowski

ist zu Hause in der Grundlagen- und Anwendungsforschung von Bissantz & Company.

Letzte Blogartikel

Forschung Benutzerdefinierte Filter für Zielbericht zuweisen

Benutzerdefinierte Filter helfen im neuen Release von DeltaMaster, Verknüpfungen von Grafischen Tabellen zu Zielberichten flexibler anzulegen [...]

mehr erfahren

Forschung Steuereinnahmen der Länder

Steuereinnahmen der Länder - es war schon immer viel Fantasie im Spiel, wenn es um das Erfinden und Eintreiben von Steuern ging. Wie haben [...]

mehr erfahren

Forschung Studienanfänger und Studierende in Deutschland

Studienanfänger stehen jedes Jahr vor einer wichtigen Entscheidung: Welches der fast 300 Studienfächer entspricht den eigenen Neigungen und [...]

mehr erfahren

Forschung Neue Aggregationstypen in der DeltaApp

Der Aggregationstyp Summation ist bei hierarchischen Modellen im Bereich Business Intelligence vorherrschend: Der Gesamtumsatz ergibt sich beispielsweise [...]

mehr erfahren

Forschung Aufstiegs-BAföG in der DeltaApp

In einer sich schnell verändernden Welt ist lebenslanges Lernen unerlässlich. Mit dem Aufstiegs-BAfög werden bestimmte Fortbildungen unterstützt [...]

mehr erfahren

Bissantz News Wissen auf Abruf: das Bissantz Help Center

Viele Nutzer legen direkt in DeltaMaster und DeltaApp los und verstehen intuitiv, wie Berichte genutzt werden können. Wer lieber mit einer [...]

mehr erfahren

Data Warehousing Float – ein problematischer Datentyp

Dieser Beitrag zeigt, wie es bei relationalen Eingabeanwendungen zu Rundungsfehlern im Zusammenhang mit float kommen kann und wie man dies vermeidet [...]

mehr erfahren

Data Warehousing Reverse Engineering im Bissantz Application Designer

Dieser Beitrag stellt die neue Funktion des „Reverse Engineering“ im Bissantz Application Designer vor. Damit lassen sich bestehende relationale [...]

mehr erfahren

Bissantz News Daten- und Softwaresicherheit bei Bissantz

TISAX-Verlängerung und Penetrationstest-Zertifizierung Informationssicherheit hat bei Bissantz & Company höchste Priorität – deshalb werden [...]

mehr erfahren

Forschung Flächennutzung in Deutschland

Veränderungen verstehen: Wer Abweichungen und Verschiebungen seiner Kennzahlen auf den Grund gehen will, kann in DeltaMaster eine Vielzahl [...]

mehr erfahren

Vorheriger Artikel

Zeitmustererkennung: Trend-Kost

Nächster Artikel

Extremwerte: Klettermax

Name	Borlabs Cookie
Anbieter	Eigentümer dieser Website, Impressum
Zweck	Zur Speicherung der Einstellungen, die Sie in der Cookie-Leiste ausgewählt haben.
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Name	Microsoft Azure CDN
Anbieter	Microsoft Azure
Zweck	Das Cookie dient der Lastverteilung der Anfragen (Load-Balancing) durch Seitennutzer bei der Nutzung des Dienstes.
Datenschutzerklärung	https://www.bissantz.de/datenschutz
Cookie Name	ARRAffinity,ARRAffinitySameSite
Cookie Laufzeit	Sitzung

Name	Polylang
Anbieter	Eigentümer dieser Website
Zweck	Speichert die aktuelle Sprache.
Cookie Name	pll_language
Cookie Laufzeit	1 Jahr

Name	cloud.bissantz.de
Anbieter	Bissantz
Zweck	Dieser Cookie dient der Erfassung der Position des Seitenbesuchers um eine möglichst effeziente und schnelle Zuteilung zu einem nahen Server zu ermöglichen.
Datenschutzerklärung	https://www.bissantz.de/datenschutz
Cookie Name	ASLBSA,ASLBSACORS
Cookie Laufzeit	Sitzung

Name	UserLike (verwendet den Webfont Loader und das Google-API CDN)
Anbieter	https://www.userlike.com/de/
Zweck	Notwendig zur umfassenden Information, z. B. auch für Datenschutzfragen.
Datenschutzerklärung	https://www.userlike.com/de/terms#privacy-policy
Host(s)	userlike.com
Cookie Laufzeit	365 Tage

Akzeptieren	Google Tag Manager
Name	Google Tag Manager
Anbieter	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Zweck	Cookie von Google zur Steuerung der erweiterten Script- und Ereignisbehandlung.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Jahre

Akzeptieren	Facebook Pixel
Name	Facebook Pixel
Anbieter	Meta Platforms Ireland Limited, 4 Grand Canal Square, Dublin 2, Ireland
Zweck	Cookie von Facebook, das für Website-Analysen, Ad-Targeting und Anzeigenmessung verwendet wird.
Datenschutzerklärung	https://www.facebook.com/policies/cookies
Cookie Name	_fbp,act,c_user,datr,fr,m_pixel_ration,pl,presence,sb,spin,wd,xs
Cookie Laufzeit	Sitzung / 1 Jahr

Akzeptieren	Google Optimize
Name	Google Optimize
Anbieter	Google
Zweck	Das Google Website-Optimierungstool ist eine kostenlos verfügbare Software zur Durchführung von A/B- und Multivariatentests im Webdesign.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de

Akzeptieren	Facebook
Name	Facebook
Anbieter	Meta Platforms Ireland Limited, 4 Grand Canal Square, Dublin 2, Ireland
Zweck	Mit der Zustimmung können z. B. unsere Beiträge direkt in Ihrem Facebook-Profil geteilt werden und Sie erlauben Facebook, Informationen über Sie zu verarbeiten, damit Ihnen personalisierter Content angezeigt werden kann.
Datenschutzerklärung	https://www.facebook.com/privacy/explanation
Host(s)	.facebook.com
Cookie Laufzeit	730 Tage

Relevanz: Klappe zu!

Veranstaltungs-Tipp

Über den Autor

Schlagwörter

Letzte Blogartikel

Mehr aus Forschung.