Relevanz: Fair sehen

Sehr häufig trifft der Anwender auf Dimensionsebenen, bei denen die Annahme plausibel ist, dass alle Elemente der Ebene in der Faktentabelle ungefähr gleich häufig auftreten sollten. Jedoch ist nicht zwingend davon auszugehen, exakt gleiche Häufigkeiten anzutreffen. Wann sind Abweichungen von der Erwartung so groß, dass sie ernst genommen werden müssen?

Wird ein fairer Würfel 600-mal geworfen, so beträgt die erwartete Anzahl jeder der sechs Augenzahlen 100. Das bedeutet aber nicht, dass nun zwingend genau diese Konstellation gleicher Häufigkeiten eintritt; der Fall, dass jede Augenzahl exakt 100-mal vorkommt, ist mit einer Wahrscheinlichkeit von ungefähr 0.000000246 eher sehr selten. Die folgende Tabelle zeigt die erhaltenen Augenzahlen, falls dieses Experiment mit einem fairen Würfel 20-mal wiederholt wird. Von 75 Fünfen bis 122 Dreien werden durchaus beachtliche Abweichungen beobachtet (für eine vergrößerte Darstellung bitte auf die Grafik klicken!).

Natürliche Schwankungen der Anzahlen bei einem fairen Würfel

Ist nun ein Ergebnis mit den Häufigkeiten 81-84-117-92-105-121 besonders auffällig oder nicht? Was passiert, wenn ich ein solches Ergebnis mit dem Resultat 208-167-164-158-163-140 vergleichen möchte, das entstanden ist, als ein anderer Würfel 1000-mal geworfen wurde? Wie sieht es mit der Verteilung aller jemals gezogenen Lottozahlen (also 49 Häufigkeiten bis zum Stichtag 18.1.2014) oder der später eingeführten Superzahl (eine einstellige zusätzlich gezogene Ziffer) aus? Um die Brücke zu betriebswirtschaftlich relevanten Zahlen zu schlagen, folgen mögliche Beispiele aus der Praxis:

Die Bestellhäufigkeiten der drei Farbvarianten Silber, Weiß und Rot eines Automobils betrugen bisher 117-84-312. Diese Ungleichverteilung geht gefühlt über Zufälligkeit hinaus, aber wie weit?
Ein Produkt wurde im letzten Monat in vier Filialen, die im letzten Jahr vergleichbare Umsätze erzielt hatten, mit den folgenden Häufigkeiten verkauft: 245-315-180-200. Hinreichender Grund, die Filialleiter der Märkte anzusprechen?
Das neue Tablet wurde am ersten Tag von 1571 Männern und 983 Frauen gekauft. Hat der Begriff Fanboy doch seine Berechtigung?

Hier sind auch Beispiele vertreten, bei denen wir ahnen, dass die Dimensionselemente nicht gleichwahrscheinlich sind. Um aber den Grad der Ungleichverteilung messen zu können, übernehmen wir die Rolle des Advocatus Diaboli, der von der Hypothese der Gleichheit ausgeht, um dann umso wirkungsvoller etwaige Abweichungen messen und verkünden zu können.

Wir hatten bereits in Den Zufall zu Fall bringen Dimensionen nach ihrem Einfluss auf Erfolgsquoten bewertet und sortiert. Ein ähnlicher Ansatz führt zu einem Score, der Abweichungen von der Hypothese, dass alle Dimensionselemente gleichwahrscheinlich sind, beziffert und für eine Sortierung nach Relevanz verwendet werden kann. Die Herausforderung bestand darin, Fälle mit unterschiedlichen Stichprobengrößen und unterschiedlicher Anzahl von Dimensionselementen vergleichbar zu machen. Wie im zitierten Blogartikel kommt es auch hier zu Schwierigkeiten, große Abweichungen verlässlich zu bewerten. Unser Score löst die auftretenden Probleme und bewertet die Szenarios folgendermaßen:

Die Scores der Szenarios

Scores mit einem Wert<1 sind unauffällig, ab einem Wert von 2 sind die Auffälligkeiten schon größer. Wir sehen zum Glück, dass gegen die Annahme gleichwahrscheinlicher Lotto- bzw. Superzahlen nichts einzuwenden ist. Die Würfel sind leicht verdächtig, und schließlich können bei den betriebswirtschaftlichen Szenarios markante Auffälligkeiten gefunden werden. An der Spitze stehen die Farbvarianten des Automobils und die Tabletverkäufe nach Geschlecht. Diese beiden Fälle stellten auch die Herausforderung dar, da bei ihnen der Score auf normalem Wege wegen beschränkter Rechengenauigkeit vorliegender Algorithmen nicht wie gewünscht ermittelt werden konnte und verlässliche Approximationen hergeleitet werden mussten.

Bei den Fällen, bei denen ein hoher Score darauf hinweist, dass eher nicht davon auszugehen ist, dass eine gleichmäßige Verteilung der Häufigkeiten auf die Dimensionselemente vorliegt, ändert sich unter Umständen das Verständnis, was wohl unter “normal” zu verstehen ist. Der Automobilhersteller kann beispielsweise seine Erwartungen an die Beliebtheit der Farben anpassen, indem er von nun an Plananteile verwendet, die den bisher beobachteten Anteilen entsprechen.

Samstag, 1. März 2014

Relevanz Sortierung Navigation Fair

Veranstaltungs-Tipp

On-Demand-Webinar 22. April 2024 Webinar: Selfservice mit DeltaMaster und Microsoft Excel

Mit Selfservice-BI lassen sich Managementinformationen ergänzen, z. B. aus Excel- oder Access-Dateien. Wie auf Basis einer Excel-Tabelle eine DeltaMaster-Anwendung entsteht, sehen Sie im Webinar [...]

Anmeldung

Mit Selfservice-BI lassen sich Managementinformationen ergänzen, z. B. aus Excel- oder Access-Dateien. Wie auf Basis einer Excel-Tabelle eine DeltaMaster-Anwendung entsteht, sehen Sie im Webinar.

On-Demand-Webinar 2. Mai 2024 Webinar: DeltaMaster ETL

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

Anmeldung

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

On-Demand-Webinar 7. Mai 2024 Webinar: Berichtserstellung mit DeltaMaster

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Anmeldung

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Über den Autor

Dr. Achim Lewandowski

ist zu Hause in der Grundlagen- und Anwendungsforschung von Bissantz & Company.

Letzte Blogartikel

Forschung Benutzerdefinierte Filter für Zielbericht zuweisen

Benutzerdefinierte Filter helfen im neuen Release von DeltaMaster, Verknüpfungen von Grafischen Tabellen zu Zielberichten flexibler anzulegen [...]

mehr erfahren

Forschung Steuereinnahmen der Länder

Steuereinnahmen der Länder - es war schon immer viel Fantasie im Spiel, wenn es um das Erfinden und Eintreiben von Steuern ging. Wie haben [...]

mehr erfahren

Forschung Studienanfänger und Studierende in Deutschland

Studienanfänger stehen jedes Jahr vor einer wichtigen Entscheidung: Welches der fast 300 Studienfächer entspricht den eigenen Neigungen und [...]

mehr erfahren

Forschung Neue Aggregationstypen in der DeltaApp

Der Aggregationstyp Summation ist bei hierarchischen Modellen im Bereich Business Intelligence vorherrschend: Der Gesamtumsatz ergibt sich beispielsweise [...]

mehr erfahren

Forschung Aufstiegs-BAföG in der DeltaApp

In einer sich schnell verändernden Welt ist lebenslanges Lernen unerlässlich. Mit dem Aufstiegs-BAfög werden bestimmte Fortbildungen unterstützt [...]

mehr erfahren

Bissantz News Wissen auf Abruf: das Bissantz Help Center

Viele Nutzer legen direkt in DeltaMaster und DeltaApp los und verstehen intuitiv, wie Berichte genutzt werden können. Wer lieber mit einer [...]

mehr erfahren

Data Warehousing Float – ein problematischer Datentyp

Dieser Beitrag zeigt, wie es bei relationalen Eingabeanwendungen zu Rundungsfehlern im Zusammenhang mit float kommen kann und wie man dies vermeidet [...]

mehr erfahren

Data Warehousing Reverse Engineering im Bissantz Application Designer

Dieser Beitrag stellt die neue Funktion des „Reverse Engineering“ im Bissantz Application Designer vor. Damit lassen sich bestehende relationale [...]

mehr erfahren

Bissantz News Daten- und Softwaresicherheit bei Bissantz

TISAX-Verlängerung und Penetrationstest-Zertifizierung Informationssicherheit hat bei Bissantz & Company höchste Priorität – deshalb werden [...]

mehr erfahren

Forschung Flächennutzung in Deutschland

Veränderungen verstehen: Wer Abweichungen und Verschiebungen seiner Kennzahlen auf den Grund gehen will, kann in DeltaMaster eine Vielzahl [...]

mehr erfahren

Vorheriger Artikel

Extremwerte: Rekordjagd

Nächster Artikel

Strategie: Sekretär oder Selters!

Name	Borlabs Cookie
Anbieter	Eigentümer dieser Website, Impressum
Zweck	Zur Speicherung der Einstellungen, die Sie in der Cookie-Leiste ausgewählt haben.
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Name	Microsoft Azure CDN
Anbieter	Microsoft Azure
Zweck	Das Cookie dient der Lastverteilung der Anfragen (Load-Balancing) durch Seitennutzer bei der Nutzung des Dienstes.
Datenschutzerklärung	https://www.bissantz.de/datenschutz
Cookie Name	ARRAffinity,ARRAffinitySameSite
Cookie Laufzeit	Sitzung

Name	Polylang
Anbieter	Eigentümer dieser Website
Zweck	Speichert die aktuelle Sprache.
Cookie Name	pll_language
Cookie Laufzeit	1 Jahr

Name	cloud.bissantz.de
Anbieter	Bissantz
Zweck	Dieser Cookie dient der Erfassung der Position des Seitenbesuchers um eine möglichst effeziente und schnelle Zuteilung zu einem nahen Server zu ermöglichen.
Datenschutzerklärung	https://www.bissantz.de/datenschutz
Cookie Name	ASLBSA,ASLBSACORS
Cookie Laufzeit	Sitzung

Name	UserLike (verwendet den Webfont Loader und das Google-API CDN)
Anbieter	https://www.userlike.com/de/
Zweck	Notwendig zur umfassenden Information, z. B. auch für Datenschutzfragen.
Datenschutzerklärung	https://www.userlike.com/de/terms#privacy-policy
Host(s)	userlike.com
Cookie Laufzeit	365 Tage

Akzeptieren	Google Tag Manager
Name	Google Tag Manager
Anbieter	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Zweck	Cookie von Google zur Steuerung der erweiterten Script- und Ereignisbehandlung.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Jahre

Akzeptieren	Facebook Pixel
Name	Facebook Pixel
Anbieter	Meta Platforms Ireland Limited, 4 Grand Canal Square, Dublin 2, Ireland
Zweck	Cookie von Facebook, das für Website-Analysen, Ad-Targeting und Anzeigenmessung verwendet wird.
Datenschutzerklärung	https://www.facebook.com/policies/cookies
Cookie Name	_fbp,act,c_user,datr,fr,m_pixel_ration,pl,presence,sb,spin,wd,xs
Cookie Laufzeit	Sitzung / 1 Jahr

Akzeptieren	Google Optimize
Name	Google Optimize
Anbieter	Google
Zweck	Das Google Website-Optimierungstool ist eine kostenlos verfügbare Software zur Durchführung von A/B- und Multivariatentests im Webdesign.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de

Akzeptieren	Facebook
Name	Facebook
Anbieter	Meta Platforms Ireland Limited, 4 Grand Canal Square, Dublin 2, Ireland
Zweck	Mit der Zustimmung können z. B. unsere Beiträge direkt in Ihrem Facebook-Profil geteilt werden und Sie erlauben Facebook, Informationen über Sie zu verarbeiten, damit Ihnen personalisierter Content angezeigt werden kann.
Datenschutzerklärung	https://www.facebook.com/privacy/explanation
Host(s)	.facebook.com
Cookie Laufzeit	730 Tage

Relevanz: Fair sehen

Veranstaltungs-Tipp

Über den Autor

Schlagwörter

Letzte Blogartikel

Mehr aus Forschung.