Rangfolgen: Bestens sortiert


Mit PowerSearch stellt DeltaMaster ein mächtiges Analyseverfahren bereit, um einen Cube – auch über mehrere Dimensionen hinweg und sogar für Kombinationen der Elemente verschiedener Dimensionen – nach besonders hohen Anteilen einer gegebenen Kennzahl zu durchforsten. Wir stellen heute Ideen vor, um auf etwaige Redundanzen hinweisen zu können.

Setzen wir bei unserer auf fiktiven Daten beruhenden Demo-Anwendung Chair das Analyseverfahren PowerSearch ein, könnten die TOP10 des Umsatzes folgendermaßen aussehen:

TOP10 des UmsatzesTOP10 des Umsatzes

Schauen wir zum Beispiel auf die Plätze 2 bis 5, ist offensichtlich, dass es sich hier um Elemente verschiedener Ebenen der Kundenhierarchie handelt und die gefundenen Anteile hauptsächlich auf dem Kunden „Bundesagentur für Arbeit“ beruhen. Da dies der einzige Kunde mit PLZ 90 ist, sind die Werte für Platz 4 und 5 auch identisch.

KundenhierarchieKundenhierarchie

PowerSearch berechnet Rangfolgen über mehrere Dimensionen, auf Wunsch sogar über alle parallelen Hierarchien und sämtliche Ebenen, und sortiert diese in einer gemeinsamen Liste. Wenn nun aber bestimmte Elemente verschiedener Dimensionen immer oder sehr häufig gemeinsam auftreten, wird bei auffälligen Anteilen jede der beteiligten Dimensionen erwähnt. Diese Redundanzen sind in der Darstellung aber nicht unmittelbar erkennbar.

Wir sollten uns beispielsweise fragen, ob die Umsätze von „Produkt: EF Besucherst. MP“ auf Platz 9 und der „Vertretergruppe: Hohlmaier“ auf Platz 10 eher auf den gleichen Buchungen basieren, teilweise Überlappungen vorliegen oder ob sich diese Umsätze vielleicht sogar ausschließen. Alle drei Fälle wären möglich, da die Summe der beiden Anteile unter 100 % liegt.

Für zwei Objekte mit einer Summe der Anteile über 100 % gilt, dass der gemeinsame Anteil mindestens so groß ist wie die Differenz der Summe zu 100 % und höchstens so groß wie der kleinere Wert. Es folgt beispielsweise, dass Sondermodelle in der Region Süd mindestens 80.2 % + 74.7 % – 100 % = 54.9 % des Gesamtumsatzes erzeugen und höchstens 74.7 %. Der tatsächliche Wert liegt übrigens bei 68.0 %.

Stellen wir uns nun in einer interaktiven Anwendung vor, dass durch Anklicken einer bestimmten Position für die anderen Elemente angezeigt wird, wie viel Umsatz auf das ausgewählte Element zurückgeht. Optional können diese Werte in einer zusätzlichen Spalte eingeblendet werden. Die folgende Darstellung nimmt an, dass „Produkthauptgruppe: Sondermodelle“ angeklickt wurde:

TOP10 des Umsatzes mit Auswahl Produkthauptgruppe: SondermodelleTOP10 des Umsatzes mit Auswahl „Produkthauptgruppe: Sondermodelle“

Hier folgt unmittelbar, dass die Plätze 6 – 9 vollständig und die Plätze 2 – 5 zu einem hohen Anteil auf den Umsätzen mit Sondermodellen basieren. Für die Plätze 7 und 9 ist diese Erkenntnis nicht überraschend, da sich die zugehörigen Elemente in der Produkthierarchie unterhalb des ausgewählten Elementes befinden. Die Vertretergruppen Baumann auf Platz 8 und Hohlmaier auf Platz 10 verhalten sich recht unterschiedlich.

Werfen wir zur weiteren Analyse einen Blick auf die folgende Kreuztabelle:

Vertretergruppe gegen ProdukthauptgruppeVertretergruppe gegen Produkthauptgruppe

Während sich die Vertretergruppe Baumann auf Sondermodelle beschränkt, bedient Hohlmaier alle Produkthauptgruppen.

Wählen wir Hohlmaier aus, wird ersichtlich, dass seine Umsätze nur zum Teil in den vorherigen Positionen zu finden sind. Der Anteil im konkurrierenden Element Baumann ist natürlich 0.

TOP10 des Umsatzes mit Auswahl Vertretergruppe: HohlmaierTOP10 des Umsatzes mit Auswahl „Vertretergruppe: Hohlmaier“

Schließlich betrachten wir die Bundesagentur für Arbeit. Es wird wieder deutlich, dass der Umsatz der Bundesagentur für Arbeit zum größten Teil oder sogar gänzlich die Werte der Plätze 1 bis 9 bestimmt.

TOP10 des Umsatzes mit Auswahl TOP10 des Umsatzes mit Auswahl „Kunde: Bundesagentur für Arbeit“

Hier hatten wir es mit dem Umsatz mit einer additiven Kennzahl zu tun. Es ist möglich, über diese Kennzahl eine Ähnlichkeit zwischen zwei Objekten zu definieren, die den Grad der Überlappung misst. Schwieriger wird es bei Quoten. Hier sollten wohl Zähler und Nenner explizit vorliegen, um über diese Größen die Ähnlichkeit zweier Objekte berechnen zu können. Die intensivere Beschäftigung mit dem besten Vorgehen für diesen Fall behalten wir uns für einen späteren Blogbeitrag vor.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.