CiAgICA8IS0tIExpbmtlZEluIC0tPgogICAgPHNjcmlwdCB0eXBlPSJ0ZXh0L2phdmFzY3JpcHQiPgogICAgICAgIF9saW5rZWRpbl9wYXJ0bmVyX2lkID0gIjEyMzUwNzMiOwogICAgICAgIHdpbmRvdy5fbGlua2VkaW5fZGF0YV9wYXJ0bmVyX2lkcyA9IHdpbmRvdy5fbGlua2VkaW5fZGF0YV9wYXJ0bmVyX2lkcyB8fCBbXTsKICAgICAgICB3aW5kb3cuX2xpbmtlZGluX2RhdGFfcGFydG5lcl9pZHMucHVzaChfbGlua2VkaW5fcGFydG5lcl9pZCk7CiAgICA8L3NjcmlwdD48c2NyaXB0IHR5cGU9InRleHQvamF2YXNjcmlwdCI+CiAgICAgICAgKGZ1bmN0aW9uKCl7dmFyIHMgPSBkb2N1bWVudC5nZXRFbGVtZW50c0J5VGFnTmFtZSgic2NyaXB0IilbMF07CiAgICAgICAgICAgIHZhciBiID0gZG9jdW1lbnQuY3JlYXRlRWxlbWVudCgic2NyaXB0Iik7CiAgICAgICAgICAgIGIudHlwZSA9ICJ0ZXh0L2phdmFzY3JpcHQiO2IuYXN5bmMgPSB0cnVlOwogICAgICAgICAgICBiLnNyYyA9ICJodHRwczovL3NuYXAubGljZG4uY29tL2xpLmxtcy1hbmFseXRpY3MvaW5zaWdodC5taW4uanMiOwogICAgICAgICAgICBzLnBhcmVudE5vZGUuaW5zZXJ0QmVmb3JlKGIsIHMpO30pKCk7CiAgICA8L3NjcmlwdD4KICAgIDxub3NjcmlwdD4KICAgICAgICA8aW1nIGhlaWdodD0iMSIgd2lkdGg9IjEiIHN0eWxlPSJkaXNwbGF5Om5vbmU7IiBhbHQ9IiIgc3JjPSJodHRwczovL3B4LmFkcy5saW5rZWRpbi5jb20vY29sbGVjdC8/cGlkPTEyMzUwNzMmZm10PWdpZiIgLz4KICAgIDwvbm9zY3JpcHQ+CiAgICA8IS0tIEVuZCBMaW5rZWRJbiAtLT4KICAgIA==
Generic filters
Exact matches only
Search in title
Search in excerpt
Search in content

Relevanz: Serien mit Folgen


Verliert eine Fußballmannschaft zu häufig, drohen unweigerlich Konsequenzen, üblicherweise für den Trainer. Bevor wir den oder die Verantwortlichen voreilig anprangern, klären wir lieber, wie häufig solche Durststrecken eigentlich durch reinen Zufall entstehen.

In unserer vereinfachten Welt kennen wir nur drei Resultate im einem Vergleich mit dem Konkurrenten – wir sind besser, gleich gut oder schlechter. Weiterhin nehmen wir für unsere Analyse hier zusätzlich an, dass eigentlich alle Konkurrenten gleiche Anlagen haben, aber durch äußere Umstände mal der eine, mal der andere gewinnt oder ein Remis erzielt wird. Wir verwenden hier aus Gründen der Anschaulichkeit ein Modell, das an die Bundesliga erinnern soll, aber genauso gut könnte es um den relativen Vergleich der Monatsumsätze zweier Filialen oder der Anzahl der abgeschlossenen Verträge zweier Vertriebler gehen.

In unserem Modell gewinnen oder verlieren wir einen Vergleich jeweils mit einer festen Wahrscheinlichkeit 0≤p≤0.5 und mit der Restwahrscheinlichkeit 1-2p wird ein Unentschieden beobachtet.

Die folgende Grafik zeigt für unterschiedliche Werte von p mögliche Resultate unserer Mannschaft während einer Saison mit 34 direkten Vergleichen:

Mögliche Verläufe einer Saison mit 34 Spieltagen für verschiedene Gewinnwahrscheinlichkeiten p
Mögliche Verläufe einer Saison mit 34 Spieltagen für verschiedene Wahrscheinlichkeiten p

Besonders kritisch sind längere Niederlagenserien: Obwohl wir doch eigentlich in unserem Szenario genauso stark oder schwach sind wie unsere Gegner, können sich vor allem bei höheren Werten von p durch reinen Zufall Niederlagen häufen (aus Symmetriegründen gilt dies auch für Siege, aber diese werden gerne als selbstverständlich angenommen!).

Für die Fälle p=0.4 und p=0.5 sind in diesem Beispiel jeweils sechs Niederlagen in Folge zu beobachten. Für eine gegebene Sequenz der Länge 6, das heißt mit festem Anfang und festem Ende, lässt sich die Wahrscheinlichkeit einer reinen Niederlagenserie einfach berechnen – sie beträgt p^6, also beispielsweise etwa 1.6 Prozent im Falle von p=0.5. Die Wahrscheinlichkeit, dass irgendwann eine Niederlagenserie der Länge 6 beobachtet wird, ist höher, aber die Berechnung gestaltet sich nicht ganz so einfach.

Angenommen, ein Trainer wird entlassen, wenn x Niederlagen in Folge auftreten – wie groß ist dann die Wahrscheinlichkeit, dass die gesamte Saison mit einem einzigen Trainer absolviert wird (der auch noch den letzten Spieltag übersteht)? Da unser Gerechtigkeitssinn stark ausgeprägt ist, soll die Länge x so gewählt werden, dass unser Trainer nur mit einer Wahrscheinlichkeit von maximal 10 Prozent wegen rein zufälliger Negativserien vorzeitig entlassen wird.

Obwohl nicht unmittelbar offensichtlich, hilft uns wieder die Theorie der Markov-Ketten, die wir bereits im letzten Blog-Beitrag über Hidden-Markov-Modelle kennengelernt hatten. Betrachten wir beispielsweise den Fall x=5:

Die Markovkette der verlorenen Spiele in Folge
Die Markov-Kette der verlorenen Spiele in Folge

Ein Zustand dieser Markov-Kette ist durch die Anzahl der zuletzt in Folge verlorenen Spiele gegeben. Angenommen, wir haben einen Spieltag abgeschlossen und haben die letzten y Spiele in Folge verloren. Wenn wir beim nächsten Spieltag wieder verlieren, wandern wir ein Feld nach rechts zum Zustand y+1. Sollten wir die Vorgabe x=5 erreichen, ist unser Gastspiel zu Ende. Sollten wir jedoch gewinnen oder ein Unentschieden erreichen, das passiert mit Wahrscheinlichkeit 1-p, springen wir wieder zurück zum Anfang.

Den Zustand 5 nennt man absorbierend, da es von hier kein Zurück mehr gibt. Die Matrix der Übergangswahrscheinlichkeiten ist durch

Die Matrix der Übergangswahrscheinlichkeiten
Die Matrix der Übergangswahrscheinlichkeiten

gegeben.

Hier sind die bisherigen Zustände in den Spaltenköpfen und die neuen Zustände in den Zeilenköpfen gegeben. Dies hat rechentechnische Vorteile: Hat man einen Vektor, der die Wahrscheinlichkeiten aller Zustände vor dem Sprung angibt, können nach einer einfachen Matrixmultiplikation die Wahrscheinlichkeiten für die Zustände nach dem Sprung angegeben werden. Die Logik hier ist, dass durch die Matrixmultiplikation implizit alle Möglichkeiten berücksichtigt werden, einen Zustand zu erreichen, wobei jeweils für einen Summanden die Wahrscheinlichkeit des Sprunges von einem anderen Zustand und die Wahrscheinlichkeit, sich dort befunden zu haben, multipliziert und am Ende alle Summanden addiert werden.

So kann man sich von Spieltag zu Spieltag hangeln und hat immer eine aktuelle Verteilung der Zustandswahrscheinlichkeiten zur Verfügung. Es fehlt noch die Initialisierung. Dazu nimmt man einfach an, dass es einen Spieltag 0 gibt, nach welchem 0 Niederlagen vorliegen, d.h. der Start erfolgt mit Wahrscheinlichkeit 1 im Zustand 0. Nach dem ersten Spieltag ergibt die Matrixmultiplikation das erwartete Ergebnis. Mit Wahrscheinlichkeit p wurde das Spiel verloren und die Länge der Niederlagenserie beträgt bereits stattliche 1 oder das Spiel wurde mit 1-p nicht verloren und wir verharren weiterhin im Zustand 0:

Die Zustandswahrscheinlichkeiten nach dem 1. Spieltag
Die Berechnung der Zustandswahrscheinlichkeiten nach dem 1. Spieltag

Für unseren betrachteten Fall x=5 ist sicher, dass bis zum 4. Spieltag die Bedingung für eine Entlassung noch nicht erfüllt sein kann. Die Wahrscheinlichkeiten nach dem 4. Spieltag, zuletzt y Spiele in Folge verloren zu haben, können in der folgenden Tabelle abgelesen werden:

Die Zustandswahrscheinlichkeiten nach dem 4. Spieltag
Die Zustandswahrscheinlichkeiten nach dem 4. Spieltag

Beispielsweise ergibt sich der Zustand 2, wenn Spieltag 3 und 4 verloren wurden und Spieltag 2 nicht – das Ergebnis von Spieltag 1 spielt dann keine Rolle. Diese Werte können auch mithilfe der wiederholten Matrixmultiplikation berechnet werden. Mit der nächsten Multiplikation mit der Matrix lässt sich nun die Verteilung des Spieltages 5 ermitteln:

Die Zustandswahrscheinlichkeiten nach dem 5. Spieltag
Die Zustandswahrscheinlichkeiten nach dem 5. Spieltag

Nach dem 5. Spieltag kann der Trainer zum ersten Mal entlassen werden; die Wahrscheinlichkeit beträgt natürlich p^5, da alle Spiele verloren worden sein müssen. Wir arbeiten uns numerisch weiter voran und rechnen exemplarisch mit dem Wert p=0.5. Bei diesem ist die Wahrscheinlichkeit einer Negativserie gegebener Länge am größten. Für gegebenes x kann die Wahrscheinlichkeit, nach 34 Spieltagen den Zustand x beobachten zu müssen (der irgendwann zwischen dem x-ten und dem 34. Spieltag eingetreten ist und nicht mehr verlassen wird), berechnet werden.

In der folgenden Grafik (bitte klicken Sie auf die Grafik für eine vergrößerte Darstellung!) haben wir die Wahrscheinlichkeiten für eine bereits erfolgte Trainerentlassung in Abhängigkeit der absolvierten Spiele für verschiedene Werte von x berechnet (p=0.5):

Wahrscheinlichkeiten für eine Entlassung
Wahrscheinlichkeiten für eine bereits erfolgte Entlassung in Abhängigkeit vom Spieltag und der Länge der Niederlagenserie x

Soll die Möglichkeit einer zufälligen Trainerentlassung mit einer maximalen Wahrscheinlichkeit von 10 Prozent erlaubt sein, müssen 8 Niederlagen in Folge abgewartet werden. Die Wahrscheinlichkeit, dass eine solche Serie irgendwann im Laufe der Saison durch Zufall entsteht, beträgt 5.4 Prozent. Bei 7 Niederlagen in Folge wird die Vorgabe mit 11.0 Prozent knapp verfehlt.

Nehmen wir eine kleinere Wahrscheinlichkeit p=0.2 für Sieg bzw. Niederlage, sodass mit der recht hohen Wahrscheinlichkeit von 0.6 auch Unentschieden auftreten, darf sich der Trainer hingegen nur 3 Niederlagen in Folge erlauben.

Wir können das Modell beliebig erweitern: Betrachten wir etwa die Möglichkeit, dass die untersuchte Fußballmannschaft höhere Ansprüche hat und für sich eine Wahrscheinlichkeit von 60 Prozent sieht, ein Spiel zu gewinnen. Angenommen, der Trainer wird seines Amtes enthoben, wenn er eine Folge von x Spielen nicht gewinnt. Hier ist also p=0.4 (gemeinsam für Unentschieden und Niederlage) und nur mit einen Sieg, der mit 1-p=0.6 auftritt, stellt er das Umfeld zufrieden und kehrt in den Zustand 0 zurück. Mit einer ähnlichen Berechnung wie oben erhalten wir das Ergebnis, dass bei 6 nicht gewonnenen Spielen eingeschritten wird.