Elo Rangliste BSG-Vattenfall/Gasag



zurück zu Gliese-Berlin.de

Die folgenden Erläuterungen wurden mit freundlicher Genehmigung von Peter Ibach (SC-Buschkrug) für die BSG Vattenfall/Gasag angepasst.
Problem
Viele Vattenfall/Gasag Squashspieler waren der Meinung, dass eine Rangliste nützlich wäre, um einen internen Leistungsvergleich zu haben.
Lösung
Die bereits in der SC-Buschkrug-Rangliste durchgeführte Anpassung der vom Schach bekannten Bewertung durch die Elo-Zahl, bot sich auch für unsere (nur etwas kleinere) Spielgemeinschaft an.
Im Schach-Bereich macht dieses ausgereifte System schon seit Jahrzehnten Spieler weltweit vergleichbar. In vielen anderen Sportarten wurde diese Bewertungsmethode bereits erfolgreich adaptiert. Computerunterstützung macht das mathematisch etwas kompliziertere System auch in der Praxis leicht handhabbar. Die auf Prof. Arpad Elo zurückgehende Stärkekennziffer verschiebt bei völlig freien Spielerpaarungen Punkte vom Verlierer zum Gewinner entsprechend der Differenz zum erwarteten Ergebnis. Der Erwartungswert wird aus der bisherigen Elo-Zahl der Spieler ermittelt. Daraus kann die neue Elo-Zahl und das neue Ranking direkt nach jedem Spiel z.B. in einer Excel-Tabelle neu berechnet werden. Um mitzumachen muss also kein Spieler unbedingt wissen wie die Formel lautet. Wer sich aber doch genauer dafür interessiert findet hier die verwendeten Formeln.
Berechnung der neuen Elo
Eloneu = Eloalt + D * (Ergebnisgespielt - Ergebniserwartet)
Ergebniserwartet (falls Elodifferenz negativ) = 0,5 hoch (-EloDifferenz / K+1)
Ergebniserwartet (falls Elodifferenz positiv) = 1-(0,5 hoch Elodifferenz / K+1)
Elodifferenz = Eloselbst - Elogegner
Ergebnisgespielt = 1 bei gewonnen; = 0 bei verloren
Klassendifferenz (K) = 200
Dynamik (D) = 50
Die Formeln basieren auf folgender Annahme: Wenn A gegen B 25% gewinnt und B gegen C 25% gewinnt, dann sollte A gegen C etwa 6,25% gewinnen (25%*25%). A, B und C unterscheiden sich jeweils um eine Klasse. Dies scheint beim Schach zu stimmen. Für Squash macht es zumindest den Eindruck als könnte es ungefähr ähnlich sein.
Wer sich noch tiefgreifender informieren möchte, dem empfehle ich die Erläuterungen der Buschkrug-Elo oder einen Besuch der lehrreichen und unterhaltsamen " Was Sie schon immer über Elo wissen wollten" FAQ-Liste. des FV-Schach e.V.

Wie funktioniert die Bewag/Gasag-Elo?

Einfordern in die Rangliste
Das Einfordern wird vorerst nicht nötig sein, da bereits alle aktiven Vereinsmitglieder in der Rangliste aufgeführt sind. Sollte ein Spieler hinzukommen, gilt das
initiale Einfordern
Ist der Fordernde siegreich, kommt er mit den gleichen Elo-Punkten wie sein besiegter Gegner in die Rangliste. Der Fordernde kann beliebig Einforderungsversuche mit verschiedenen Gegnern probieren, bis er erfolgreich ist. Die Punkte der Geforderten werden beim Einforderungsspiel in keinem Fall beeinflusst.
Reguläre Forderungsspiele
Ansonsten lebt die Rangliste von möglichst vielen freien Forderungsspielen. Es gibt keine Beschränkung der Forderungsmöglichkeiten. Stattdessen darf der Geforderte die Forderung ein Mal ablehnen und kann einen "Getränkeeinsatz" verlangen. (Dies ist die Buschkrug-Regelung, ich denke, bei uns sollte ein Getränkeeinsatz nur in beiderseitigem Einvernehmen ausgemacht werden! rg) Der Verlierer muss, entsprechend der Differenz zur Erwartung, Punkte an den Gewinner abgeben (siehe Formeln). Forderungsspiele können beliebig oft wiederholt werden. Unsere Empfehlung: Beim Training Forderungsspiel vorher vereinbaren und sonst offizielle Begegnungen immer als Forderungsspiel werten.
Eintragen der Forderungsspiele
Schreibt einfach die Ergebnisse mit Gewinner und Verlierer beim Training in die ausliegende Liste oder teilt Spielergebnisse per E-Mail an SPAM.Rainer@Gliese-Berlin.de mit [Achtung den Part:SPAM. vor dem Absenden löschen. Ich will nicht mit Spammails genervet werden, weil hier die Suchroboter meine Mailadresse ausspionieren]
Begegnungen offizieller Turniere werde ich ab sofort für die Rangliste werten, wenn dort beide Spielgegner vorhanden sind.
Was sagt die Elo-Rangliste aus?
Wer eine höhere Elo-Punktezahl hat sollte auch der stärkere Spieler sein. Aber um wie viel stärker? Die Elo ist wie beim Schach so normiert, dass eine Differenz von 200 jeweils einen "Klassenunterschied" bedeutet. Mathematisch heißt das, die Siegerwartung liegt bei 25% für den schlechteren Spieler. Er sollte also 1 von 4 Begegnungen für sich entscheiden. Jede weiteren 200 Punkte multiplizieren diese Wahrscheinlichkeit. Bei einer Differenz von 400 Elo liegt die Gewinnquote demnach bei 25%*25%=6,25%. Eine Differenz von 1000 Elo besagt also, dass der schwächere Spieler theoretisch nur eines in 1024 Matches bzw. 0,25 hoch 5=0,098% gewinnen würde. Die Elo-Zahl ist also nicht irgendeine Zahl, sondern hat eine genau definierte Wahrscheinlichkeits-Aussage.

Elo(circa) Spielklasse (Herren) Spielklasse(Damen)
400 kann kaum Schläger halten Anfängerin
800 Anfänger im Verein Oberliga
1000 Landesliga Oberliga
1200 Verbandsliga Regionalliga
1400 Oberliga Regionalliga
1600 Regionalliga Bundesliga
1800 2.Bundesliga Bundesliga
2000 1.Bundesliga Weltelite
2500 Weltelite -/-

Für welche Sportarten ist die Elo-Zahl geeignet?

Im Prinzip für alle. Doch die hier verwendete geometrische Wahrscheinlichkeitsverteilung passt nur für Sportarten mit vernachlässigbar geringem "Zufallsgrad". Janghir Kahn war fast eine ganze Generation lang ungeschlagen Weltmeister, Hansi Wiens dominierte jahrelang die deutsche Squashszene.
Ähnlich statisch ist sonst nur Schach und Go. Für eine Fußball-Rangliste, generell wohl bei Mannschaftssportarten, müsste eine andere Verteilung eingesetzt werden. Auch für Skat, Poker oder Backgammon würde man eine deutliche Zufallskomponente erwarten, mit der auch viel schwächere Spieler immer noch eine gewisse Gewinnchance haben.
Je geringer der Zufallsgrad, desto gesicherter ist der Erwartungswert und damit umso präziser die Elo-Methode.
D ist der "Dynamik-Faktor". Je häufiger gespielt wird und je sicherer damit die Elo-Werte sind, desto kleiner kann D gewählt werden. Fällt die Performance eines Spielers stark aus der durch die Elo-Zahl repräsentierte Erwartung, existieren beim Schach Sondermethoden und Gewichtungsregeln, die aber sehr kompliziert sind. Wir probieren es erstmal mit konstant D=50. In Zukunft könnte eine flexible Zuordnung kommen.
Schwächen:
Das Elo-System funktioniert schlecht, wenn die Anfangschätzung unpassend war, Spieler ihre Stärke schnell verändern, selten spielen oder überwiegend gegen deutlich schwächere, deutlich stärkere oder immer den selben Gegner spielen. Bemüht Euch also, schon beim Einfordern etwa realistische Elo-Werte zu erreichen und regelmäßig gegen verschiedene, ebenbürtige Spieler anzutreten.
Der Durchschnitt über alle Spieler hängt davon ab, wie stark die Spieler sind, die mitmachen. Er sollte aber etwa konstant bleiben, damit die Normierung mit K=200 für einen Klassenunterschied passt und ein normierter Vergleich der Elozahl über der Zeitachse möglich ist. Bundesliga sollte wie beim Schach im 2000er Bereich liegen, Weltelite (Großmeister) bei 2500 Elo. Gegebenenfalls müssen wir also etwas umskalieren.
Damen:
Beim Schach gibt es zwar wenige, aber in der Spielstärke zum Teil mit den Herren vergleichbare Damen. Beim Squash erwarten wir zunächst 1-3 Klassen Differenz. Größte und kleinste Elo-Zahl: Die Elo-Zahl ist im Prinzip nach oben offen. Ein "perfekter" Spieler mit 100% Gewinnsicherheit könnte theoretisch sehr langsam aber sicher eine unendliche Elo-Zahl erreichen. Aber niemand ist perfekt. Beim Schach erreichte Garry Kasparow mit 2800 Elo-Punkten die höchste je erlangte Wertung. Genauso wie Spieler prinzipiell beliebig stark werden können, können andere beliebig schwach sein. Es existiert also auch nach unten keine Grenze. Doch etwa 400 Elo-Punkte heißen beim Schach "kann kaum die Figuren richtig ziehen". Mal sehen, ob wir vergleichbare Werte beim Squash haben werden...
Crossover-Vergleich:
Auch wenn in den jeweiligen Anlagen die Spieler eher untereinander spielen, reichen relativ wenige übergreifende Vergleichsspiele für eine faire Punkteverteilung. Es gibt wissenschaftliche Analysen, wie viel dieser "Diffusion" tatsächlich nötig ist. Beim Schach funktioniert das in der Praxis sehr gut und macht beispielsweise Schweizer auch mit Russen vergleichbar, obwohl viel mehr Russen viel häufiger Schach spielen. Selbst Schachcomputer lassen sich in die Rangliste einreihen und treten bei Turnieren gesetzt mit ihrer Elo-Zahl an.
Ist Elo optimal?
Auch das Elo-System ist keineswegs optimal. Auf der Suche nach einer optimalen Schätzung der Rangfolge müsste man nach der Maximum Likelyhood Methode (optimale Methode aus der Statistik) die Rangfolge wählen, die für die Stichprobe der Spielergebnisse die geringste Differenz vom Erwartungswert liefert. Hierfür gibt es keinen polynomiellen Algorithmus (Fachbegriff für "einfachen" Algorithmus), obwohl eine nicht-polynomielle Berechnung mit heutigen Rechnern wahrscheinlich schon möglich wäre. Mal sehen ob ich an einem ruhigen Wochenende mal sowas programmiere... (meint Peter Ibach) Allerdings wäre solch ein Algorithmus dann wirklich nicht mehr von Außenstehenden zu verstehen. Kurzum, Elo ist eine anerkannte und erprobte Näherung mit vertretbarem Aufwand und zumutbarer Transparenz (soll heißen "Verstehbarkeit").