Für welche Sportarten ist die Elo-Zahl geeignet?
Im Prinzip für alle.
Doch die hier verwendete geometrische Wahrscheinlichkeitsverteilung passt nur für
Sportarten mit vernachlässigbar geringem "Zufallsgrad". Janghir Kahn war fast eine
ganze Generation lang ungeschlagen Weltmeister, Hansi Wiens dominierte jahrelang die
deutsche Squashszene.
Ähnlich statisch ist
sonst nur Schach und Go. Für eine Fußball-Rangliste, generell wohl bei
Mannschaftssportarten,
müsste eine andere Verteilung eingesetzt werden. Auch für Skat, Poker oder
Backgammon würde man eine deutliche Zufallskomponente erwarten, mit der auch
viel schwächere Spieler immer noch eine gewisse Gewinnchance haben.
Je geringer der Zufallsgrad, desto gesicherter ist der Erwartungswert und damit umso
präziser die Elo-Methode.
D ist der "Dynamik-Faktor". Je häufiger gespielt wird und je sicherer damit die
Elo-Werte sind, desto kleiner kann D gewählt werden. Fällt die Performance eines
Spielers stark aus der durch die Elo-Zahl repräsentierte Erwartung, existieren beim
Schach Sondermethoden und Gewichtungsregeln, die aber sehr kompliziert sind. Wir
probieren es erstmal mit konstant D=50. In Zukunft könnte eine flexible Zuordnung
kommen.
Schwächen: Das Elo-System funktioniert schlecht, wenn die Anfangschätzung
unpassend war, Spieler ihre Stärke schnell verändern, selten spielen oder überwiegend
gegen deutlich schwächere, deutlich stärkere oder immer den selben Gegner spielen.
Bemüht Euch also, schon beim Einfordern etwa realistische Elo-Werte zu erreichen und
regelmäßig gegen verschiedene, ebenbürtige Spieler anzutreten.
Der Durchschnitt über alle Spieler hängt davon ab, wie stark die Spieler sind, die
mitmachen. Er sollte aber etwa konstant bleiben, damit die Normierung mit K=200 für
einen Klassenunterschied passt und ein normierter Vergleich der Elozahl über der
Zeitachse möglich ist. Bundesliga sollte wie beim Schach im 2000er Bereich liegen,
Weltelite (Großmeister) bei 2500 Elo. Gegebenenfalls müssen wir also etwas umskalieren.
Damen: Beim Schach gibt es zwar wenige, aber in der Spielstärke zum Teil mit den
Herren vergleichbare Damen. Beim Squash erwarten wir zunächst 1-3 Klassen Differenz.
Größte und kleinste Elo-Zahl: Die Elo-Zahl ist im Prinzip nach oben offen. Ein
"perfekter" Spieler mit 100% Gewinnsicherheit könnte theoretisch sehr langsam aber
sicher eine unendliche Elo-Zahl erreichen. Aber niemand ist perfekt. Beim Schach
erreichte Garry Kasparow mit 2800 Elo-Punkten die höchste je erlangte Wertung.
Genauso wie Spieler prinzipiell beliebig stark werden können, können andere beliebig
schwach sein. Es existiert also auch nach unten keine Grenze. Doch etwa 400
Elo-Punkte heißen beim Schach "kann kaum die Figuren richtig ziehen". Mal sehen,
ob wir vergleichbare Werte beim Squash haben werden...
Crossover-Vergleich: Auch wenn in den jeweiligen Anlagen die Spieler eher
untereinander spielen, reichen relativ wenige übergreifende Vergleichsspiele für eine
faire Punkteverteilung. Es gibt wissenschaftliche Analysen, wie viel dieser "Diffusion"
tatsächlich nötig ist. Beim Schach funktioniert das in der Praxis sehr gut und macht
beispielsweise Schweizer auch mit Russen vergleichbar, obwohl viel mehr Russen viel
häufiger Schach spielen. Selbst Schachcomputer lassen sich in die Rangliste einreihen
und treten bei Turnieren gesetzt mit ihrer Elo-Zahl an.
Ist Elo optimal?
Auch das Elo-System ist keineswegs optimal. Auf der Suche nach einer
optimalen Schätzung der Rangfolge müsste man nach der Maximum Likelyhood Methode
(optimale Methode aus der Statistik) die Rangfolge wählen, die für die Stichprobe der
Spielergebnisse die geringste Differenz vom Erwartungswert liefert. Hierfür gibt es
keinen polynomiellen Algorithmus (Fachbegriff für "einfachen" Algorithmus), obwohl
eine nicht-polynomielle Berechnung mit heutigen Rechnern wahrscheinlich schon möglich
wäre. Mal sehen ob ich an einem ruhigen Wochenende mal sowas programmiere...
(meint Peter Ibach)
Allerdings wäre solch ein Algorithmus dann wirklich nicht mehr von Außenstehenden zu
verstehen. Kurzum, Elo ist eine anerkannte und erprobte Näherung mit vertretbarem
Aufwand und zumutbarer Transparenz (soll heißen "Verstehbarkeit").
|