Bild: Pixabay, CC0 Creative Commons
Statistische Analysen und Big Data Methoden sind aus dem Profisport nicht mehr wegzudenken. Bild: Pixabay, CC0 Creative Commons

Wie stark ist der VfL wirklich? – Statistikanalyse der Hinrunde

Unser VfL Bochum spielt mit 27 Punkten mit die stärkste Hinrunde seit 8 Jahren. In der Spielzeit 2015/2016 ist uns dies schon einmal gelungen. Wäre mit etwas mehr Glück sogar noch mehr drin? Dies gab es zumindest zuletzt von Robin Dutt und einigen Spielern zu hören. Wir lassen die Zahlen sprechen!

Der Sieg gegen den Effzeh zum Abschluss des Fußballjahres konnte nur kurz Freudenstürme entfachen. Die beiden Niederlagen gegen den FC St. Pauli und Union Berlin, und der damit verbundene Verlust des Anschlusses an die Aufstiegsplätze, sitzen nach wie vor tief. Auch Trainer Robin Dutt und die Mannschaft teilen das Gefühl, dass eigentlich noch mehr drin war.

„Ich glaube, dass die Tabelle und die Punktanzahl nicht ganz unsere Leistung in dieser Hinrunde widerspiegeln.“ – Robin Dutt

Wir wollen mit etwas Abstand die Gefühle rausnehmen und die Zahlen sprechen lassen. Ist unser VfL wirklich stärker als die aktuelle Tabellensituation? Und wie kann man Überlegenheit und Glück eigentlich messen?

Kurzer Blick in die Vergangenheit

Die Zahlen des VfL nach dem 18. Spieltag in den vergangenen Zweitligasaisons seit dem letzen Abstieg

Zur Einordnung der aktuellen Situation hilft es, einen Vergleich mit den vergangenen Zweitligasaisons vorzunehmen. Besser als 2018/19 war nur die erste Saison nach dem Abstieg, in welcher der VfL finanzielle Risiken für den direkten Wiederaufstieg einging, und am Ende auf dem Relegationsplatz landete. 2015/16 spielten die Blau-Weißen unter Gertjan Verbeek furios auf und erreichten ebenfalls 27 Punkte, die damals jedoch zu Platz 6 anstatt 8 reichten. Alle anderen Saisons waren mit 17 bis 23 Punkten deutlich schwächer als diese.

Von Ballbesitz bis expected goals – Können wir Überlegenheit und Glück in Zahlen fassen?

Punkte und Tabellenplätze sind die klaren Fakten, die alles bestimmen – Aufstieg, Relegation, TV Gelder und die Stimmung bei den Fans. Sie hängen jedoch von vielen Faktoren ab, zu denen insbesondere auch Glück gehört. Geht der Ball an den Pfosten oder ins Tor, entscheidet der Schiedsrichter auf Elfmeter oder nicht, steht Kruse im Abseits oder kann er den späten Siegtreffer erzielen? In den 18 Ligaspielen des VfL Bochum fielen in dieser Saison 51 Tore – im Schnitt also etwas weniger als 3 Tore pro Spiel. Ein einzelnes Tor entscheidet häufig über Sieg, Unentschieden oder Niederlage. Wenn Robin Dutt nun sagt, dass die Tabellensituation die Leistung nicht widerspiegelt, so spielt er darauf an, dass die unkontrollierbaren Faktoren eher gegen unseren VfL sprachen. Wir wollen versuchen, dieses Gefühl mit Zahlen zu bestätigen oder zu widerlegen.

Im Fußball werden zahlreiche Statistiken erfasst. Wir wollen insbesondere auf die Statistiken schauen, die direkt mit Toren zusammenhängen. Um ein Tor zu erzielen, muss man

  1. den Ball haben und
  2. aufs Tor schießen.

Ballbesitz und Torschüsse sind also gute Statistiken, um Überlegenheit zu messen. Der prozentuale Ballbesitz basiert entweder auf der Zeit in Ballbesitz oder auf den gespielten Pässen. Ein durchschnittliches Spiel der 1. Bundesliga hat 56:05 Minuten Netto-Spielzeit, und die 3365 Sekunden Ballbesitz können genau auf den beiden Mannschaften aufgeteilt werden können. In dieser Saison hat der VfL bereits 7029 Pässe gespielt (391 pro Spiel). Eine Statistik, die auf Ballbesitz bzw. Pässen basiert, kann also auf mehr als die 100-fache Datenbasis zurückgreifen als eine rein torbasierte.

Ballbesitz per se ist jedoch nicht erstrebenswert, so lange er nicht in hochkarätigen Torabschlüssen endet. In den Spielen des VfL wurden bisher exakt 500 Torschüsse abgefeuert. Die Datenbasis ist also immer noch 10-mal so groß wie bei den Toren. Torschüsse scheinen also ein guter Kompromiss zur Bewertung der eigentlichen Leistung zu sein. Mit dem PDO (Interpseudonym seiner Erfinders Brian King) gibt es sogar eine auf Torschüssen basierende Metrik, die vorgibt Glück messbar zu machen. Der PDO berechnet sich als Summe aus den Verhältnissen verwandelter und abgewehrter Torschüsse. Eine Mannschaft, die ein hohes Verhältnis verwandelter und abgewehrter Torschüsse aufweist, ist eher glücklich. Eine Mannschaft, die wenig verwandelt und abwehrt, gilt als unglücklich. Tatsächlich zeigt sich, dass die Metrik langfristig gegen den Mittelwert läuft, so dass kurzfristige Tendenzen auf Glück- oder Pechsträhnen hinweisen können.

Die Bewertung der Leistung mittels Torschüssen oder des Glücks mithilfe des PDO basiert auf der Annahme, dass jeder Torschuss die gleiche Wahrscheinlichkeit hat, in einem Tor zu enden. Diese Annahme ist jedoch angreifbar. Ein Mannschaft, die in der Schlussphase einer Partie aus jeder Lage draufhält, sammelt fleißig Torschüsse, hat jedoch geringe Erfolgsaussichten auf einen tatsächlichen Torerfolg. Um dies zu kompensieren, haben statistikbegeisterte Internetblogger (u. a. 11tegen11, Colin Trainor und Constantinos Chappas) die sogenannte Expected Goals (xG) Metrik eingeführt. In dieser werden detailierte Positions- und Spieldaten verwendet, um unter anderem zu berücksichtigen von wo und wie (z. B. mit Fuß oder Kopf) ein Schuss ausgeführt wurde. Die Gewichtung des Schusses erfolgt auf Basis der historischen Erwartung, aus dieser Position mit diesem Körperteil  ein Tor zu erzielen. Auf diese Weise kann also tatsächlich gemessen werden, welche Anzahl an Toren bei durchschnittlichen Abschlussfähigkeiten erwartbar bzw. gerecht gewesen wäre.

Doch selbst mit xG ist noch nicht das Ende der Fahnenstange erreicht. Oft denkt man sich doch: Wieso schießt er da nicht? Um auch diese potenziell gefährlichen Situationen ohne eigentlichen Torabschluss zu berücksichtigen, gibt es die non-shot Expected Goals (non-shot xG) Metrik. Bei dieser werden Ballaktionen (z. B. angekommene Pässe, Ballgewinne, erfolgreiche Dribblings) in Tornähe mit ihrer Wahrscheinlichkeit, in einem erfolgreichen Torschuss zu enden, ebenfalls zur Metrik addiert – auch wenn es nicht zum eigentlichen Torschuss kommt. Auf diese Weise werden Markenzeichen dominanter Teams wie Ballbesitz und Ballgewinne tief in der gegnerischen Hälfte besonders honoriert.

Genug der Theorie, Butter bei die Fische

Nehmen wir also unser neu erworbenes statistisches Handwerkszeug, um die ersten 18. Spieltage genauer unter die Lupe zu nehmen.

Anteil der beschriebenen Statistiken in den 18 Spielen der Saison 2018/19. Quellen: https://projects.fivethirtyeight.com/soccer-predictions/bundesliga-2/(xG, non-shot xG), www.vfl-bochum.de (Torschüsse, Ballbesitz)

Der Graph zeigt die beschriebenen Statistiken für jedes VfL-Spiel der bisherigen Zweitligasaison. Die dunkelblauen Linien zeigen die Tore und xG-basierten Metriken, also die Zahlen mit der höchsten Aussagekraft. Liegen alle dunkelblauen Linien oberhalb der 50 %-Linie, so kann man von einem verdienten Sieg reden, da sowohl die tatsächlichen als auch die erwarteten Tore für den VfL sprachen. Dies war gegen den FC Ingolstadt, Darmstadt 98 und Erzgebirge Aue der Fall. Bei unglücklichen Punktverlusten lagen die xG-basierten Zahlen über 50 %, während die tatsächliche Ausbeute kein Sieg war (Anteil Tore ist 50 % oder kleiner), wie es z. B. im Spiel gegen Dynamo Dresden der Fall war. Ähnliches gilt für Spiele, bei denen die Metriken ausgeglichen waren, das Spiel jedoch verloren wurde (Hinspiel Köln, St. Pauli, Union Berlin). Es gibt jedoch auch Spiele, in denen der VfL mehr mitgenommen hat als aufgrund der xG-Metriken erwartbar gewesen wäre (MSV Duisburg, SV Sandhausen, Holstein Kiel) bzw. verdient verloren hat (FC Heidenheim).

Insgesamt zeigen der Graph und die genannten Spiele wie eng die zweite Liga zusammensteht. Es gibt kaum Spiele, bei denen alle Metriken klar in eine Richtung zeigen. Nur Ingolstadt, Darmstadt und Erzgebirge Aue konnten wirklich dominiert werden. Im Gegenzug wurde der VfL jedoch auch nie vollständig dominiert. Das einzige Spiele, wo dies von den Statistiken her der Fall war, wurde in Duisburg gewonnen. In den Spielen gegen den FC Heidenheim und Kiel weisen die Statistiken ebenfalls einheitlich eine Unterlegenheit aus. Diese ist jedoch nicht extrem ausgeprägt und wurde mit einem Punktgewinn bei den Störchen bzw. einer knappen Niederlage in Heidenheim noch versöhnlich gestaltet.

Vergleich zur Saison 2015/16

Die letzte ähnlich erfolgreiche Hinrunde wurde 2015/16 unter Gertjan Verbeek gespielt. Der Niederländer legte ebenfalls Wert auf dominanten Fußball und die Mannschaft um Spieler wie Simon Terrode, Janik Haberer und Marco Terrazzino fegte durch die Liga bis der übliche Herbst eine bessere Platzierung zur Winterpause verhinderte. Für diese Spielzeit existieren noch keine xG-Werte, so dass wir für einen Vergleich der Daten mit dieser Saison auf Torschüsse und Ballbesitz zurückgreifen müssen. Wie im Graph oben zu sehen, korrelieren die Werte jedoch meist stark.

Zahlen der Hinrunde der Saison 2015/16. Quelle: www.bundesliga.de (Zahlen) bzw. www.spielverlagerung.de (Abbildung)

Der Vergleich zeigt, dass das Team 2015/16 noch konstanter dominant war als in dieser Saison. Man hatte nur in einem Spiel weniger Ballbesitz als der Gegner (Düsseldorf). Weniger Torschüsse gab es nur in 2 Spielen (Paderborn und Leipzig). In keinem Spiel war man hinsichtlich aller Statistiken unterlegen. Die Aussage, dass der Tabellenstand nicht die eigentlichen Leistungen widerspiegelt, würde auf diese Saison noch viel klarer passen.

Ist der aktuelle Tabellenstand nun verdient oder nicht?

Wie zuvor bereits beschrieben, gilt der PDO als klassischer Indikator für Glück und hat eine klare Interpretation. Ein Wert von 100 ist neutral, höhere Werte weisen auf Abschlussglück, niedrigere auf Abschlusspech hin. Schauen wir also auf die PDO-Werte in der Hinrunde:

Übersicht der Torschüsse sowie der PDO-Werte für die Spieltage 1-18 der Saison 2018/19. Quelle: www.vfl-bochum.de (Torschüsse), https://projects.fivethirtyeight.com/soccer-predictions/bundesliga-2/ (xG)

Der durchschnittliche PDO des VfL Bochum nach den ersten 18. Spieltagen liegt bei 106,2. Damit wäre die aktuelle Platzierung unseres VfLs sogar als etwas glücklich zu bezeichnen. Wenn natürlich auch per Definition miteinander verbunden, unterstützen die Torschüsse diese Aussage sehr plastisch. Im Gegensatz zu den Toren (28:23) ist das Verhältnis von eigenen zu gegnerischen Torschüssen nämlich negativ – 233 eigenen Versuchen stehen 267 des Gegners gegenüber. Die Qualität der eigenen Torschüsse ist mit einer durchschnittlichen Torerwartung von 11 % zwar minimal höher als die 10,7 % des Gegners. Die Annahme identischer Wahrscheinlichkeiten, die dem PDO zugrundeliegt, kann aber aufgrund des geringen Unterschieds als valide betrachtet werden.

Verlauf der PDO-Werte über die Spieltage 1-18 der Saison 2018/19. Quelle: www.vfl-bochum.de (Torschüsse)

Der zeitliche Verlauf des PDO zeigt drei Phasen: Zu Beginn (Spieltage 2-6) war der VfL extrem glücklich mit einem gleitenden Mittelwert des PDO über 3 Spiele von etwa 120. Darauf folgte eine Phase (Spieltage 8-13), in welcher die Ergebnisse etwa den Torschüssen entsprachen, was in PDO-Werten mit einem gleitenden Mittelwert von knapp über 100 resultierte. Zuletzt war man dann eher etwas unglücklich (Spieltage 14-17) mit PDO-Werten unterhalb 100. Diese Phase hat wahrscheinlich zur Wahrnehmung geführt, dass insgesamt mehr drin gewesen wäre. Das extreme Glück der ersten Spiele war zu diesem Zeitpunkt bereits in Vergessenheit geraten. Das Spiel in Köln stellt hoffentlich eine Trendwende zurück zu glücklicheren Zeiten dar.

Expected Goals bestätigen die eher glückliche Ausbeute des VfL

Übersicht der Ergebnisse sowie der xG-Werte für die Spieltage 1-18 der Saison 2018/19. Quelle: www.vfl-bochum.de (Ergebnisse), https://projects.fivethirtyeight.com/soccer-predictions/bundesliga-2/ (xG)

Die Expected Goals bestätigen die Werte des PDO. Hätten die Torschüsse des VfLs die erwarteten Erfolgswahrscheinlichkeiten gehabt, so würden unseren Blau-Weißen mit einem negativen Torverhältnis von 26:29 darstehen (Spalten xG und xG Gegner). Lukas Hinterseer und Co. erzielen im Schnitt 1,1 Tore aus Schüssen, die einen Erwartungswert von einem Tor haben (Spalte Tore/xG). Sie sind damit überdurchschnittlich effizient. Unsere Gegner hingegen verballern ihre Chancen. Aus Torschüssen für ein Tor wurden in den ersten 18. Spieltagen nur 0,8 Tore erzielt (Spalte Gegentore/xG).

Verlauf der xG-Werte für die Spieltage 1-18 der Saison 2018/19. Quelle: https://projects.fivethirtyeight.com/soccer-predictions/bundesliga-2/

Schauen wir auf den zeitlichen Verlauf, so können wir erneut die drei Phasen aus dem PDO-Graph erkennen. In den Spieltagen 2-6 war der VfL sehr effizient mit einem gleitenden Mittel von etwa zwei realen Toren pro Expected Goal, während der Gegner nur 0,5 Tore pro Expected Goal erzielte. In den Spieltagen 8-13 entsprach der VfL dann etwa der Erwartung. Unsere Gegner gingen jedoch weiterhin eher ineffizient mit ihren Chancen um. In den Spieltagen 15-17 war der VfL nun eher ineffizient, während unsere Gegner gemäß der Erwartung abschlossen. Im Jahresabschluss gegen Köln zeigten beide Teams, dass sie hochkarätige Stürmer in ihren Reihen wissen.

Übersicht der Ergebnisse sowie der non-shot xG-Werte für die Spieltage 1-18 der Saison 2018/19. Quelle: www.vfl-bochum.de (Ergebnisse), https://projects.fivethirtyeight.com/soccer-predictions/bundesliga-2/ (xG)

Die non-shot xG Werte bestätigen die eher glückliche Ausbeute unserer Jungs. Das erwartete Torverhältnis nach Spielsituationen wäre mit 25:27 wie auch bei den schuss-basierten Expected Goals negativ (Spalten non-shot xG und non-shot xG Gegner). Trotz des höheren, durchschnittlichen Ballbesitzes von 53,9 % (Spalte Anteil Ballbesitz) ist die erwartete Gefahr, die vom Ballbesitz ausgeht, geringer. Während der VfL nur Spielsituationen für erwartete 1,7 Tore pro Stunde Ballbesitz kreiert, kommen unsere Gegner auf 2,1 Tore pro Stunde Ballbesitz. Zum Glück machen sich das Training und die Abstimmung der Stammelf langsam bemerkbar. Lag diese Statistik bis zum Spiel gegen Bielefeld (9. Spieltag) meist unter 1,5 non-shot xG / h Ballbesitz (nur 3 von 9 lagen darüber), wurde diese Marke in 6 von 9 Spielen der zweiten Hälfte erreicht.

Verlauf der non-shot xG-Werte für die Spieltage 1-18 der Saison 2018/19. Quelle: https://projects.fivethirtyeight.com/soccer-predictions/bundesliga-2/

Der zeitliche Verlauf der non-shot xG zeigt die gleichen drei Phasen wie der PDO und die schussbasierten Expected Goals. Der gegenläufige Trend bei der Ausbeute ist jedoch bei der non-shot Variante noch extremer ausgeprägt.

Fazit und Ausblick

Die Hypothese von Robin Dutt, dass die Tabelle und die Punktanzahl nicht ganz unsere Leistung in dieser Hinrunde widerspiegeln, kann durch die Zahlen nicht bestätigt werden. Wenn man sehr genau hinsieht, steht der VfL sogar etwas besser dar als die Erwartung der reinen Zahlen vermuten lassen würde. Diese Tendenz ist jedoch insbesondere durch den Saisonstart bedingt, in welchem der VfL sehr glücklich seine Spiele gewinnen konnte (insbesondere gegen Duisburg und Sandhausen). Die Regression zur Mitte hat längst eingesetzt, so dass die eher unglücklichen Spiele am Ende der Hinrunde die Wahrnehmung verzerrt haben.

Verlauf des Ballbesitzanteils über die Spieltage 1-18 der Saison 2018/19. Quelle: www.vfl-bochum.de

Die Zahlen machen jedoch auch Hoffnung. Der VfL wird immer dominanter und kann sich in Ballbesitz konstanter in gefährliche Situation hineinspielen. Lauerte man zu Saisonbeginn auswärts noch auf Konter und ließ selbst Mannschaften wie Duisburg, Paderborn oder Heidenheim das Spiel machen, so fühlt man sich in der zweiten Hälfte der Hinrunde auch auswärts in der spielmachenden Rolle wohl. Ein Ballbesitzanteil von 56 % beim Aufstiegskandidaten Union Berlin ist ein klares Statement. Doch der Ballbesitz ist kein Selbstzweck. Trotz der höheren Ballbesitzzeiten nimmt der Anteil der torgefährlichen Situationen pro Stunde Ballbesitz zu. Setzt man den Trend aus dem Köln-Spiel bei der Verwertung dieser Situationen unter Beibehaltung der Zahlen in der Rückrunde fort, so können wir noch viel Freude mit dem VfL haben.

Tobias Wagner

Tobias Wagner

Ich bin seit meinem fünften Lebensjahr Fan des VfL. Die Hochzeiten des Vereins mit den beiden UEFA-Cup Teilnahmen habe ich in meiner Jugend live miterlebt. Von da an war klar - für mich gibt es nur den VfL. Die Jungs von Spielverlagerung weckten meine Begeisterung für die Taktikanalyse. Auf erste Taktikanalysen, die noch direkt an den VfL versendet wurden, folgte der Blog "Blau-weiße Taktikecke". Später wurde ich dann selbst Autor bei Spielverlagerung und Trainer verschiedener Jugendmannschaften (U14-U16). Meine Begeisterung für Fußball, Training, taktische Raffinessen und statistische Spielereien möchte ich nun hier mit Euch teilen.

Schreibe einen Kommentar