Die Verfügbarkeit von Daten hat im Fußball in den letzten Jahren rasant zugenommen. Immer mehr Vereine setzen auf digitale und datengetriebene Scoutingangebote, um das Maximum aus ihrem Budget herauszuholen. Wir sprechen mit Dustin Böttger, dem Gründer und Geschäftsführer von Global Soccer Network (GSN) über die aktuellen Möglichkeiten und analysieren den Bochumer Kader.
Einsachtvieracht: Hallo Dustin, herzlich Willkommen. Stelle Dich persönlich und GSN doch mal kurz vor? Wie kann man sich das Angebot von GSN vorstellen?
Dustin Böttger: Ganz kurz zu meiner Person. Dustin Böttger ist mein Name. Ich bin Gründer und Geschäftsführer von Global Soccer Network. Ich komme ursprünglich aus dem klassischen Scouting. Ich habe für die TSG Hoffenheim und den SV Sandhausen gearbeitet, der ja für Anhänger des VfL Bochum auch kein unbekannter Verein ist. Ich habe dort einen klassischen Scouting-Job gemacht und bin sehr viel rumgefahren, um die Spiele live vor Ort zu schauen. Ich dachte mir irgendwann, dass diese Art von Scouting sehr subjektiv ist, was die Einschätzung der Spieler angeht. Außerdem ist sehr schwer, alle Spieler über 90 Minuten im Blick zu haben. Da muss man den Fokus schon auf 1-2, maximal 3 Spieler legen. Da kam mir die Idee, was man denn machen könnte, um den ganzen Scouting-Prozess effektiver und objektiver zu gestalten.
Dazu kommt, dass mein Vater aus Kanada kommt. Ich bin also mit den ganzen amerikanischen Sportarten aufgewachsen. Da gibt es ja das Stichwort „Moneyball“ aus dem Baseball. Ich war von Anfang sehr an den US-Sportarten interessiert. Insbesondere habe ich auch eine große Affinität zu den dazugehörigen Sammelkarten und den darauf stehenden Daten gehabt. Da habe ich mir dann gedacht, was könnte man denn mit Fußballdaten machen. Das Ganze war 2010 während der Fußballweltmeisterschaft in Südafrika. Dazu kam, dass 2010 der Datenmarkt Fußball noch nicht so präsent war wie heute. Es gab die Ran-Datenbank und es gab Opta, jedoch damals noch mit Preisen, die für normale Leute unbezahlbar waren. Deswegen habe ich mir gedacht, dass ich etwas eigenes auf die Beine stellen muss. Ich habe die Firma GSN gegründet mit dem Hintergedanken, einen Algorithmus auf Basis der verfügbaren Eventdaten zu bauen. Das hat natürlich nicht von heute auf morgen funktioniert, sondern in Summe dreieinhalb Jahre gedauert bis wir wirklich erste Aussagen aus den Daten treffen konnten.
Mittlerweile haben wir zehn feste Mitarbeiter, um unser Angebot zu erweitern und unsere Kunden zu bedienen. Dazu gehören auch ein Medienbeauftragter und ein Jurist. Die übrigen Mitarbeiter sind Data Scientists mit großer Begeisterung für Fußball. Damit das datengetriebene Scouting wirklich funktioniert, müssen beide Seiten abgedeckt werden – methodische Kompetenz und Verstehen, was auf dem Platz passiert.
Sehr cool! Wie würdet Ihr Euch denn im Verhältnis zu den aktuellen datengetriebenen Angeboten sehen? Ihr habt ja den GSN-Index. Seid ihr also auch eher ein Super-Indikator, so wie Goal Impact oder Packing von Impect, oder setzt Ihr mehr auf die Kombination von mehreren parallelen Metriken zu Profilen wie in den Stats Bomb Radar Charts?
Wir haben eigentlich die komplette Range im Angebot. Wir haben den GSN-Index, der alles bündelt, was wir an Daten haben, um eine erste Aussagekraft zu bekommen, wie gut oder schlecht der einzelne Spieler ist. Den Index kann man herunterbrechen auf sehr verschiedene Metriken. Quasi alles was Du so kennst. Ihr habt ja bereits bei Einsachtvieracht Analysen auf Basis von Expected Goals veröffentlicht. Da gibt es ja auch noch Erweiterungen von, wie beispielsweise Expected Assists, etc. Das alles nimmt unser Index auf.
Wir können aber natürlich die Einzeldaten auch separat liefern. Wenn jetzt ein Klub sagt: „Findet mir die Stürmer mit den besten Expected Goals aus der 2. belgischen Liga“, so können wir das genauso liefern wie irgendwelche anderen Geschichten. Im Prinzip können wir alles liefern, was von den Klubs gewünscht ist.
Wie kann man sich denn die Zusammenarbeit zwischen Euch und einem Profiklub in diesem Kontext vorstellen? Ich weiß nicht, ob Ihr darüber sprechen dürft, aber arbeitet ihr aktuell schon mit Profiklubs konkret zusammen?
Wir sind gerade dabei, ein eigenes Datenportal aufzusetzen, wie man es von WyScout und InStat kennt. Da hat uns jetzt Corona einen Strich durch die Rechnung gemacht. Eigentlich wollten wir dieses Portal schon zur neuen Saison anbieten. Das wird sich nun ein bisschen nach hinten verschieben. Es ist momentan so, dass Klubs mit verschiedenen Anfragen auf uns zukommen. Einmal haben diese Klubs schon eine Shortlist mit konkreten Namen, die für den Klub relevant sind. Da schätzen wir die Spieler auf der Shortlist mit unserem Index ein. Die zweite Variante ist wie eine Suchmaschine: Wir suchen einen Stürmer unter 29, mindestens 1,90 m groß, beidfüßig und kopfballstark und aktuell außerhalb der europäischen Liga aktiv, damit er nicht zu teuer wird. Da sind keine Grenzen gesetzt. Wir hatten auch schon eine Anfrage vom südkoreanischen Fußballverband, der von uns wissen wollte, welche interessanten Landsleute in den weltweiten Ligen sie noch gar nicht auf dem Schirm haben.
Wir haben schon mit Manchester City, Paris Saint Germain, Benfica Lissabon, Bayern München und RB Leipzig im Rahmen von Anfragen zusammengearbeitet. Da ist schon einiges dabei. Das geht runter bis zur Regionalliga. Man muss aber schon sagen, dass es die paar Großen gibt, die keine Angst vor Daten haben. Es gibt aber auch andere Beispiele, bei denen wir Grafiken präsentieren und man merkt im Raum ist plötzlich Stille – was soll ich mit allen diesen Zahlen anfangen. Das macht es dann schon schwierig. In diesem Fällen haben wir dann auch schon die ein oder andere Absage bekommen.
Das kann ich mir gut vorstellen. Ein wichtiger Indikator Eures Scouting ist der GSN-Index, in dem ihr die Informationen vereint. Worauf basiert dieser?
Also generell ist es so, dass der GSN-Index auf vier Säulen basiert. Die erste Säule ist der klassische Scouting-Part, quasi als Basis. Dabei werden die Fußballer von Scouts in 130 Kategorien bewertet. Wir haben ein Netzwerk von 300 freien Mitarbeitern weltweit, die sich die Spieler meist vor Ort anschauen. Diese Mitarbeiter sind über die Welt verteilt, so dass sie auch gut Zugang zu den lokalen Spielen und Informationen haben. Dann haben wir als zweite Säule den Performance-Score, zu allem was auf dem Spielfeld passiert. Jeder gespielte Pass, jeder Torschuss, zig andere andere Spielereignisse sowie die neueren Metriken wie expected Goals und expected Assists fließen dabei ein. Dabei werden die Aktionen in den Kontext gesetzt und positionsbezogen angepasst, da du natürlich als Innenverteidiger andere Anforderungen hast als als Stürmer. Die dritte Säule ist das Spielniveau, bei dem wir uns aus dem Schach das ELO-Rating abgeschaut haben, um die individuelle Stärke einzelner Wettbewerbe und Mannschaften zu quantifizieren. Das bedeutet, dass jede Mannschaft einen Zahlenwert hat, die ihre aktuelle Stärke repräsentiert. Das gleiche gilt für eine Liga. Je höher das Spielniveau des Teams und der Liga des Spieler, desto höher der Index. Die vierte Säule ist das spielerische Potenzial, also wo kann sich ein Spieler hin entwickeln. Dazu haben wir einen Algorithmus, der die bestmögliche Entwicklung vorhersagen soll. Dieser Algorithmus ist natürlich nicht perfekt, wie jeder andere Algorithmus auch. Wir können beispielsweise keine Verletzungen, keine privaten Probleme oder keine abstrusen Vereinswechsel vorhersagen, wie beispielsweise den Wechsel von Kevin Prince Boateng zu Barcelona. Alle diese Faktoren kommen im GSN-Index zusammen.
Du hast es im letzten Punkt angesprochen: Der GSN-Index, den ihr auch mit uns für den Kader des VfL Bochum geteilt habt, hat ja einen “aktuellen” und einen “möglichen” Wert. Wie stehen diese Werte in Beziehung? Wie wird aus dem „aktuellen“ der „mögliche“ Wert abgeleitet?
Indem wir riesige Datenmengen auswerten. Wir haben mehr als 450 000 Spieler in unserer Datenbank. Wir haben für die Zukunftsprognosen einen Algorithmus von Börsenmaklern abgeschaut. Ich habe einen Kumpel, der ist Börsenmakler. Und die haben einen Algorithmus gebaut, der Unternehmen, die neu an die Börse kommen, einschätzt. Wir haben dann versucht, diesen Algorithmus auf den Fußball zu übertragen, mit ganz vielen unterschiedlichen Faktoren: wie ist die fußballerische Ausbildung, wann hat ein Spieler sein Profidebüt gegeben, wie ist die Qualität des Nachwuchsleistungszentrums, wie ist die Qualität der Trainer, die er hatte, hat er U-Nationalmannschaft gespielt, etc. Das geht bis hin zu Social-Media-Daten, um den Charakter des Spielers einzuschätzen – ist er eher bodenständig oder ist er der Vollprolet im Stil von Mario Balotelli.
Wow, das heißt Ihr nutzt also die APIs (Daten-Schnittstellen) von Twitter, Instagram und Co, um herauszufinden wie häufig ein Spieler postet oder ein Bild rausschießt? Damit seid ihr ja gar nicht soweit davon entfernt, Skandale vorherzusagen. Vielleicht nicht auf den Tag, aber das Potenzial könnt Ihr schon einschätzen?
Ja, tatsächlich. Dazu muss ich sagen, dass das auch ein Faktor ist, an dem die Klubs heutzutage sehr interessiert sind. Also wie viel machen die Spieler auf diesen Social-Media Kanälen. Viele davon kenne ich persönlich gar nicht mehr, da ich schon zu alt bin. Ich kenne Facebook und Twitter, dann hört es aber auch schon auf. Dabei gibt es ja noch TikTok und solche Geschichten. Das ist definitiv auch ein Faktor, der bei einer Vertragsentscheidung einfließt.
Du sagtest ihr macht alle mögliche Reports. Welche anderen statistischen Indikatoren oder Werkzeuge werden noch häufig nachgefragt, so über eine reine Qualitätseinschätzung hinweg?
Die Expected Goals Metriken sind tatsächlich so eine Sache, die nun bei immer mehr Klubs Anklang finden. In den entsprechenden Foren sind diese Metriken ja schon eine Standardnummer. Sie finden aber erst jetzt ihren Weg in den Profifußball. So stellt beispielsweise Amazon nun in seinen Übertragungen ebenfalls Torwahrscheinlichkeiten dar. Was sonst noch momentan in ist, sind die non-shot expected Goal Metriken, die alle Aktionen ohne Torschüsse bewerten. Diese beantworten letztendlich die Frage nach dem Wert der Aktionen eines Spielers für das Spiel der eigenen Mannschaft. Das ist momentan sehr angesagt.
Das heißt, ihr seid durchaus auch intern auf dem Niveau wie die StatsBomb Data Science Community oder die Wissenschaft, die bereits Action Values und ähnliche Indikatoren berechnen?
Wo du schon „Action Value“ sagst. Wir haben tatsächlich auch einen eigenen „Action Score“, der ein bisschen abgewandelt auf diesen Prinzipien aufbaut. Ich bin regelmäßig mit den Jungs von StatsBomb im Kontakt. Das ist schon in etwa ein Niveau.
Kommen wir zu unserem Verein, dem VfL Bochum. Was macht für Euch den Spielstil des VfL aus?
Wir haben ca. 150 Indikatoren, um den Spielstil zu bewerten. Darunter sind auch neuere Metriken wie PPDA (Passes Per Defensive Action, bzw. Pässe pro Defensivaktion) zur Berechnung der Pressingsintensität, Playing tempo (Anzahl der Pässe pro Minute Ballbesitz), Playing width bzw. Breitennutzung (Pässe im letzten Drittel im Verhältnis zu Flanken), Directness bzw. Direktheit (prozentualer Anteil an langen Pässen) oder die Aggressiveness (Defensivaktionen pro Minute gegnerischem Ballbesitz), um nur einige zu nennen.
Aus diesen Statistiken folgt, dass der VfL ein sehr aktives Team ist, das früh presst und viele Ballgewinne erzielt. In Ballbesitz ist es Mischung aus ruhigen und direkten Angriffen, die sowohl zentral als auch über die Flügel erfolgen. Diese Bandbreite bieten neben dem VfL nur die Top-Teams der zweiten Liga.
Habt ihr nach dem Re- Start eine Veränderung des Spielstils feststellen können?
Einige Veränderungen sind tatsächlich festzustellen, auch wenn wir bei den 6 Spielen nach Corona (Anmerkung der Redaktion: Das Interview wurde bereits am 10. Juni geführt) nur von einer Tendenz sprechen können:
- Torchancen von 5.2 auf 6.0
- Pässe von 469 auf 531
- Passquote von 80% auf 84%
- Schlüsselpässe von 11 auf 16
- Flanken von 14 auf 9
- Aggressiveres Pressing (PPDA) von 4.5 auf 4.2
- Pressingeffizienz von 43% auf 46%
- Ballbesitz von 52% auf 56%
Alle Daten im Schnitt pro Partie vor und nach Corona. Wie gesagt, die Daten zeigen aktuell nur eine Tendenz, da die Datenmenge nach 6 Spieltagen zu gering ist, um wirklich aussagekräftig zu sein.
Kann man die Informationen über den Spielstil auch für das Scouting nutzen?
Ja, auf jeden Fall. Wir suchen beispielsweise mit einem Algorithmus nach Teams mit einem ähnlichen Spielstil. So findet man weltweit Teams, die ähnlich spielen und deren Spieler man sich näher anschauen sollte, da diese mit der Spielweise des VfL wenig Probleme haben werden.
Wieso wurden grad diese Vereine ausgewählt?
Unser System sucht die beschriebenen Statistiken sowie weitere relevante Datenkategorien ab, die essenziell für die Spielweise eines Teams sind: Wo und in welcher Menge werden Torschüsse abgegeben? Wie werden Torchancen kreiert? Über welche Seite werden vermehrt Angriffe eingeleitet? Oder doch primär durch die Mitte. Wo und wie oft wird der Gegner angelaufen bzw. gepresst?
Wer sind nach Euren Indikatoren die Topspieler des VfL? Gibt es Geheimtipps?
Die aktuellen Topspieler des VfL nach GSN-Index sind Vitaly Janelt, Robert Zulj, Danilo Soares, Manuel Wintzheimer und Silvère Ganvoula. Sie haben bereits Erstliganiveau und noch zusätzliches Entwicklungspotenzial. Während Soares und Ganvoula ja bereits bei Erstligisten waren oder im Gespräch sind, sind Janelt und Wintzheimer in dieser Aufzählung sicherlich Geheimtipps. Die größten Talente des VfL sind aus unserer Sicht Armel Bella-Kotchap und Stylianos Kokovas, die beide das Potenzial für gehobenes Erstliganiveau haben.
Du sagtest ja bereits. Wenn man die Zahlen des GSN-Indizes teilt, dann wird schnell einiges in Frage gestellt. So war es auch bei uns im internen Einsachtvieracht-Chat. Bei einigen Spielern sehen wir große Diskrepanzen, die von unserer subjektiven Wahrnehmung abweichen. Ein Beispiel ist Maxim Leitsch, der bei Euch in der Liste sehr weit unten steht, jedoch beim VfL aktuell einer der Hoffnungsträger ist. Vor seiner Rückkehr waren wir die Schießbude der Liga und nun mit ihm auf dem Platz haben wir nur ein Gegentor in den letzten 7 Spielen bekommen. Im Gegensatz dazu werden Spieler wie Thomas Eisfeld oder unser Ersatzstürmer Manuel Wintzheimer deutlich höher eingestuft, obwohl sie diese Saison kaum etwas auf den Platz bringen. Die Frage meiner Kollege ist deshalb: Gibt es Schwächen in eurem System?
Ich persönlich würde vielleicht eher fragen: Wie bewertet ihr aktuelle und vergangene Leistungen? Das wäre interessant für das Beispiel Eisfeld. Und wir gewichtet ihr einzelne Statistiken? Das wäre aus meiner Sicht relevant für das Beispiel Wintzheimer.
Beim Beispiel Maxim Leitsch ist es so, dass der Index aktuell noch relativ niedrig ist, da er bisher nur wenige Spiele auf seinem aktuellen Niveau gemacht hat. Lass ihn nun ein Jahr weiter auf diesem Level spielen, dann steigt der Wert seines GSN-Index schon deutlich an. Wenn wir uns seinen möglichen Index von fast 63 anschauen, dann ist das schon gehobenes Bundesliganiveau, auf das er sich entwickeln kann. Das würde dann auch eure Meinung über seine Leistungsfähigkeit decken.
Generell ist dieser Index eher langfristig angelegt. Die Statistiken der aktuellen Spielzeit würden wir über den Performance-Score einbringen, der ein Teil des GSN-Index ist. Wir haben euch die entsprechenden Daten mal extrahiert.
Sehr interessant. Das zeichnet bereits ein anderes Bild. lassen. Könnt ihr uns für die drei Spieler Leitsch, Eisfeld und Wintzheimer die Scores der vier Säulen komplett gegenüberstellen?
Klar, gerne. An den Beispielen sieht man sehr schön wie die verschiedenen Säulen des Indexes unterschiedliche Aspekte der Spielerprofile adressieren. Eisfeld ist stark bei den fußballspezifischen Eigenschaften, dem langfristigen Performance Score und dem Level of Play, während Leitsch und Wintzheimer eher über ihr Potenzial kommen. Wie bereits angesprochen, sehen wir auch, dass Leitsch noch ein niedriges Level of Play aufweist.
Wo im Kader seht Ihr aktuell die größten Lücken? Welche Position ist eher schwach besetzt?
Auf einer Position, über die wir eigentlich noch gar nicht gesprochen haben – auf der des Torhüters. Manuel Riemann ist solide, aber von den Daten her kein Überspieler in der zweiten Liga. Seine Mentalität kann durchaus ein Faktor sein für Bochum, rein basierend auf seinen Leistungsdaten ist er Durchschnitt. Mit seinem Performance Score von 53,9 liegt er auf Rang 8 aller Zweitligatorhüter mit mehr als 2000 Minuten Spielzeit. Drewes und Grave haben (noch) kein Nummer 1 Niveau. Als Verantwortlicher des VfL würde ich also durchaus auch mal die Torhüterposition scouten.
Wo ich noch eine Schwachstelle sehen würde, wäre die Linksaußenposition, sollte Danny Blum den VfL verlassen. Da wüsste ich nicht direkt, wen man da hinstellen sollte. Die Qualität von Blum ist schon außerordentlich. Ich kenne ihn ja noch persönlich aus Sandhausen. Wie ist Eure Meinung von Danny Blum? Deckt sich das mit meiner Einschätzung?
Danny Blum ist natürlich ein absoluter Unterschiedsspieler auf dem Niveau der zweiten Liga. Die Defensivarbeit könnte besser sein, aber seine Durchschlagskraft ist schon beispiellos. Tatsächlich hat es aber in den letzten Spielen geklappt, den Ausfall von Blum zu kompensieren, indem man taktisch etwas angepasst hat und nun die Tempodurchbrüche eher über die rechte Seite mit Osei-Tutu fokussiert, während Pantovic auf links einrückender spielt. Dazu kann Osei-Tutu situativ von der linken Seite Torgefahr erzeugen, indem er invers nach innen zieht. Das ist zwar anders als die Durchbrüche zur Grundlinie von Blum, bringt aber eine neue Komponente ins Bochumer Spiel. Insgesamt ist Osei-Tutu jünger und noch nicht so entwickelt, vom Tempo und Dribbling her ist er aber auf ähnlichem Niveau wie Danny Blum.
Das stimmt. Wie gesagt, bei Danny Blum bin ich mal gespannt. Wenn ihr den in Sandhausen gesehen hättet vor ein paar Jahren. Der war ein Riesenkicker aber alles andere – Junge, Junge. Aber okay, er hat die Kurve bekommen, definitiv. Von daher wird es jetzt spannend, was da passiert.
Auch bei Silvère Ganvoula bin ich mal gespannt. Da habe ich jetzt gelesen, dass Mainz 05 interessiert wäre. Die haben allerdings aktuell schon 8 Stürmer im Kader. Ob man da noch eine Nummer 9 braucht? Das lassen wir mal dahingestellt. Auch Gladbach soll ja in der Winterpause angefragt haben. Wobei die aber in der Offensive auch schon einiges an Qualität haben mit Plea, Stindl und Thuram. Das ist dann schon noch einmal ein anderes Level.
Hier wäre es noch ganz spannend wo ihr die größten Stärken unseres Angreifers seht, z. B. über die Quote in offensiven Kopfballduellen hinweg.
Da gibt es einige relevante Eigenschaften. Wie bereits angesprochen, ist sein Kopfballspiel natürlich überdurchschnittlich. Wie können das jedoch noch weiter herunterbrechen. So sind seine Sprungkraft und sein Timing in der Luft ebenfalls überdurchschnittlich.Dazu kommt seine körperliche Präsenz mit 1,91 m und einer Masse von 90 kg. Darüber hinaus verfügt über eine sehr gute Fitness und ist wenig verletzungsanfällig. Dazu weist er einen überdurchschnittlichen Abschluss auf.
Zum Schluss noch ein paar Statistiken, um seine Ausnahmestellung in der zweiten Liga zu zeigen: 3,3 Schüsse pro 90 Minuten (1. in der zweiten Liga), 1,34 Schüsse aufs Tor pro 90 Minuten (3.), 0,48 xG pro 90 Minuten (8.) sowie 12 Kopfballduelle pro 90 Minuten (8.), davon fast 50% gewonnen, sprechen schon eine deutliche Sprache, wie wichtig Ganvoula als Target Man für Bochum ist.
Was mich noch interessieren würde, wäre eure Einschätzung zum defensiven Mittelfeld, also der klassischen 6. Am Beispiel der Rolle des Target Man bei Ganvoula haben wir ja bereits gesehen, dass ihr nicht nur Positions- sondern auch Rollenprofile habt, was ich sehr cool finde. Wir haben relativ viele Achter mit Losilla, Janelt und Eisfeld aber wir haben keinen wirklichen Sechser in der Rolle des „Holding Midfielder“. Momentan füllt Robert Tesche diese Rolle aus aber er steht ja auch bereits am Ende seiner Karriere und kann vom Tempo nicht immer mithalten. Deshalb wäre es interessant zu sehen wie ihr die Rollen unserer defensiven Mittelfeldspieler einschätzt und wer perspektivisch Tesche als „Holding Midfielder“ oder „Deep Lying Playmaker“ ersetzen könnte? Gibt es eventuell ein Äquivalent zu Julian Weigl oder Joshua Kimmich in der zweiten Panama Liga?
Bei den Rollen im Mittelfeld gibt Dir unser Algorithmus recht. Losilla und Janelt werden beide als „Ball winning midfielder“ eingestuft, während Tesche ein „Deep Lying Playmaker“ ist.
Die Herausforderung hinsichtlich eines möglichen Ersatzes habe gerne an die Kollegen weitergeben und wir haben da drei Spieler gefunden, die vielleicht nicht jeder auf dem Schirm hat. Gerade Burnic könnte nach dem Abstieg Dresdens erschwinglich sein.
Saulo Decarli galt im letzten Sommer aufgrund seiner Historie als möglicher Königstransfer des VfL. So richtig angekommen ist er aber in Bochum nicht. Er wurde viel zusammen mit Simon Lorenz in der Innenverteidigung eingesetzt, was in unseren Augen nicht unbedingt ein Pärchen ist, das zu 100% harmoniert. Bei den einzelnen Positionen definiert ihr ja schon verschiedene Rollen für mögliche Transferkandidaten. Kann dabei auch das Zusammenspiel mit den anderen Mitspielern miteinbezogen werden?
Da gebe ich euch Recht. Decarli und Lorenz sind von ihrer Ausrichtung her ähnlich. Beide klassifiziert unser Algorithmus als sogenannte „Ball Winning Defender“, also Verteidiger, die vorrangig aktiv verteidigen, beispielsweise Herausrücken und Tacklen. Leitsch ist vom Typ her ein etwas anderer Innenverteidiger, ein sogenannter „All Around Defender“, also ein Innenverteidiger, der aktiv verteidigen und absichern kann, aber auch in der Spieleröffnung zu gebrauchen ist. Gerade bei Innenverteidigern sollte man da, wenn möglich, einen Mix finden, sprich, nicht zwei gleiche Spielertypen auflaufen lassen. Und um eure Frage final zu beantworten. Ja, auch das Zusammenspiel mit Mitspielern spielt eine Rolle.
Jordi Osei-Tutu wurde als Rechtsverteidiger geholt, blüht aber jetzt auf der offensiven Außenposition sichtlich auf. Geht Euer GSN- Index soweit, dass bei manchen Spielern den Einsatz auf anderen Positionen empfiehlt?
Das kann unser Index natürlich auch. Jeder Spieler wird in über 130 fussballspezifischen Eigenschaften kategorisiert. Der Algorithmus bewertet diese Eigenschaften und ordnet diese Positionen zu. So wird sichtbar gemacht, dass ein defensiver Mittelfeldspieler beispielsweise auch als Außenverteidiger spielen könnte. Zusätzlich bekommen wir den GSN-Index auch für die Alternativposition angezeigt.
Im Fall Osei-Tutu ist „Fullback“, also Außenverteidiger, nach wie vor die beste Position. Die Positionen „Wingback“ (offensiver Außenverteidiger bei einer Dreier-/Fünferkette) und „Winger“ (offensiver Flügelspieler) fallen aber nur minimal ab, so dass der Index eine offensivere Rolle durchaus befürwortet hätte.
Damit haben wir den Part zum VfL Bochum abgeschlossen und kommen zum Ausblick in die Zukunft. Ich bin total beeindruckt wie viele Elemente ihr bereits jetzt schon im Portfolio habt. Wie seht Ihr die Entwicklung des datengetriebenen Scoutings? Wie wird Scouting aus eurer Sicht in 5 Jahren aussehen? Was fehlt noch, was die Methodik noch weiter voranbringen könnte?
Was tatsächlich kommen wird sind Indikatoren auf Basis von Trackingdaten. Da sind wir noch in den Anfängen, da es Trackingdaten aktuell nur für die großen Ligen gibt. Es gibt aber mittlerweile Softwareanbieter, die solche Daten auch ohne spezielle Kameras in den Stadien direkt aus den Videoaufzeichnungen ableiten können. Wenn wir das flächendeckend haben, also auch beispielsweise für die serbische Liga, dann könnte das noch einmal ein Quantensprung werden, da wir dann wirklich im Detail wissen, was jeder Spieler über die 90 Minuten gemacht hat. Daraus könnten wir dann noch detailliertere Spielerprofile ableiten.
Das macht Sinn. An der Universität Bochum wurde von einem Kollegen von mir zum Beispiel ein mobiles Aufnahmesystem entwickelt, das Trackingdaten auch für den Amateur- und Jugendfußball möglich macht.
Das ist eine Entwicklung, die auf jeden Fall an Fahrt aufnehmen wird. Ich war im letzten Jahr im März am MIT in Boston bei einer Sports Analytics Konferenz. Fußball war da nur ein kleiner Part, da natürlich die amerikanischen Sportarten im Fokus standen. Da waren Leute von der NASA und von Disney. Ich war selbst überrascht, was Disney dort sucht. Die haben aber ein Konzept entwickelt, dass es möglich macht, das optimale Abwehrverhalten vorauszuberechnen und graphisch darzustellen. Du kannst dann Live-Daten deiner Viererkette darüberlegen und Abweichungen bestimmen, wenn also z. B. die Abstände zwischen den Spieler nicht stimmen oder ein Spieler zu tief steht und damit das Abseits aufhebt. Bei der Konferenz haben die das mit Mannschaften aus der Major League Soccer (MLS) demonstriert. Es kommt also auch etwas, dass noch tiefer in den taktischen Bereich geht. Auch so etwas könnte in Zukunft bahnbrechend sein, da es hilft, während des Spiels Anpassungen abzuleiten. Wir sind nun selbst dabei, Algorithmen für unterschiedliche Spielsituationen zu lernen.
Wir hatten ja grad schon über ein paar Klubs gesprochen. Sind diese Klubs aus deiner Sicht die Vorreiter? Wer von den großen Klubs ist immer noch komplett „old-school“ und hängt deswegen aktuell noch zurück?
Die wirklichen Vorreiter sind eher kleine Vereine, die voll auf dieses Thema setzen, um gegen die Großen zu bestehen – also wirklich das „Moneyball“ Prinzip. Die Beispiele für mich sind Brentford FC und der FC Midtjylland mit Matthew Benham aus der Wettbranche als Eigentümer, der ein eigenes datengetriebenes Scouting für beide Klubs entwickelt hat. Diese Klubs haben auch über den Tellerrand geschaut was Trainingsmethoden angeht, indem sie einen eigenen Einwurf- und Eckentrainer eingestellt haben, da sie festgestellt haben, dass Standards ein einfacher Weg sind, Tore zu erzielen, wenn du spielerisch limitiert bist. Midtjylland ist mit diesem Konzept dänischer Meister geworden und konnte sich gegen die bisher dahin übermächtigen Kopenhagener Klubs durchsetzen. In Brentford passiert es regelmäßig, dass sie Spieler finden, die auf deutsch gesagt keine Sau kennt und die dann für 15-25 Millionen in die Premier League verkauft werden. So spielt Brentford mit einem sehr kleinen Budget für englische Verhältnisse im oberen Drittel der Championship (englische zweite Liga). Dies sind die beiden Klubs, wo ich wirklich wirken sagen würde, die haben das datengetriebene Scouting vorangetragen.
Es ist ehrlich gesagt schwierig zu sagen welche großen Klubs das Thema eher vernachlässigen. Barcelona hat mittlerweile eine Innovationsabteilung, die grandios ist und das Sport Summit ausrichtet, dass immer sehr spannend ist. Ähnliches gilt für Real Madrid. Die Engländer übertreiben es maßlos. Da sitzen teilweise 30 Datenanalysten in der Scoutingabteilung. Da ist die Frage, ob das noch Sinn macht in dieser Größe.
Ist das also der Trend, dass die Klubs mittlerweile eher etwas Eigenes aufbauen und nicht auf Dienstleister wie euch zurückgreifen?
Genau. Gerade bei den ganz großen Klubs ist das der Fall. Manchester City ist aber zum Beispiel ein Spezialfall. Die haben soviel Kohle, dass sie fast jeden Spieler kaufen können, eine eigene große Datenabteilung betreiben, und trotzdem noch mit vielen Dienstleistern zusammenarbeiten. Die wollen wirklich jede mögliche Information einholen. Das ist teilweise etwas too much. Leverkusen ist da effizienter aufgestellt. Die sind von Personal und Daten fokussierter, da müssen nicht ganz so viele Gigabytes verarbeitet werden. In Italien beginnt es nun auch: Juventus Turin, Inter und AC Mailand haben ebenfalls eigene Analyseabteilungen.
Das macht es für uns jedoch auch schwierig. Wenn wir Daten liefern, wissen wir nicht was die internen Analyseabteilungen mit den Daten letztlich anfangen. Das ist dann deren Sache.
Wo seht ihr euch aktuell auf dem Markt der Daten- und Analysenanbieter? Seid ihr bereits einer der Marktführer oder gibt es noch Steigerungspotenzial?
Mehr geht immer. Für uns wäre grad im deutschen Markt Expansionspotenzial. Wir sind im Ausland präsenter als wir es hier sind. Deutschland ist da tatsächlich ein schwieriger Markt. Wir haben von den 18 Bundesligisten nur 4 Kunden. Das ist noch ausbaufähig.
Es gibt natürlich Firmen wie WyScout und InStat, die viel mehr Mitarbeiter haben und bei denen der Fokus eher auf der Erstellung und Bereitstellung von Scoutingvideos liegt. Mit denen wollen wir überhaupt nicht konkurrieren. Das könnten wir auch gar nicht. Das muss man ganz klar sagen. Da sind wir lieber ein Nischenanbieter und in unserem Bereich sehr gut aufgestellt, grad was das Ausland angeht. Vor Corona war ich sehr viel unterwegs, grad in Europa. Wenn Du dann unsere Analysen präsentierst, merkst Du schon Unterschiede wie die Leute die Inhalte aufnehmen. In anderen Ländern ist man da schon offener.
Vielen Dank für das Interview und die bereitgestellten Analysen. Ich freue mich, dass du unsere Fragen so ausführlich und ehrlich beantwortest hast. Viel Erfolg für die Zukunft. Vielleicht kommt es ja noch zu weiteren Kooperationen zwischen Einsachtvieracht und GSN.
3 Comments
Leave a Reply3 Pings & Trackbacks
Pingback:Konzeptarbeit „Datengetriebenes Scouting im Fußball“ – MillernTon
Pingback:Datenscouting am Beispiel von Adam Dźwigała & dem FC St. Pauli - MillernTon
Pingback:FC St. Pauli 22/23 - Kaderanalyse - MillernTon