Der Vergleich von College Football-Teams ist essentiell, denn schließlich spielen, zumindest in der Theorie, 130 Teams vier Playoff-Teilnehmer in 12 bis 13 Spielen aus. Da ist es logisch, dass direkte Vergleiche von Top-Teams in der regulären Saison eher die Ausnahme als die Regel sind. Deshalb gibt es unterschiedliche Ansätze und Modelle, die Qualität der Teams zu gewichten.

Neben dem College Football-Playoff-Komitee, der AP Top-25- und der Coaches Poll, die auf Basis von Abstimmungen ein Ranking erstellen, existieren auch einige sehr interessante quantitative Möglichkeiten.

Aber nicht nur das: Das primäre Ziel dieser Modelle ist die Vorhersehbarkeit von College Football-Spielen zu erhöhen und nicht die Bewertung des jeweiligen Team Resümees. Dieser Artikel wird dich auch interessieren, selbst wenn du nicht besonders zahlenaffin bist. Die vorgestellten Methoden geben sich größte Mühe auch Laien ein verständliches Bild zu vermitteln.

Total Stats: Warum sie nicht die ganze Wahrheit sagen

Reine Spielstatistiken (Total Stats), wie du sie zum Beispiel von Boxscores kennst, liefern zwar einiges an Zahlen, Daten und Fakten, sind aber häufig nicht ausreichend, um umfassende Lehren daraus zu ziehen. Auch große Portale, wie Sports Reference sammeln zwar Unmengen an Daten, aber ihnen fehlt der Zusammenhang.

Die Modelle, die ich dir nun vorstelle, bedienen sich stellenweise dieser Daten und bringen sie dann in Relation und Kontext. Mit Ausnahme der Grades von Pro Football Focus, handelt es sich ausschließlich um rein quantitative Methoden. Sie basieren auf der Auswertung von einzelnen Spielzügen.

Punktebasierende Computer-Modelle

Ein Blick in die Datenbank von Ken Massey reicht, um festzustellen, dass es unfassbar viele Computermodelle gibt, die es ermöglichen, College Football Teams zu ranken. Sie sind zwar schon wesentlich fundierter als eine Reihe von Total Stats, stehen allerdings noch auf etwas wackeligem Fundament.

Grundlage dieser Modelle ist meist der Margin of Victory, also der Punkteabstand zum Gegner im Falle des Sieges und der Strength of Schedule, also die Stärke der jeweiligen Gegner, gegen die das Team spielt.

EPA – Exptected Points Added

EPA ist ein Modell, welches auf Play-by-Play-Bewertungen basiert und sowohl für die NFL als auch für den College Football zur Anwendung kommt. Im Detail: EPA bewertet die Effizienz von Spielzügen. Die Range der Bewertung liegt dabei immer zwischen -7 und + 7 Punkten. Grundlage des Modells sind historische Daten, die es ermöglichen einen Erwartungswert pro Spielzug zu ermitteln.

EPA-Beispiel aus der Praxis

Eine Offense, die einen Drive startet, hat das natürliche Ziel zu punkten. Jeder abgeschlossene Spielzug bekommt je nach Ausgang einen Wert, der sich dem Wert von 7 Punkten entweder annähert, wenn der Spielzug „erfolgreich“ war. Oder er bewegt sich von den 7 Punkte weg, wenn der Spielzug kein Erfolg war.

Ein drei Yard Lauf, der zu einem First Down führt, wird besser bewertet als ein drei Yard Lauf, der zu einem 4th and 5 führt. Rushing-Touchdowns von der 1 Yard Linie werden niedriger bewertet als beispielsweise ein Passing-Touchdown über 33 Yards. Da bei Letzterem der Weg an die 1 Yard Linie wesentlich schwieriger war, als das Erzielen des Touchdowns aus der kurzmöglichsten Distanz.

Grob zusammengefasst: Spielzüge mit einem positiven EPA-Wert sind erfolgreiche Spielzüge. Spielzüge mit einem negativen EPA-Wert sind erfolglose Spielzüge. Dies ist ein Weg den Erfolg eines Play, die sogenannte Success Rate zu ermitteln.

Eigene EPA-Analysen erstellen

Mit Hilfe von entsprechenden Tools, wie „RStudio“ und EPA-Quellen, wie „nflscrapR“ oder „cfbscrapR“ lassen sich umfangreiche und vielfältige Auswertungen erstellen und visualisieren. Wie dieses Beispiel zeigt:

Bild

Wer mehr zur Entstehung und Anwendung von EPA lesen möchte, dem empfehle ich den Artikel von Brian Burke und diese ausführliche Erläuterung von Alok Pattani von ESPN.

S&P+ – Das College-only Modell

S&P+ ist ein kombiniertes Bewertungssystem nur für College Football Teams, welches vom großartigen Bill Connelly (ehemals SBNation, jetzt ESPN) entwickelt wurde. Connellys jährliche, detailreiche Previews sind eine Pflicht-Lektüre für alle College Football Fans. S&P+ basiert dabei auf den vier Faktoren: Explosivität (Explosiveness), Effizienz (Efficiency), Drive Effektivität (Finishing drives) und Feldposition (Field Position).

S&P+ schließt Faktoren aus, die größtenteils vom Zufall abhängig sind. So misst es Explosiveness mit Points per Play, einem Äquivalent zu EPA. Efficiency wird in Success Rate gemessen, wobei die Success Rate in diesem Fall bedeutet, dass das angreifende Team bei First Down 50 Prozent der zum nächsten First Down zu erzielenden Yards erspielt. Bei Second Down 70 % und bei Third Down 100%.

Diese beiden ersten Bestandteile sind die Basis von S&P (Success Rate & equivalent Points per play), welches Connelly bis 2015 nutzte.

Finishing Drives und Field Position

Das „+“ kommt von den anderen Bestandteilen Finishing Drives und Field Position. Finishing Drives werden mit dem Punktedurchschnitt pro Trip innerhalb der gegnerischen 40 Yard Linie ermittelt. Die Field Position ist die durchschnittliche Feldposition, an dem ein Drive startet. Der S&P+ Wert kann als Gesamtwert für alle drei Units und für Offense, Defense und Special Teams separat errechnet werden.

Der Ligadurchschnitt ist immer der Wert 0. Wenn ein Team z.B. einen S&P+ Gesamtwert von 22,5 Punkten aufweist, ist es 22,5 Punkte besser als der Liga-Durchschnitt. Die Differenz zwischen zwei Teams ergibt dann den Point Spread, die eines der Teams favorisiert. Für Offenses gilt, je höher der S&P+ Wert, desto besser die Offense. Für Defenses gilt, dass der Wert möglichst niedrig sein sollte. Special Teams haben im Vergleich zu Offense und Defense nur einen geringen Einfluss auf den Gesamtwert.

Ein Beispiel aufgeteilt für die einzelnen Conferences und Divisions findest Du hier:

Wer über die Entstehung von S&P+ mehr erfahren möchte, dem empfehle ich einen Blick in das Buch „Study Hall: College Football, Its Stats and Its Stories“ von Bill Connelly aus dem Jahr 2013.

ESPN FPI – Football Power Index

Der Football Power Index (FPI) von ESPN nutzt ebenfalls Expected Points Added. Zusätzlich passt es durch ein sogenanntes Simple Rating System das Ganze am jeweiligen Gegner des zu analysierenden Teams an.

Das erwähnte Simple Rating System berücksichtigt unter anderem die Kaderstärke des jeweiligen College Football Teams. Der Schwerpunkt liegt auf den zurückkehrenden Spielern der vergangenen Saison. Ob es einen neuen Head Coach gibt oder nicht und wie die aktuelle Recruiting Klasse bewertet wurde, gewichtet es ebenfalls stark. Die Preseason FPI für 2020 erschienen am 17. Februar bei ESPN.

FEI – Fremeau Efficency Index

Das Modell von Brian Fremeau basiert auf Punkten pro Ballbesitz, die wiederum mit den zu erwartenden Punkten ab der jeweiligen beginnenden Feldposition verglichen werden. Die Feldposition zu Beginn des Drives ist insofern relevant, als dass jedes Yard näher an der gegnerischen Endzone eine höhere Wahrscheinlichkeit mit sich bringt, Punkte zu erzielen.

Quelle: bcftoys.com

Massey-Peabody Modell

Das Massey-Peabody Computer Modell ist benannt nach dem Hochschulprofessor Cade Massey und dem Wettexperten Rufus Peabody. Das Modell basiert auf folgenden vier Pfeilern: Laufspiel, Passspiel, erzielte Punkte und Erfolgsrate. Auf Basis der Auswertung jedes einzelnen Plays werden Spielzüge Kontexten zugeordnet.

Die da wären: Heimvorteil, Spielsituation (u.a. Punktedifferenz zwischen den Mannschaften oder der verbleibenden Spielzeit, Gegner- und Ligastärke). Auch diese Daten sind, wie die von Fremeau kostenlos zugänglich auf der Webseite von Massey und Peabody.

PFF Grades von Pro Football Focus

Im Gegensatz zu den rein quantitativen Methoden der bislang erwähnten Modelle entstehen die Grades von Pro Football Focus durch qualitative Auswertungen ihrer Mitarbeiter. Dabei wird jeder Spielzug einem in einer Range von -2 (sehr schlecht) und +2 (sehr gut) bewertet. Die Skala erlaubt eine Bewertung in 0,5er-Schritten.

Diese Bewertungen werden dann in den jeweiligen Spielkontext eingeordnet und dann in einer Skala von 0-100 dargestellt. Einen ausführlicher Artikel zur Entstehung der Grades findest Du hier.

Schwerpunkt des kostenpflichtigen Angebots von PFF sind die NFL-Daten. Aber PFF bewertet mittlerweile auch einen Großteil der College Football Spiele. Dies ermöglicht eine fundierte Berichterstattung unter anderem zum NFL-Draft. Leider stehen die College-Daten aktuell nicht in Form eines Datenbankzugangs zur Verfügung. Sie werden punktuell in Blog-Artikeln, Scout-Reports oder den Social Media Kanälen von PFF veröffentlicht.

Fazit

Es existiert ein großes Angebot an Analytics-Modellen, die für den College Football zum Einsatz kommen. Viele dieser Daten sind frei zugänglich und ermöglichen auch dir als Fan einen Einblick in die Stärke-Verteilung der jeweiligen Teams zu werfen. Bis auf die Grades von PFF haben aber auch diese Modelle gewisse Limitierungen, da sie nur so gut sein können wie ihre Ausgangsdaten.

Formationen, Playcalls und auch die individuellen Stärken und Schwächen von Spielern werden kaum erfasst. Sich eine Meinung ausschließlich auf Grundlage dieser Modelle zu bilden, ist nach meiner Meinung zu kurz gegriffen. Aber sie sind ein solider Startpunkt auf den sich aufbauen lässt. Für an Wetten interessierte Fans können sie aber eine gute Hilfestellung sein.

Peter Schindler
Peter ist College Football Fan mit Leib und Seele. Neben den Oklahoma Sooners und der Big 12 verfolgt er alle anderen Conferences regelmäßig und interessiert sich für alle möglichen Details der Nachwuchsliga. Insbesondere das Recruiting von High School Spielern, den NFL-Stars von morgen, beobachtet er intensiv.