venerdì 6 giugno 2014

CLASSIFICA MARCATORI PONDERATA DI SERIE A: UN DIVERSO METODO DI CALCOLO

"Calcio e Altri Elementi" ha il piacere di ospitare un articolo realizzato da Daniele Paserman, professore al Dipartimento di Economia della Boston University. Appassionato di calcio, Daniele mi ha contattato dopo essersi imbattuto nei miei articoli sulla "Classifica Marcatori Ponderata" presenti su questo blog, segnalandomi una sua ricerca fatta una decina di anni fa su un argomento analogo utilizzando un approccio leggermente più complesso e sofisticato del mio (per certi versi più vicino alla "sabermetrica" di cui si parla nel film Moneyball, che avevo citato presentando la mia classifica qui:
Daniele è stato così gentile da accettare il mio invito ad applicare quel suo studio alle ultime due annate del campionato di calcio di Serie A e a condividere risultati e conclusioni con me e con tutti voi lettori del blog. I risultati che ne sono scaturiti mi sembrano molto interessanti, sia singolarmente che confrontati con i miei. Buona lettura!

Qual è il valore di un gol? Partiamo da una semplice definizione: il valore di un gol è uguale al cambiamento nel valore atteso dei punti in classifica che quel gol porta alla propria squadra.

Il  concetto è molto semplice: metti che il risultato di una partita è 0-0 all’ultimo minuto e la squadra di casa segna un gol decisivo proprio allo scadere. Bene, quel gol ha trasformato un pareggio certo in una vittoria certa per la squadra di casa, per cui varrà esattamente 2 punti in classifica. Se invece il risultato al momento della marcatura fosse stato già 3-0 per la squadra di casa, il quarto gol all’ultimissimo minuto è letteralmente ininfluente, dato che non cambia di una virgola il risultato finale della partita: vittoria certa della squadra di casa prima del gol, e vittoria certa della squadra di casa dopo il gol.




Ora, armati di questa definizione, non ci resta che stimare le probabilità di vittoria in casa, pareggio, e vittoria in trasferta per ogni partita (ogni combinazione di i e j), ogni minuto di gioco t, e ogni scarto possibile g.


Vediamo quindi qual è il valore di un gol segnato dalla squadra di casa in un’ipotetica partita del campionato 2013-2014. Ho scelto Atalanta e Genoa come squadre rappresentative, rispettivamente, della squadra di casa e in trasferta “media” del campionato (in base al numero di gol segnati in casa e numero di gol subiti in trasferta).
Alcune cose da notare in questo grafico:
- C’è molta eterogeneità nel valore di un gol: i gol che cambiano il risultato (in cui cioè lo scarto nel punteggio dopo il gol è uguale a +1 o a 0) valgono sempre di più rispetto ai gol che consolidano una situazione di vantaggio (scarto uguale a +2 o +3) o a quelli che accorciano le distanze (scarto uguale a -1 o -2).
- C’è anche molta eterogeneità nel valore del gol a seconda del minuto in cui viene segnato. Se per esempio nel primo tempo il valore di un gol del vantaggio è più o meno uguale al valore di un gol del pareggio, nel secondo tempo questi valori divergono in maniera sostanziale con l’avvicinarsi del 90’ minuto.
- Ci sono anche delle dinamiche interessanti: per esempio, il valore di un gol che porta la squadra di casa in vantaggio di 2 gol all’inizio aumenta con il passare del tempo (anche se non è facilissimo vederlo da questo grafico), per poi crollare nettamente  verso la fine della partita.

Per il momento, tutto molto logico e intuitivo. Estendiamo un po’ l’analisi per vedere delle proprietà addizionali di questa misura. Ad esempio, valgono di più i gol in casa o in trasferta? Rimanendo sempre al nostro esempio della partita “media” del campionato 2013-104, Atalanta-Genoa:

In questo caso vediamo che un gol che porta in vantaggio il Genoa è leggermente più pesante di un gol che porta in vantaggio l’Atalanta, mentre il rapporto si inverte per un gol del pareggio, e addirittura la differenza è più marcata. La spiegazione di questo sta nel fatto che la squadra in trasferta ha comunque una probabilità più bassa di segnare. Per cui, un gol che porta il Genoa in vantaggio in trasferta ha un effetto maggiore sulle sue probabilità di vittoria, pareggio e sconfitta. Invece, se l’Atalanta si era trovata in svantaggio e riesce a pareggiare nel corso del primo tempo, questo gol ha un peso maggiore, perché è maggiore la probabilità che l’Atalanta riesca a completare la rimonta.
Per finire, andiamo a guardare l’effetto della qualità della squadra sul valore di un gol. Facciamo giocare all’Atalanta due altre partite ipotetiche, contro Juventus (miglior difesa in trasferta del campionato) e Livorno (difesa peggiore).

La qualità dell’avversario ha un’influenza importante sul valore di un gol del vantaggio. Più è forte l’avversario, maggiore è il valore del gol. Vale qui lo stesso ragionamento fatto prima per spiegare la differenza tra un gol del vantaggio segnato dalla squadra di casa e dalla squadra in trasferta. Per quanto riguarda i gol del pareggio, la differenza tra i valori si assottiglia, e si notano anche delle dinamiche interessanti: all’inizio della partita, i gol contro squadre molto forti e molto deboli hanno un valore relativamente basso rispetto a quelli contro squadre di abilità media, ma con il passare del tempo, il gol del pareggio contro una squadra di bassa classifica aumenta di valore più rapidamente, perché aumenta in maniera sostanziale la probabilità di completare la rimonta.
Mentre il motivo per cui il valore del gol dipende dal punteggio al momento della segnatura e dal minuto in cui viene realizzato il gol è abbastanza chiaro, il fatto che il valore dell’avversario influenzi il valore del gol è meno evidente. Per questo motivo, presenterò la graduatoria dei gol sia in base alla formula completa descritta in precedenza, ma anche in base a una formula semplificata in cui la qualità dell’avversario non influenza il valore di un gol.

Ovviamente è possibile analizzare ulteriormente anche altri tipi di gol, e altre combinazioni di qualità delle squadre. Ma il quadro che emerge chiaramente è che non tutti i gol valgono uguale. È quindi interessante vedere come cambierebbe la classifica dei marcatori se si tiene conto del valore dei gol.
Dopo questo lungo preambolo, vediamo quindi la classifica marcatori pesata per i campionato di Serie A 2012-2013 e 2013-2014.

STAGIONE 2012/13

STAGIONE 2013/14

Le tabelle mostrano il valore del gol in base alla formula descritta in precedenza (colonna 2), e in base a una versione semplificata della formula in cui il valore di un gol è indipendente dalla qualità dell’avversario (colonna 3). È facile constatare che i valori delle due colonne sono pressoché identici, il che evidenzia come la correzione per la qualità dell’avversario (che forse avrebbe potuto sollevare qualche dubbio) alla fine non influenza più di tanto la graduatoria. La quarta colonna mostra il valore approssimato del gol in base alla formula postata in precedenza da Marco De Santis su questo blog (http://mds78.blogspot.it/2014/05/classifica-marcatori-ponderata-serie.html ). La colonna 5 mostra il computo semplice dei gol, mentre la colonna 6 mostra il valore medio dei gol segnati da ogni attaccante.
Se è vero che nel complesso le due graduatorie si assomigliano molto, ci sono tuttavia delle differenze notevoli per alcuni giocatori. Per esempio, nella stagione 2012-2013 Cavani vince il titolo di capocannoniere con largo scarto su Di Natale; questo scarto però si assottiglia in base alla formula De Santis (che tiene conto solo del punteggio al momento della segnatura, ma non del minuto in cui viene segnato il gol), e Di Natale riesce addirittura nel sorpasso in base alla formula completa. I gol di Di Natale hanno avuto un valore medio di 0,83 punti in classifica per l’Udinese, rispetto ai soli 0,64 punti in classifica dei gol di Cavani, e ciò ha permesso all’attaccante dell’Udinese di catturare il titolo di “capocannoniere ponderato”. Da notare come il valore relativamente basso dei gol di Cavani non dipende solo dal fatto che, giocando in una squadra di alta classifica, è più probabile che i suoi gol arrivino a risultato già acquisito e perciò valgano di meno. Basta guardare il suo compagno di squadra Hamsik nella stessa stagione, che è riuscito addirittura a mantenere una media di più di un punto in classifica per gol. Nelle tabelle qui sotto la lista completa di tutti gol di Cavani e Hamsik nella stagione 2012-2013.


Ci sono anche altri giocatori che vedono le loro quotazioni calare nettamente in base alla classifica dei gol pesata. Prendiamo ad esempio El Shaarawy nella stagione 2012-2013: 16 gol totali, buoni per un terzo posto nella classifica marcatori non pesata, che diventano però 11.75 e un quarto posto nella graduatoria De Santis, ma meno di 9 punti in base alla classifica ponderata, e un crollo in graduatoria fino al nono posto. Cosa spiega questo calo del milanista? La spiegazione sembra stare nel fatto che ben 6 dei 16 gol di El Shaarawy sono arrivati nei minuti finali a risultato già acquisito, e 4 dei rimanenti 10 sono stati gol del pareggio, che, come si è visto,  valgono in genere un po’ meno di gol del vantaggio.


Altrettanto eclatanti sono i casi di Toni e Tevez nella stagione 2013-2014. Il secondo e il terzo classificato nella classifica semplice scendono, rispettivamente, al nono e al dodicessimo posto. Nel caso di Toni, sembra che le ragioni del calo siano da ricercarsi nell’alta percentuale di gol segnati in casa (14 su 20), e di gol segnati nei primi minuti della partita (7 dei suoi 9 gol cambia-risultato sono arrivati nel primo tempo).
Anche per Tevez la storia è simile: 8 dei suoi gol cambia-risultato sono arrivati nel primo tempo, e il suo punteggio è ulteriormente abbassato da alcuni gol venuti nei minuti finali che sigillavano una goleada della Juve.




Nessun commento:

Posta un commento