Cosa ci dicono le statistiche sull'inizio di campionato
L'anomala stagione 2020/21 ha appena superato, non senza polemiche, l'ennesima pausa delle nazionali. Ad oggi, in Serie A si sono giocate 7 giornate, ovvero quasi il 20% del totale. In una stagione così incerta, le statistiche avanzate potrebbero risultare ancora più importanti per cercare di analizzare in maniera razionale ciò che sta accadendo.
La pausa per le nazionali costituisce un momento ideale per fermarsi ed analizzare con maggiore attenzione i dati disponibili.
Se da un lato è chiaro che sole sette giornate non rappresentano un campione statisticamente ampio, dall'altro le statistiche avanzate permettono di scindere maggiormente i risultati dalle prestazioni rispetto alle classiche statistiche. Inoltre è stato più volte dimostrato il valore predittivo di alcune metriche, e degli expected goals in particolare. L'analisi di questi valori può quindi rappresentare uno strumento prezioso per cercare di orientarsi all'interno della complicata situazione attuale e tentare di identificare possibili trend futuri.
Prima di iniziare, un importante disclaimer: a causa della partita non giocata tra Juventus e Napoli, queste due squadre hanno avuto un minutaggio inferiore in campionato. Nell'osservazione di alcune statistiche sarà utile considerare questo fattore. Ovviamente i valori si sarebbero potuti normalizzare sui minuti effettivamente giocati, ma essendo solamente due le squadre interessate da questa condizione, si tratta di un passaggio evitabile.
Valutazione della performance
Il principale indicatore statistico che può essere preso in considerazione per tentare di valutare le prestazioni offerte dalle squadre, a dispetto dei soli risultati, è quello degli expected goals e in particolare quelli non generati da calci di rigore, ovverosia i non-penalty expected goals. Per aumentare il campione di dati analizzati, visto anche il numero limitato di partite disputate, prenderemo in considerazione i npxG pubblicati da due diverse fonti, che utilizzano modelli matematici diversi per il calcolo degli expected goals. In particolare faremo riferimento al portale FBref, che pubblica dati forniti da StatsBomb, e il sito understat.com, che utilizza un proprio modello per il calcolo degli expected goals.
Gli expected goals
I grafici di seguito mostrano i npxG delle squadre di Serie A stimati dai due modelli.
Secondo i dati pubblicati da FBref le squadre con la migliore produzione offensiva sono Inter, Roma, Atalanta, Milan e Napoli (con una partita in meno).
Osservando i dati understat, nonostante alcune differenze nelle stime, le squadre con i valori migliori sono le stesse. La principale differenza è l'inversione di posizione tra Roma e Inter, dovuta allo scostamento tra i valori attribuiti dai due modelli alla prestazione della squadra giallorossa. Mentre la differenza tra gli npxG dell'Inter tra le due fonti è minima (14,9-15), il modello di understat ha previsto oltre due gol in più dai tiri effettuati dalla Roma rispetto a quello di StatsBomb.
Anche per quanto rigaurda le squadre con una minore produzione offensiva i dui modelli si discostano poco, individuando in entrambi i casi Spezia, Genoa e Crotone come quelle con le performance peggiori fino ad ora.
Under e over performance
Nei due grafici seguenti vengono messi in relazione i npxG dei due modelli con i gol realmente realizzati (rigori esclusi) dalle squadre.
Le linee diagonali, bisettrici del quadrante, rappresentano il teorico punto di equilibrio: le squadre che di posizionano al di sopra hanno realizzato più gol delle aspettative statistiche, mostrando una overperformance. Al contrario, le squadre al di sotto della linea hanno segnato meno di quanto previsto dai modelli, e sono in una condizione di underperformance.
L'Inter, nonostante sia stata più volte sottolineata un'incapacità di sfruttare a pieno le occasioni da gol create, si trova in realtà in equilibrio quasi perfetto tra reti segnate ed attese per entrambi i modelli. Anche la Juventus si trova in una situazione equilibrata, senza evidenziare scostamenti significativi dalla performance attesa. Per quanto riguarda il Milan, gli ottimi risultati delle prime giornate non sono associati a prestazioni particolarmente sopra la media dei suoi giocatori. Al contrario, a livello di squadra i rossoneri registrano una certa underperformance tra quanto prodotto e le reti segnate, senza dimenticare gli errori dal dischetto non catturati dagli npxG. Da sottolineare inoltre i valori modesti della Lazio, che ha prodotto meno npxG, tra le altre, anche di Bologna e Fiorentina.
La situazione è praticamente invariata anche secondo le statistiche di understat.
Le performance più rilevanti
I due grafici seguenti evidenziano i livelli di under e over performance delle squadre, quantificando esplicitamente la differenza tra non-penalty gol segnati ed attesi. Secondo entrambi i modelli la squadra che è maggiormente andata oltre le aspettative è lo Spezia, grazie soprattutto alle performance individuali sopra le attese di Pobega e Galabinov.
Altri giocatori andati nettamente oltre le previsioni dei modelli sono Simenone (già 5 gol segnati con poco più di 3 npxG), Joao Pedro e il Papu Gomez, contribuendo alle overperformance di Cagliari e Atalanta. Una overperformance individuale notevole è stata segnata anche da Lautaro Martinez, che ha segnato 4 gol a fronte di meno di 2 npxG, compensando a livello di squadra le performance negative di Perisic e soprattutto Vidal. Il cileno non ha segnato nessun gol nonostante secondo il modello di undestat abbia generato addirittura più npxG di Lautaro.
Anche la Roma evidenzia una underperformance, dovuta in particolare a quelle individuali di Dzeko e Mkhitaryan. Il bosniaco è storicamente un attaccante poco efficiente, che non concretizza mai l'intera mole di occasioni che genera. L'ex Arsenal è al momento il giocatore che genera più npxG assieme a Lukaku in Serie A, e nonostante la recente tripletta, ha segnato meno di quanto atteso.
A livello di squadra sono davvero notevoli i numeri dell'Udinese, con un gap tra non-penalty gol segnati e attesi stimato in -4,30 e -6,37 dai due modelli, davvero alto se si considera che si sono giocate solo 7 partite. Quasi tutti i giocatori della squadra friulana hanno segnato meno di quanto atteso, ma l'underperformance generale è dovuta principalmente alla prestazione individuale estremamente negativa di Kevin Lasagna, che non è ancora riuscito a segnare una rete a dispetto di oltre 3 non-penalty goal attesi.
Prestazione difensiva
Gli expected goal possono essere uno strumento utile anche per quantificare la performance difensiva delle squadre, permettendo di evidenziare quanto concesso agli avversari in termini di tiri ed occasioni da gol a dispetto delle reti effettivamente subite.
In termini assoluti, al momento il Napoli è la squadra con la miglior prestazione difensiva, anche se in questo caso la partita giocata in meno favorisce questa statistica. Dopo gli azzurri le migliori prestazioni difensive sono state quelle di Udinese e Juventus.
Nei grafici seguenti vengono correlati i xG concessi da ogni squadra secondo i modelli statistici con i gol effettivamente incassati. In questo caso le squadre che si posizionano al di sopra della linea diagonale hanno incassato più gol di quanto concesso, al contrario quelle al di sotto hanno subito meno reti rispetto alle attese statistiche.
Analizzando gli scostamenti tra i valori osservati e quelli attesi, emerge di nuovo l'Udinese, che secondo entrambi i modelli ha subito più reti rispetto alle occasioni concesse.
Nell'osservare under e over performance negli xG subiti, è difficile individuare in che proporzione questi scostamenti siano dovuti a prestazioni notevoli (in positivo o in negativo) dei tiratori o dei portieri. Potrebbe essere questo il caso dell'Hellas Verona, in cui l'evidente periodo di forma del portiere Marco Silvestri è probabilmente una delle principali motivazioni della notevole prestazione difensiva della squadra veneta, che ha subito circa 7 reti in meno di quanto atteso dai modelli, un'enormità su sole 7 giornate di campionato.
Il pressing
Un altro aspetto di estrema rilevanza nella valutazione della performance di una squadra è il pressing.
Non si tratta di un aspetto facilmente quantificabile, come tiri e gol, ma anche in questo caso le statistiche avanzate possono rivelarsi molto utili fornendo validi strumenti di valutazione ed interpretazione. Per quanto riguarda la valutazione dell'intensità di pressing, una metrica che negli ultimi anni è diventata preponderante nella football analytics è il PPDA (Passes Allowed per Defensive Action). Il valore del PPDA è dato dal rapporto tra i passaggi effettuati dagli avversari (squadra attaccante) e il numero di azioni difensive effettuate dalla squadra difendente. Sia i passaggi che le azioni difensive considerati sono quelli che avvengono nei primi 60 metri di campo avversario, individuati per convenzione come l'area di campo in cui la squadra applica il pressing.
Per banalizzare, il PPDA rappresenta il numero di passaggi che mediamente la squadra difendente concede agli avversari prima di eseguire un'azione difensiva, a prescindere dal suo esito. Un aspetto importante è che nel computo delle azioni difensive si considerano le palle recuperate, gli intercetti, i tackle (tutti, non solo quelli vinti) e i falli. Questo significa che il PPDA è una metrica che si propone di rappresentare a livello squisitamente quantitativo l'intensità, l'aggressività e la propensione al pressing della squadra, senza fornire indicazioni su efficacia, efficienza o tipologia di pressione.
L'intensità di pressing - PPDA
Nel grafico seguente vengono mostrate le squadre con i rispettivi valori di PPDA. Per interpretare il dato, è sufficiente considerare che più il valore è basso, meno passaggi la squadra concede agli avversari senza eseguire un'azione difensiva, al contrario un valore alto indica che la squadra permette agli avversari di eseguire più passaggi prima di intervenire. Semplificando, una squadra con un PPDA basso applicherà un pressing maggiormente intenso (ma non necessariamente efficace) di una con un valore alto.
I dati indicano che la squadra che mediamente concede meno passaggi agli avversari prima di un'azione difensiva è l'Inter, segno che almeno dal punto di vista quantitativo i meccanismi di pressing della squadra di Conte sono ancora operativi. Non sorprende vedere tra le squadre più intense Hellas Verona, Milan, Bologna e Atalanta. Più indietro la Juventus: nonostante Pirlo abbia indicato riaggressione e contro-pressione come princìpi cardine del calcio da lui desiderato, sembra che per il momento questi meccanismi non siano ancora stati sufficientemente assamilati dalla squadra, o non vengano applicati con continuità.
Il Napoli ha il terzo valore peggiore del campionato: i partenopei sono passati da un PPDA di circa 9 nella prima parte della stagione 2019/20 sotto la guida prevalente di Ancelotti a un 11,15 complessivo per lo scorso campionato, arrivando al 13,07 attuale. I dati confermano il cambio di approccio iniziato da Gattuso nella scorsa stagione e continuato in quella corrette, con la scelta di applicare una difesa più bassa e sfruttare maggiormente le transizioni lunghe, confermato anche dalla scelta di puntare su giocatori estremamente abili negli spazi ampi come Osimhen e il redivivo Lozano.
Infine il Parma si conferma la squadra con il valore di PPDA più alto delle Serie A, come nel 2019/20. Se lo scorso anno l'atteggiamento fortemente attendista della squadra di D'Aversa era noto, sembra che il radicale cambio di stile di gioco che avrebbe dovuto portare Liverani non si sia ancora concretizzato, almeno sotto questo punto di vista.
Come detto il PPDA è una metrica quantitativa che non permette di valutare la qualità e l'efficacia del pressing. Per provare ad aggiungere un'informazione maggiormente qualitativa, nel grafico sopra il PPDA viene messo in relazione con un altro indicatore: quello delle pressioni effettuate con successo.
Questa statistica viene raccolta da StatsBomb e viene descritta come "il numero di volte che la squadra recupera la palla entro 5 secondi dall'applicazione del pressing". Probabilmente la porzione di campo valutata da questa statistica non coincide con quella del PPDA, ma può comunque essere un'utile integrazione alla valutazione dell'indice. Nel grafico, le squadre che si trovano al di sopra della linea hanno un'efficienza nel recupero palla tramite il pressing superiore al loro PPDA. Non sorprende vedere tra le migliori squadre Milan, Atalanta e Lazio, come tra le peggiori il Torino. Molto bassa l'efficienza del Verona, su cui però incide probabilmente l'intensità estremamente elevata.
Anche la Roma, nonostante un valore di PPDA paragonabile a Lazio ed Atalanta, evidenzia un numero di pressing portati a termine con successo notevolmente più basso. Una possibile interpretazione di questo dato è che i meccanismi di pressing implementati da Fonseca, nonostante la buona intensità, siano ancora lontani dall'essere efficaci, soprattutto rispetto a quelli di due squadre molto consolidate come la Lazio e la Dea.
Resistere al pressing - OPPDA
Una metrica speculare al PPDA è il cosiddetto OPPDA, ovvero il rapporto tra i passaggi effettuati dalla squadra e le azioni difensive subite dagli avversari nei primi 60 metri di campo. Questo indice evidenzia quanti passaggi riesce ad effettuare mediamente una squadra senza essere interrotta da azioni difensive avversarie. Una possibile interpretazione di questo indice è legata alle capacità e al tipo di costruzione della squadra. Un valore alto indica un elevato numero di passaggi nei primi due terzi del campo e quindi una costruzione più articolata (o potenzialmente farraginosa). Un valore basso può essere indice in una manovra più rapida e diretta. Anche in questo caso l'indicazione è puramente quantitativa, e non è quindi possibile fare considerazioni dirette sulla qualità e l'efficienza della costruzione.
Nel grafico sopra le squadre sono ordinate secondo l'OPPDA. Ai valori più alti sono associate le squadre che riescono ad eseguire mediamente più passaggi nei propri primi metri di campo. Le due squadre con i valori più alti sono Inter e Napoli, in linea con la loro ricerca quasi spasmodica della costruzione bassa al fine di attirare la pressione avversaria e creare spazi da attaccare alle loro spalle. Al terzo posto il Sassuolo, che ha avuto un ottimo avvio di campionato e basa il proprio gioco sulla circolazione del pallone per disordinare lo schieramento difensivo avversario e ricercare una superiorità posizionale, sia in fase di prima costruzione che in zone più avanzate del campo.
Molto basso il valore del Verona, nonostante i buoni risultati dell'avvio di campionato, ma in linea con le peculiarità del gioco estremamente diretto e verticale di Juric. Risulta forse più sorprendente il valore della Fiorentina visto il potenziale e la qualità a disposizione dei viola, e di Torino e Parma, i cui due allenatori prediligono un calcio di possesso in contrapposizione con questi dati.
La fase di possesso
Per concludere, qualche breve considerazione su aspetti legati alla fase di possesso. Invece di soffermarmi su statistiche classiche ma poco indicative, come il numero di passaggi totali effettuati e la loro accuratezza o la percentuale di possesso palla, ho cercato di restituire tramite i dati una qualche misura della capacità delle squadre di imporre supremazia territoriale sugli avversari.
Nel grafico sopra le squadre sono ordinate in base al numero di passaggi effettuati nell'ultimo terzo di campo; l'intensità del colore della barra è invece legata al numero di passaggi effettuati all'interno dell'area di rigore avversaria. L'Inter è la squadra che effettua più passaggi nelle zone avanzate di campo, mentre è seconda dietro all'Atalanta per numero di passaggi in area. La terza squadra per numero di passaggi in area avversaria è il Milan con un valore di 77. Secondo questi indicatori è stata buona la prestazione del Bologna, con 236 passaggi nell'ultimo terzo di campo di cui 66 in area, un valore quasi identico a quello della Lazio (67) e migliore, tra le altre, di Sassuolo e Roma. Più indietro la Juventus, con soli 53 passaggi in area avversaria, valore su cui però influisce la partita giocata in meno.
L'ultimo grafico è simile al precedente: le squadre sono questa volta ordinate per numero di tocchi in zona d'attacco, e l'intensità di colore della barra è legata al numero di tocchi in area avversaria. In questa rappresentazione l'Inter rimane la migliore squadra fin'ora, seguita da Atalanta, Milan e Napoli. Per quanto riguarda i tocchi in area avversaria il Milan si avvicina molto all'Inter (220 contro 221) e supera l'Atalanta (217). Il quarto valore migliore è quello della Roma (200).
Cosa ci dicono le statistiche?
Proviamo quindi a riassumere alcune considerazioni di carattere generale emerse osservando i dati.
L'Inter, nonostante le difficoltà e i risultati non positivi, si posiziona bene secondo diversi indicatori, con performance solide rispetto a produzione offensiva, pressing e possesso in zone avanzate. A livello offensivo i dati non suggeriscono una particolare underperformance. Segno che forse i problemi della squadra nerazzurra non sono stati legati a una scarsa capacità sotto porta, come più volte ipotizzato. Alcune prestazioni individuali negative sono infatti state compensate dall'overperformance di Lautaro. I maggiori problemi sembrano legati alla fase difensiva, visto il valore di expected goals concessi. Inoltre l'Inter ha subito più gol di quanto previsto dai modelli, e questo potrebbe essere correlato a diversi errori individuali, anche di Handanovic, che si sono susseguiti nelle prime giornate.
Valutare i dati della Juventus è più complicato, vista la partita giocata in meno. In generale però anche le statistiche sembrano confermare l'impressione che la squadra sia ancora un po' indietro nel suo processo di sviluppo. In particolare i dati relativi al pressing evidenziano che i meccanismi di recupero palla e riaggressione sono ancora lontani dall'idea iniziale di Pirlo. Per ora la componente che sta funzionando meglio è quella della fase difensiva, con un buon valore di xG concessi.
I risultati del Milan non sembrano casuali. I valori degli expected goals sono positivi, sia offensivamente che difensivamente, e la squadra di Pioli è una delle migliori per PPDA e pressing riusciti.
Il Napoli, al netto del minor numero di minuti giocati, ha al momento la migliore prestazione difensiva. Il cambio di stile di gioco portato avanti da Gattuso, con difesa prudente, fasi di pressing limitate e costruzione bassa è probabilmente quello più riconoscibile osservando le statistiche.
I numeri offensivi dell'Atalanta, ancora molto positivi, sembrano in fase di normalizzazione rispetto a quelli fuori scala della scorsa stagione. In generale tutte le statistiche della squadra bergamasca sembrano comunque piuttosto solide.
I dati sembrano confermare l'avvio di campionato del Sassuolo. I neroverdi si posizionano bene per quanto riguarda produzione offensiva, pressing e possesso, e anche la fase difensiva sembra migliorata e più vicina a quella del lotto di squadre che si contendono una qualificazione europea.
Le statistiche della Lazio sembrano in una fase di appannamento sotto diversi aspetti, ma la squadra biancoceleste rimane una delle migliori in Serie A per quanto riguarda la fase di pressing.
L'inizio di campionato positivo della Roma sembra avallato dai numeri, che anzi suggeriscono che la squadra giallorossa abbia offerto prestazioni anche superiori ai propri risultati. Se i dati relativi al pressing non sono positivi, quelli sulla produzione offensiva sono ottimi. I due modelli posizionano infatti la Roma al primo e secondo posto per npxG generati, su cui hanno pesato alcune underperformance individuali.
Una prestazione collettiva da sottolineare è quella dell'Udinese. Da un lato i friulani hanno avuto una produzione offensiva discreta, che in particolare gli attaccanti non sono però stati in grado di concretizzare. La prestazione difensiva è stata seconda solo a quella del Napoli, ma i gol incassati sono stati più di quelli attesi. Se la squadra dovesse mantenere questi livelli di performance è auspicabile che anche i risultati possano iniziare a convergere verso le attese.
Opposta la situazione dello Spezia, che ha ottenuto un buon numero di punti a dispetto di performance non particolarmente solide. Si tratta della squadra che statisticamente ha ottenuto l'overperformance maggiore a livello di xG, ed è difficile aspettarsi un mantenimento di questa condizione sul lungo periodo e con questa entità.
Ti potrebbe interessare
Dallo stesso autore
Associati
Newsletter
Iscriviti e la riceverai ogni sabato mattina direttamente alla tua email.