Bekymre sig om Johnny Manziels vægt, ikke hans højde

“Hvis du er 6-5, 230, løber en vis tid, er der ligesom 35 fyre, jeg kan sammenligne dig med, der har haft succes i denne liga. Hvis du er 5-11 år, er der to, medmindre du går tilbage til Fran Tarkenton: Doug Flutie og Russell Wilson. Det er ikke gode odds for mig. Du kan stadig nå det, men historien siger nej. Bare fordi man er 5-11 betyder det ikke, at man ikke kan få succes. Johnny har magi.” – Bruce Arians, cheftræner for Arizona Cardinals

“Jeg føler, at jeg spiller, som om jeg er tre meter høj.” – Johnny Manziel

På NFL scouting combine i februar målte den vildt populære Heisman Trophy-vindende quarterback Johnny Manziel officielt 71¾ tommer og 207 pund. Hans diminutive statur var et så varmt emne forud for NFL-draften i 2014, at medierne ikke kunne modstå ordspilene: “Johnny Manziel Comes Up Short At NFL Combine” (CBS Cleveland); “The Long and Short of Johnny Manziel” (ESPN Cleveland); “Will Johnny Manziel Measure Up for the Browns?” (ESPN Cleveland); “Will Johnny Manziel Measure Up for the Browns?” (CantonRep.com).

Det endte med, at Cleveland Browns valgte Manziel med det 22. valg i første runde. Med flere QB-hungrende hold nær toppen af draften (herunder Browns, der opgav to tidligere chancer for at drafte Manziel, først ved at bytte ud af det fjerde valg og derefter ved at vælge Justin Gilbert med det ottende), forventede de fleste, at han ville gå højere.

Vi ved ikke, hvorfor Manziel gik, hvor han gjorde, men vi ved, at han er underdimensioneret for sin position. Og historisk set har NFL-holdenes tilgang til underdimensionerede QB’er været ikke at drafte dem – hvis de er korte. Min forskning tyder på, at denne strategi er utilstrækkeligt nuanceret: Hvis højden overhovedet har betydning, har NFL-holdene allerede taget højde for det og lidt til. At være for letvægtig synes på den anden side at være en stærkere forudsigelse af præstationer (eller mangel på samme), og NFL-holdene synes ikke at have taget tilstrækkeligt hensyn til det.

For en QB af Manziels højde er det utroligt sjældent, at han bliver draftet selv sent i første runde. Fra fusionen i 1967 til 2013 valgte NFL-holdene 209 quarterbacks i de første tre runder af draften, men kun fem af dem var 72 tommer (6 fod) eller mindre. Af disse fem var det kun Michael Vick (opført som 6 fod), der blev valgt i første runde. Til sammenligning: Siden 1987 har NBA-hold siden 1987 udtaget fem spillere på 6 fod eller kortere i bare de første 10 valg i første runde.

Hvis vi kiggede på disse fem quarterbacks alene, ville det se ud som et ret godt bud at udtage korte QB’er. De har en samlet karrieremæssig Approximate Value (AV)1 på 260 – større end den samlede AV (210) for alle 12 QB’er, der er opført som 78 tommer (6 fod 6 tommer) og højere.

Denne sammenligning er kun til morskab: Det er en lille stikprøve, og begge disse grupper omfatter en række aktive spillere med mange produktive år foran sig. Men den antyder større problemer med, hvordan NFL tager højde i betragtning.

Mange mediernes scoutingrapporter før udkastet skelner ikke mellem højde og vægt og henviser i stedet ofte til en spillers “størrelse” eller “bulk”. Men når det kommer til størrelsesmålinger, synes NFL at være meget mere tilgivende over for lette quarterbacks end små quarterbacks. Gennemsnitsvægten for en quarterback på 71 til 72 tommer er 202 pund, men alligevel er 27 quarterbacks med denne vægt eller derunder blevet draftet i de første tre runder i den samme periode (1967-2013), hvor kun fem QB’er med denne højde blev valgt.

For at undersøge, om denne særlige modvilje mod at udtage korte QB’er (mens man er villig til at udtage lette QB’er) giver mening, klassificerede jeg den bredere pulje af udtagne quarterbacks (med begrænsning til dem, der blev valgt i de syv første runder) ud fra, hvordan de sammenlignede sig med Manziels vægt og højde. Derfra sammenlignede jeg hver gruppes gennemsnitlige AV pr. sæson for at se, om nogen af grupperne klarede sig bedre end de andre.

Kigger vi på den højre kolonne, kan vi se, at korte QB’er har klaret sig lidt bedre i gennemsnit end ikke-korte QB’er (3,0 gennemsnitlig AV pr. sæson mod 2,4). Men selv med syv runder af draftpicks er dette tal stadig ret lille: Kun 29 korte QB’er er inkluderet i denne sammenligning (så resultaterne er ikke statistisk signifikante).

Men vægtkolonnerne viser en skarp kløft mellem quarterbacks på hver side af Manziel (2,7 gennemsnitlig AV pr. sæson mod 1,6 samlet). Der er også en bredere stikprøve: 107 spillere vejede 207 pund eller mindre, sammenlignet med 311, der var tungere.

Baseret på det ser det ud til, at det er farligere at drafte en quarterback med Manziels vægt end at drafte en med hans højde. Men det er en ret grov binær analyse. Fordi NFL-draftmarkedet er ret effektivt, ville vi, hvis der var en sammenhæng mellem højde eller vægt og karrierepotentiale, sandsynligvis forvente, at den ville blive prissat i hver quarterbacks draftposition (eller om en quarterback overhovedet bliver draftet).

Så lad os udvide undersøgelsen til at omfatte hver quarterbacks draftposition. Lad os så i stedet for at opdele spillerne i grupper se på de overordnede korrelationer mellem højde, vægt og valg2 og et par forskellige QB-metrikker – Approximate Value, yards per game og yards per attempt3 . (Til denne sammenligning har jeg filtreret QB’er, der er draftet senere end 2008, fra.)

Denne gruppering af søjler til venstre viser os, at højden i det mindste er en smule korreleret med Approximate Value, yards per game og yards per attempt – men den korrelerer meget bedre med QB’ens draftposition. Vægten derimod korrelerer meget mere med vores QB-metrikker, og, hvilket er vigtigt, den korrelerer mindre med draftpositionen.

Med andre ord synes højden at fortælle os mindre end vægten, og det, den fortæller os, har vi sandsynligvis allerede vidst.

Selv om korrelationer alene ikke fortæller os, hvad der forårsager hvad, er det indtil videre et ret dårligt resultat for højden som en forudsigelse af quarterbackpræstationer. Men der er stadig mange muligheder, så for at få en bedre fornemmelse af, hvilke variabler der gør hvad arbejde, skabte jeg regressionsmodeller, der bruger højde, vægt og draft pick til at forudsige en række målinger, og sammenlignede derefter, hvor vigtig hver enkelt variabel var for hver model.

Disse regressioner producerede “t-værdier”, grundlæggende mål for den forudsigende pålidelighed af hver enkelt variabel.4 I dette tilfælde leder vi efter en minimumsværdi på 2,0,5

Det er ikke alene sådan, at højden ikke er en god prædiktor, når den kombineres med vægt og valgplacering, men den er også en lidt negativ prædiktor (for at være en statistisk signifikant negativ prædiktor vil vi dog gerne se værdier under -2,0). Det betyder ikke, at højde er dårlig, det betyder blot, at – uanset hvilken værdi den måtte have – NFL-hold sandsynligvis overvurderer den.

Vægt er imidlertid en meget signifikant prædiktor for disse målinger.6 Da draftplacering er inkluderet som input for denne regression, tyder dette stærkt på, at NFL-hold ikke har prissat vægt tilstrækkeligt i deres valg.

Der er en række mulige årsager til dette. Mit gæt ville være, at det har noget at gøre med NFL-spillets fysik, og at holdene måske bliver forelsket i en QB’s færdigheder eller præcision og undervurderer hans styrke eller holdbarhed. Men at finde ud af præcis hvorfor vægten er så forudsigelig er en helt anden undersøgelse, som måske er for kompliceret i forhold til den mængde data, der er til rådighed.7 Så i stedet for at dykke dybere ned, lad os forenkle.

Det, vi virkelig interesserer os for, er, om en QB har en minimalt succesfuld karriere. For at teste dette har jeg sat grænsen for “succesfuld karriere” ved ca. 32 AV, hvilket adskiller mere eller mindre de 100 bedst draftede QB’er siden 1967.8 Dybest set vil vores “succesfulde” grænse være alle de gode QB’er, du har hørt om, ned til omkring Joey Harrington, Rick Mirer, Vince Young, Byron Leftwich eller (hvis vi går længere tilbage) Steve Spurrier. Mens de værste af de “succesfulde” quarterbacks måske lyder ret dårlige i dine ører (Tim Couch, Browns-fans?), vil næsten to tredjedele af de quarterbacks, der vælges som 22. samlede (Manziels draftposition) sandsynligvis være endnu værre.

Vi kan forudsige den grundlæggende sandsynlighed for, at en QB bliver “succesfuld” eller ej, ved at bruge en logistisk regression9 med blot hans draftposition.10 Jeg har grupperet QB’er ved at afrunde deres vægt til nærmeste 5 pund og derefter beregnet, hvor mange i denne gruppe der burde have haft “succesfulde” karrierer baseret på hver af deres draftpositioner, og derefter sammenlignet det med det antal af dem, der rent faktisk gjorde det. Da det var gjort, plottede jeg, hvordan hver gruppe lykkedes i forhold til vores forventninger.

Den røde linje viser, hvor meget mere eller mindre sandsynligt det er, at en QB med en given vægt har succes, end vi ville forvente på baggrund af hans draftposition alene. 11 Manziel er opført som 207 pund. Ud fra modellen ville vi forvente, at omkring 19 procent færre QB’er på 207 pund ville få succes, end vi ville forvente baseret på deres draftposition.

Oddsandsynligheden for at få “succes” for en QB, der er valgt som 22. samlet set, er ca. 34 procent. Oddsene for, at en 207-punds-quarterback, der vælges som 22. samlet, får succes, er ca. 27 procent (81 procent af 34 procent). I draft-pick-termer er det omtrent det samme som en gennemsnitsvægtet quarterback, der bliver udtaget som 38. overall – et betydeligt, men bestemt ikke fordømmende fald. Vi kan lave den samme slags beregning for hver enkelt draftposition.

På den anden side var Manziel forventet at gå højere op i draftet. Det er muligt, at han uretfærdigt blev straffet for sin højde, men ikke straffet nok for sin vægt.

Hvis Browns havde valgt Manziel med det ottende valg, ville min models størrelse-vægt-justering (som i bund og grund er en vægtjustering, da højden ikke opfyldte tærsklen for medtagelse), gøre det omtrent lige så sandsynligt, at han ville få succes som et valg som nr. 16. Det ville stemme ret godt overens med Browns’ faktiske beslutninger på draftdagen: at gå forbi Manziel med det ottende valg, men derefter at handle op for at tage ham med det 22..

X

Jeg er ikke forelsket i denne metrik – eller egentlig nogen QB rating metrik – men den summerer godt, og til at teste hypoteser for hele ligaen vil stort set enhver fornuftig metrik være god nok.

X

Jeg er ikke forelsket i denne måling – eller egentlig nogen QB rating-måling – men den summerer godt, og til test af hypoteser for hele ligaen vil stort set enhver fornuftig måling være god nok.

X

Teknisk set bruger disse korrelationer logaritmen af hver spillers valg, ligesom alle regressionerne i denne artikel gør.

X

Jeg er ikke forelsket i denne måling – eller egentlig nogen QB rating-måling – men den summerer godt, og til at teste hypoteser for hele ligaen vil stort set enhver fornuftig måling være god nok.

X

Teknisk set bruger disse korrelationer logaritmen af hver spillers valg, ligesom alle regressioner i denne artikel.

X

Hvis du undrer dig over, hvorfor jeg ikke bruger mere komplicerede effektivitetsmålinger som Passer Rating, ESPN’s QBR eller Brian Burkes Win Percentage Added, er det fordi jeg mener, at de alle svarer alt for stærkt til stilen og kvaliteten af en QB’s hold og offensiv – i hvert fald til disse formål. Hvis du foretager finkornede sammenligninger, kan du måske være villig til at acceptere denne omkostning i bytte for disse metrikkers højere præcision, men til at evaluere de langsigtede virkninger af hundredvis af QB’er foretrækker jeg at bruge bredere mål. Det, jeg mest af alt ønsker at vide, er, hvor sandsynligt det var, at disse spillere havde lange, produktive karrierer.

X

Jeg er ikke forelsket i denne måling – eller egentlig nogen QB-rating-måling – men den summerer godt, og til at teste hypoteser for hele ligaen vil stort set enhver fornuftig måling være god nok.

X

Teknisk set bruger disse korrelationer logaritmen af hver spillers valg, hvilket alle regressioner i denne artikel også gør.

X

Hvis du undrer dig over, hvorfor jeg ikke bruger mere komplicerede effektivitetsmålinger som Passer Rating, ESPN’s QBR eller Brian Burkes Win Percentage Added, er det fordi jeg mener, at de alle svarer alt for stærkt til stilen og kvaliteten af en QB’s hold og offensiv – i hvert fald til disse formål. Hvis du foretager finkornede sammenligninger, kan du måske være villig til at acceptere denne omkostning i bytte for disse metrikkers højere præcision, men til at evaluere de langsigtede virkninger af hundredvis af QB’er foretrækker jeg at bruge bredere mål. Det, jeg mest af alt ønsker at vide, er, hvor sandsynligt det var, at disse spillere havde lange, produktive karrierer.

X

Det er den vægt, du bør lægge på variablen, divideret med dens gennemsnitlige fejl.

X

Jeg er ikke forelsket i denne metrik – eller egentlig nogen QB rating-metrik – men den summerer godt, og til at teste hypoteser for hele ligaen vil stort set enhver fornuftig metrik være god nok til at teste hypoteser for hele ligaen.

X

Teknisk set bruger disse korrelationer logaritmen af hver spillers valg, hvilket alle regressioner i denne artikel også gør.

X

Hvis du undrer dig over, hvorfor jeg ikke bruger mere komplicerede effektivitetsmålinger som Passer Rating, ESPN’s QBR eller Brian Burkes Win Percentage Added, er det fordi jeg mener, at de alle svarer alt for stærkt til stilen og kvaliteten af en QB’s hold og offensiv – i hvert fald til disse formål. Hvis du foretager finkornede sammenligninger, kan du måske være villig til at acceptere denne omkostning i bytte for disse metrikkers højere præcision, men til at evaluere de langsigtede virkninger af hundredvis af QB’er foretrækker jeg at bruge bredere mål. Det, jeg mest af alt ønsker at vide, er, hvor sandsynligt det var, at disse spillere havde lange, produktive karrierer.

X

Det er den vægt, du bør lægge på variablen divideret med dens gennemsnitlige fejl.

X

Dette er ca. grænsen for “statistisk signifikans”, hvilket betyder, at den overensstemmelse, der ses i dataene, ville ske mindre end 5 procent af gangen ved en tilfældighed. Det handler om den mindste mængde tillid, du har brug for i en variabel for at gøre det værd at bruge den.

X

Jeg er ikke forelsket i denne metrik – eller egentlig nogen QB rating-metrik – men den summerer godt, og til at teste hypoteser for hele ligaen vil stort set enhver fornuftig metrik være god nok.

X

Teknisk set bruger disse korrelationer logaritmen af hver spillers valg, hvilket alle regressioner i denne artikel også gør.

X

Hvis du undrer dig over, hvorfor jeg ikke bruger mere komplicerede effektivitetsmålinger som Passer Rating, ESPN’s QBR eller Brian Burkes Win Percentage Added, er det fordi jeg mener, at de alle svarer alt for stærkt til stilen og kvaliteten af en QB’s hold og offensiv – i hvert fald til disse formål. Hvis du laver finkornede sammenligninger, kan du være villig til at acceptere denne omkostning i bytte for disse metrikkers højere præcision, men til at evaluere de langsigtede virkninger af hundredvis af QB’er foretrækker jeg at bruge bredere mål. Det, jeg mest af alt ønsker at vide, er, hvor sandsynligt det var, at disse spillere havde lange, produktive karrierer.

X

Det er den vægt, du bør lægge på variablen divideret med dens gennemsnitlige fejl.

X

Dette er ca. grænsen for “statistisk signifikans”, hvilket betyder, at den overensstemmelse, der ses i dataene, ville ske mindre end 5 procent af gangen ved en tilfældighed. Det drejer sig om den mindste mængde tillid, man skal have til en variabel for at gøre det værd at bruge den.

X

Sådan er det for de fleste målinger i varierende grad, selv om det har en tendens til at gøre det bedst på grundlag af spil pr. kamp og pr. år.

X

Jeg er ikke forelsket i denne metrik – eller egentlig nogen QB rating-metrik – men den summerer godt, og til at teste hypoteser for hele ligaen vil stort set enhver fornuftig metrik være god nok.

X

Teknisk set bruger disse korrelationer logaritmen af hver spillers valg, hvilket alle regressioner i denne artikel også gør.

X

Hvis du undrer dig over, hvorfor jeg ikke bruger mere komplicerede effektivitetsmålinger som Passer Rating, ESPN’s QBR eller Brian Burkes Win Percentage Added, er det fordi jeg mener, at de alle svarer alt for stærkt til stilen og kvaliteten af en QB’s hold og offensiv – i hvert fald til disse formål. Hvis du foretager finkornede sammenligninger, kan du måske være villig til at acceptere denne omkostning i bytte for disse metrikkers højere præcision, men til at evaluere de langsigtede virkninger af hundredvis af QB’er foretrækker jeg at bruge bredere mål. Det, jeg mest af alt ønsker at vide, er, hvor sandsynligt det var, at disse spillere havde lange, produktive karrierer.

X

Det er den vægt, du bør lægge på variablen divideret med dens gennemsnitlige fejl.

X

Dette er ca. grænsen for “statistisk signifikans”, hvilket betyder, at den overensstemmelse, der ses i dataene, ville ske mindre end 5 procent af gangen ved en tilfældighed. Det drejer sig om den mindste mængde tillid, man skal have til en variabel for at gøre det værd at bruge den.

X

Sådan er det for de fleste målinger i varierende grad, selv om det har en tendens til at gøre det bedst på grundlag af spil pr. kamp og pr. år.

X

Dette er dybest set den største udfordring ved ethvert NFL-relateret problem.

X

Jeg er ikke forelsket i denne måling – eller egentlig nogen QB rating-måling – men den summerer godt, og til at teste hypoteser for hele ligaen vil stort set enhver fornuftig måling være god nok.

X

Teknisk set bruger disse korrelationer logaritmen af hver spillers valg, hvilket alle regressioner i denne artikel også gør.

X

Hvis du undrer dig over, hvorfor jeg ikke bruger mere komplicerede effektivitetsmålinger som Passer Rating, ESPN’s QBR eller Brian Burkes Win Percentage Added, er det fordi jeg mener, at de alle svarer alt for stærkt til stilen og kvaliteten af en QB’s hold og offensiv – i hvert fald til disse formål. Hvis du foretager finkornede sammenligninger, kan du måske være villig til at acceptere denne omkostning i bytte for disse metrikkers højere præcision, men til at evaluere de langsigtede virkninger af hundredvis af QB’er foretrækker jeg at bruge bredere mål. Det, jeg mest af alt ønsker at vide, er, hvor sandsynligt det var, at disse spillere havde lange, produktive karrierer.

X

Det er den vægt, du bør lægge på variablen divideret med dens gennemsnitlige fejl.

X

Dette er ca. grænsen for “statistisk signifikans”, hvilket betyder, at den overensstemmelse, der ses i dataene, ville ske mindre end 5 procent af gangen ved en tilfældighed. Det drejer sig om den mindste mængde tillid, man skal have til en variabel for at gøre det værd at bruge den.

X

Sådan er det for de fleste målinger i varierende grad, selv om det har en tendens til at gøre det bedst på grundlag af spil pr. kamp og pr. år.

X

Dette er dybest set den største udfordring ved ethvert NFL-relateret problem.

X

Bemærk, at det egentlig ikke så meget betyder, præcis hvor vi trækker grænsen, som at vi overhovedet trækker en grænse: Alt kan bruges som barometer.

X

Jeg er ikke forelsket i denne måling – eller egentlig nogen QB-rating-måling – men den giver gode resultater, og til at teste hypoteser for hele ligaen kan stort set enhver fornuftig måling bruges.

X

Teknisk set bruger disse korrelationer logaritmen af hver spillers valg, hvilket alle regressioner i denne artikel også gør.

X

Hvis du undrer dig over, hvorfor jeg ikke bruger mere komplicerede effektivitetsmålinger som Passer Rating, ESPN’s QBR eller Brian Burkes Win Percentage Added, er det fordi jeg mener, at de alle svarer alt for stærkt til stilen og kvaliteten af en QB’s hold og offensiv – i hvert fald til disse formål. Hvis du foretager finkornede sammenligninger, kan du måske være villig til at acceptere denne omkostning i bytte for disse metrikkers højere præcision, men til at evaluere de langsigtede virkninger af hundredvis af QB’er foretrækker jeg at bruge bredere mål. Det, jeg mest af alt ønsker at vide, er, hvor sandsynligt det var, at disse spillere havde lange, produktive karrierer.

X

Det er den vægt, du bør lægge på variablen divideret med dens gennemsnitlige fejl.

X

Dette er ca. grænsen for “statistisk signifikans”, hvilket betyder, at den overensstemmelse, der ses i dataene, ville ske mindre end 5 procent af gangen ved en tilfældighed. Det drejer sig om den mindste mængde tillid, man skal have til en variabel for at gøre det værd at bruge den.

X

Sådan er det for de fleste målinger i varierende grad, selv om det har en tendens til at gøre det bedst på grundlag af spil pr. kamp og pr. år.

X

Dette er dybest set den største udfordring ved ethvert NFL-relateret problem.

X

Bemærk, at det egentlig ikke så meget betyder, præcis hvor vi trækker grænsen, som at vi overhovedet trækker en grænse: Alt kan bruges som barometer.

X

En regression, der forudsiger binære resultater som sejre/tab, gode/dårlige osv.

X

Jeg er ikke forelsket i denne måling – eller egentlig nogen QB-rating-måling – men den giver et godt resultat, og til at teste hypoteser for hele ligaen kan stort set enhver fornuftig måling bruges.

X

Teknisk set bruger disse korrelationer logaritmen af hver spillers valg, hvilket alle regressioner i denne artikel også gør.

X

Hvis du undrer dig over, hvorfor jeg ikke bruger mere komplicerede effektivitetsmålinger som Passer Rating, ESPN’s QBR eller Brian Burkes Win Percentage Added, er det fordi jeg mener, at de alle svarer alt for stærkt til stilen og kvaliteten af en QB’s hold og offensiv – i hvert fald til disse formål. Hvis du foretager finkornede sammenligninger, kan du måske være villig til at acceptere denne omkostning i bytte for disse metrikkers højere præcision, men til at evaluere de langsigtede virkninger af hundredvis af QB’er foretrækker jeg at bruge bredere mål. Det, jeg mest af alt ønsker at vide, er, hvor sandsynligt det var, at disse spillere havde lange, produktive karrierer.

X

Det er den vægt, du bør lægge på variablen divideret med dens gennemsnitlige fejl.

X

Dette er ca. grænsen for “statistisk signifikans”, hvilket betyder, at den overensstemmelse, der ses i dataene, ville ske mindre end 5 procent af gangen ved en tilfældighed. Det drejer sig om den mindste mængde tillid, man skal have til en variabel for at gøre det værd at bruge den.

X

Sådan er det for de fleste målinger i varierende grad, selv om det har en tendens til at gøre det bedst på grundlag af spil pr. kamp og pr. år.

X

Dette er dybest set den største udfordring ved ethvert NFL-relateret problem.

X

Bemærk, at det egentlig ikke så meget betyder, præcis hvor vi trækker grænsen, som at vi overhovedet trækker en grænse: Alt kan bruges til et barometer.

X

En regression, der forudsiger binære resultater som sejre/tab, godt/dårligt osv.

X

Hvis du er interesseret, er Excel-formlen for dette =1/(1+EXP(-(1,1536-0.40511*))))), hvor er logaritmen af QB’ens draftposition i base 2 (eller log(,2)).

X

Jeg er ikke forelsket i denne metrik – eller egentlig nogen QB rating metrik – men den summerer godt, og til at teste hypoteser for hele ligaen vil stort set enhver fornuftig metrik være god nok.

X

Teknisk set bruger disse korrelationer logaritmen af hver spillers valg, hvilket alle regressioner i denne artikel også gør.

X

Hvis du undrer dig over, hvorfor jeg ikke bruger mere komplicerede effektivitetsmålinger som Passer Rating, ESPN’s QBR eller Brian Burkes Win Percentage Added, er det fordi jeg mener, at de alle svarer alt for stærkt til stilen og kvaliteten af en QB’s hold og offensiv – i hvert fald til disse formål. Hvis du foretager finkornede sammenligninger, kan du måske være villig til at acceptere denne omkostning i bytte for disse metrikkers højere præcision, men til at evaluere de langsigtede virkninger af hundredvis af QB’er foretrækker jeg at bruge bredere mål. Det, jeg mest af alt ønsker at vide, er, hvor sandsynligt det var, at disse spillere havde lange, produktive karrierer.

X

Det er den vægt, du bør lægge på variablen divideret med dens gennemsnitlige fejl.

X

Dette er ca. grænsen for “statistisk signifikans”, hvilket betyder, at den overensstemmelse, der ses i dataene, ville ske mindre end 5 procent af gangen ved en tilfældighed. Det drejer sig om den mindste mængde tillid, man skal have til en variabel for at gøre det værd at bruge den.

X

Sådan er det for de fleste målinger i varierende grad, selv om det har en tendens til at gøre det bedst på grundlag af spil pr. kamp og pr. år.

X

Dette er dybest set den største udfordring ved ethvert NFL-relateret problem.

X

Bemærk, at det egentlig ikke så meget betyder, præcis hvor vi trækker grænsen, som at vi overhovedet trækker en grænse: Alt kan bruges til et barometer.

X

En regression, der forudsiger binære resultater som sejre/tab, godt/dårligt osv.

X

Hvis du er interesseret, er Excel-formlen for dette =1/(1+EXP(-(1,1536-0.40511*))))), hvor er logaritmen af QB’ens draftposition i base 2 (eller log(,2)).

X

I Excel er denne formel: =((1/(1/(1+EXP(-(-7.814506+0,031653*))))-0,272723209)/0,272723209.

×

Det bedste fra FiveThirtyEight, leveret til dig.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.