Statistické okénko: Jak důležitá je rychlost nadhozu v MLB?
Již od žáků nám trenéři říkávali, že bychom měli pracovat na rychlosti svého nadhozu, že nám to pomůže. V amatérských soutěžích, kde jsou výkonnostní rozdíly veliké, může rychlost nadhozu být tím klíčovým faktorem, který rozhoduje mezi úspěchem a neúspěchem. Je tomu tak i v nejlepší lize světa, tedy v MLB, kde i ti nejpomalejší atakují pro mnohé nepředstavitelnou hranici 90mph?
K tomu, abych se dopracoval ke smysluplnému závěru jsem musel nashromáždit hodně dat. U 57 nadhazovačů, tedy všech nadhazovačů American League, kteří měli ke 30. červnu 2019 deset či více startů v právě probíhající sezóně, jsem dohledal jejich era (obdržené doběhy) a průměrnou rychlost jejich fastballu (ze všech her letošní sezóny, nepočítaje spring training). Z numerického seznamu těchto hodnot je pro nezasvěceného čtenáře velmi těžké cokoliv vyvodit, a proto jsem vytvořil diagram (Obr. 1), který by měl pomoci s vizualizací.
Při pohledu na diagram (Obr 1.), kde průměrná rychlost fastballu (x) je na vodorovné ose a era (y) na ose svislé, můžeme vidět, že mírná korelace existuje. Abychom zjistili, zda-li lze vzniklou přímku (y = -0.1425x + 17.569) považovat za přesný indikátor, podle kterého je možné vypočítat era nadhazovače podle rychlosti jeho fastballu, je potřeba se podívat na r, tedy na korelační koeficient. Ten lze vypočítat pomocí hezkého vzorečku (Obr. 2):
Korelační koeficient se může (u negativní korelace) pohybovat mezi 0 a -1, kdy 0 znamená, že korelace neexistuje a -1 znamená, že všechny údaje (body na diagramu) leží přímo na přímce. U našeho experimentu má r hodnotu -0.21242364. To znamená, že korelace existuje, ale je velmi slabá.
Pokud z grafu odstraníme tři krajní (extrémní) hodnoty z obou stran, vznikne nám přímka s ještě výrazně nižším sklonem (Obr.3):
Co ze všech těchto údajů plyne? Spojovat vyšší rychlost s lepšími výsledky v MLB lze, ale jen do určité míry s tím, že musíme být velmi obezřetní. Samotná rychlost je nadhazovači k ničemu, protože rychlost je pouze jedním z mnoha potřebných faktorů. Pokud ovšem nadhazovač ovládá i zbylé aspekty nadhazování, a rychlost je jediná proměnná, můžeme podle našeho statistického modelu předpokládat, že vyšší rychlost mu mírně pomůže.
PS: Pokud bysme použili exponenciální rovnici místo rovnice lineární, byl by výsledek přesnější, ale jen marginálně a zbytečně by to bylo složitější pro pochopení. Pokud jste dočetli až sem, děkuji vám za pozornost a těším se na feedback a popřípadě na návrhy témat pro mé příští články.