Centrální limitní věta (definice, vzorec) | Výpočty a příklady
Definice centrální limitní věty
Centrální limitní věta uvádí, že náhodné vzorky populační náhodné proměnné s jakýmkoli rozdělením se přiblíží k normální distribuci pravděpodobnosti, jak se zvětší velikost vzorku, a předpokládá, že když velikost vzorku v populaci přesáhne 30, střední hodnota vzorku, jehož průměr ze všech pozorování u vzorku se bude blížit průměru k populaci.
Centrální limitní věta
Již jsme diskutovali o tom, že když velikost vzorku přesáhne 30, rozdělení má tvar normálního rozdělení. Pro určení normálního rozdělení proměnné je důležité znát její průměr a její rozptyl. Normální rozdělení lze uvést jako
X ~ N (µ, α)
Kde
- N = počet pozorování
- µ = průměr z pozorování
- α = směrodatná odchylka
Ve většině případů pozorování neprozradí mnoho v surové podobě. Je tedy velmi důležité standardizovat pozorování, abychom to mohli porovnat. Dělá se to pomocí z-skóre. Je nutné vypočítat Z-skóre pro pozorování. Vzorec pro výpočet z-skóre je
Z = (X- µ) / α / √nKde
- Z = Z-skóre pozorování
- µ = průměr z pozorování
- α = směrodatná odchylka
- n = velikost vzorku
Vysvětlení
Centrální limitní věta uvádí, že náhodné vzorky populační náhodné proměnné s jakýmkoli rozdělením se přiblíží k normální distribuci pravděpodobnosti, jak se zvětší velikost vzorku. Centrální limitní věta předpokládá, že když velikost vzorku v populaci přesáhne 30, bude průměr vzorku, jehož průměr ze všech pozorování u vzorku se bude blížit průměru k populaci. Rovněž směrodatná odchylka vzorku, když velikost vzorku přesáhne 30, se bude rovnat směrodatné odchylce populace. Jelikož je vzorek náhodně vybrán z celé populace a velikost vzorku je větší než 30, pomáhá při testování hypotéz a konstrukci intervalu spolehlivosti pro testování hypotéz.
Příklady vzorce střední limitní věty (s šablonou Excel)
Tuto šablonu Excel Limitní věta vzorce Excel si můžete stáhnout zde - Šablona Excel limitní věty vzorce ExcelPříklad č. 1
Pojďme pochopit koncept normálního rozdělení pomocí příkladu. Průměrný výnos z podílového fondu je 12% a standardní odchylka od průměrného výnosu z investice do podílového fondu je 18%. Pokud předpokládáme, že rozdělení výnosu je normálně rozděleno, pojďme interpretovat rozdělení výnosu v investici podílového fondu.
Vzhledem k tomu,
- Průměrná návratnost investice bude 12%
- Směrodatná odchylka bude 18%
Abychom tedy zjistili návratnost 95% intervalu spolehlivosti, můžeme ji zjistit řešením rovnice jako
- Horní rozsah = 12 + 1,96 (18) = 47%
- Dolní rozsah = 12 - 1,96 (18) = -23%
Výsledek znamená, že 95% případů bude výnos z podílového fondu v rozmezí 47% až -23%. V tomto příkladu nám velikost vzorku, což je výnos náhodného vzorku s více než 30 pozorováními návratu, poskytne výsledek pro populační výnos podílového fondu, protože rozdělení vzorku bude normálně distribuováno.
Příklad č. 2
Pokračováním stejného příkladu určíme, jaký bude výsledek pro 90% interval spolehlivosti
Vzhledem k tomu,
- Průměrná návratnost investice bude 12%
- Směrodatná odchylka bude 18%
Abychom tedy zjistili návratnost 90% intervalu spolehlivosti, můžeme ji zjistit řešením rovnice jako
- Horní rozsah = 12 + 1,65 (18) = 42%
- Dolní rozsah = 12 - 1,65 (18) = -18%
Výsledek znamená, že 90% případů bude návratnost podílového fondu v rozmezí 42% až -18%.
Příklad č. 3
Pokračováním stejného příkladu určíme, jaký bude výsledek pro 99% interval spolehlivosti
Vzhledem k tomu,
- Průměrná návratnost investice bude 12%
- Směrodatná odchylka bude 18%
Abychom tedy zjistili návratnost 90% intervalu spolehlivosti, můžeme ji zjistit řešením rovnice jako
- Horní rozsah = 12 + 2,58 (18) = 58%
- Dolní rozsah = 12 - 2,58 (18) = -34%
Výsledek znamená, že 99% případů, kdy se výnos z podílového fondu bude pohybovat v rozmezí 58% až -34%.
Relevance a použití
Centrální limitní věta je nesmírně užitečná, protože umožňuje výzkumníkovi předpovědět průměr a směrodatnou odchylku celé populace pomocí vzorku. Jelikož je vzorek náhodně vybrán z celé populace a velikost vzorku je větší než 30, pak se jakákoli náhodná velikost vzorku odebraná z populace přiblíží k normální distribuci, což pomůže při testování hypotéz a konstrukci intervalu spolehlivosti pro hypotézu testování. Na základě centrální limitní větyvýzkumný pracovník je schopen vybrat libovolný náhodný vzorek z celé populace a je-li velikost vzorku větší než 30, může pomocí vzorku předpovědět populaci, protože vzorek bude sledovat normální rozdělení a také jako průměr a směrodatná odchylka vzorku bude stejná jako průměr a směrodatná odchylka populace.