Vzorec hodnoty P | Krok za krokem příklady výpočtu P-hodnoty
Co je vzorec P-hodnoty?
P je statistické měřítko, které pomáhá vědcům určit, zda jsou jejich hypotézy správné. Pomáhá určit významnost výsledků. Nulová hypotéza je výchozí pozicí, že neexistuje žádný vztah mezi dvěma měřenými jevy. Označuje se H 0. Alternativní hypotéza je ta, které byste věřili, pokud by byla nulová hypotéza považována za nepravdivou. Jeho symbolem je H 1 nebo H a.
Hodnota P v aplikaci Excel je číslo mezi 0 a 1. K výpočtu hodnoty p jsou k dispozici tabulky, tabulkové kalkulátory a statistický software. Úroveň významnosti (α) je předem definovaná prahová hodnota stanovená výzkumným pracovníkem. Obvykle je to 0,05. Velmi malá hodnota p, která je menší než úroveň významnosti, naznačuje, že odmítnete nulovou hypotézu. Hodnota P, která je větší než úroveň významnosti, naznačuje, že se nám nepodařilo odmítnout nulovou hypotézu.
Vysvětlení vzorce P-hodnoty
Vzorec pro výpočet hodnoty p lze odvodit pomocí následujících kroků:
Výpočet P-hodnoty ze statistiky Z.
Krok 1: Musíme zjistit statistiku testu z
Kde
- je Sample Proportion
- p0 je předpokládaný podíl populace v nulové hypotéze
- n je velikost vzorku
Krok 2: Musíme najít odpovídající úroveň p ze získané hodnoty z. Z tohoto důvodu se musíme podívat na tabulku z.
Zdroj: www.dummies.com
Najdeme například hodnotu p odpovídající z ≥ 2,81. Protože normální rozdělení je symetrické, záporné hodnoty z se rovnají jeho kladným hodnotám. 2,81 je součet 2,80 a 0,01. Podívejte se na 2,8 ve sloupci z a odpovídající hodnotu 0,01. Dostaneme p = 0,0025.
Příklady vzorce P-hodnoty (s šablonou Excel)
Podívejme se na několik jednoduchých až pokročilých příkladů rovnice P-hodnoty, abychom jí lépe porozuměli.
Tuto šablonu Excel vzorce P Value si můžete stáhnout zde - Šablona Excel vzorce P Value
Příklad č. 1
a) Hodnota P je 0,3015. Pokud je úroveň významnosti 5%, zjistěte, zda můžeme odmítnout nulovou hypotézu.
b) Hodnota P je 0,0129. Pokud je úroveň významnosti 5%, zjistěte, zda můžeme odmítnout nulovou hypotézu.
Řešení:
Pro výpočet hodnoty P použijte následující údaje.
Hodnota P bude -
a) Protože p-hodnota 0,3015 je větší než hladina významnosti 0,05 (5%), nezavrhujeme nulovou hypotézu.
b) Protože p-hodnota 0,0129 je menší než hladina významnosti 0,05, odmítáme nulovou hypotézu.
Příklad č. 2
Podle výzkumné studie mluví 27% lidí v Indii hindsky. Výzkumník je zvědavý, jestli je číslo ve své vesnici vyšší. Proto rámcuje nulovou a alternativní hypotézu. Testuje H 0: p = 0,27. Ha : p> 0,27. Zde p je podíl lidí ve vesnici, kteří mluví hindsky. Ve své vesnici zadá průzkum, aby zjistil počet lidí, kteří umí hindsky. Zjistil, že 80 z 240 lidí ve vzorku může mluvit hindsky. Zjistěte přibližnou hodnotu p pro test výzkumného pracovníka, pokud bychom měli předpokládat, že jsou splněny nezbytné podmínky a úroveň významnosti je 5%.
Řešení:
Pro výpočet hodnoty P použijte následující údaje.
Zde je velikost vzorku n = 240,
p 0 je podíl populace Budeme muset najít podíl vzorku
= 80/240
= 0,33
Z Statistika
Výpočet statistiky Z
= 0,33 - 0,27 / √ 0,27 * (1 - 0,27) / 240
Statistika Z bude -
Z = 2,093696
Hodnota P bude -
Hodnota P = P (z ≥ 2,09)
Musíme se podívat na hodnotu 2,09 je z tabulka. Musíme se tedy podívat na -2,0 ve sloupci z a hodnotu ve sloupci 0,09. Protože normální rozdělení je symetrické, oblast vpravo od křivky je stejná jako plocha vlevo. Hodnotu p dostaneme jako 0,0183.
Hodnota P = 0,0183
Protože hodnota p je méně než významná úroveň 0,05 (5%), odmítáme nulovou hypotézu.
Poznámka: V aplikaci Excel hodnota p přichází jako 0,0181
Příklad č. 3
Studie ukazují, že vyšší počet letenek kupují muži ve srovnání se ženami. Kupují je muži a ženy v poměru 2: 1. Výzkum byl proveden na konkrétním letišti v Indii za účelem zjištění distribuce letenek mezi muži a ženami. Ze 150 lístků si 88 lístků koupili muži a 62 žen. Musíme zjistit, zda experimentální manipulace způsobuje změnu ve výsledcích, nebo pozorujeme náhodnou variaci. Vypočítejte hodnotu p za předpokladu, že stupeň významnosti je 0,05.
Řešení:
Pro výpočet hodnoty P použijte následující údaje.
Krok 1: Pozorovaná hodnota je 88 u mužů a 62 u žen.
- Očekávaná hodnota pro muže = 2/3 * 150 = 100 mužů
- Očekávaná hodnota pro ženy = 1/3 * 150 = 50 žen
Krok 2: Zjistěte chí-kvadrát
= ((88-100) 2) / 100 + (62-50) 2/50
= 1,44 + 2,88
Chi-Square (X ^ 2)
Čtverec (X ^ 2) bude -
Chi-Square (X ^ 2) = 4,32
Krok 3: Najděte stupně volnosti
Protože existují 2 proměnné - muži a ženy, n = 2
Stupně volnosti = n-1 = 2-1 =
Krok 4: Z tabulky p-hodnot se podíváme na první řádek v tabulce, protože stupeň volnosti je 1. Vidíme, že p-hodnota je mezi 0,025 a 0,05. Protože p-hodnota je menší než stupeň významnosti 0,05, odmítáme nulovou hypotézu.
Hodnota P bude -
Hodnota P = 0,037666922
Poznámka: Excel přímo dává hodnotu p pomocí vzorce:
CHITEST (skutečný rozsah, očekávaný rozsah)
Příklad č. 4
Je známo, že 60% lidí, kteří vstupují do obchodů s oděvy ve městě, něco kupuje. Majitel obchodu s oděvy chtěl zjistit, zda je počet obchodů s oděvy, které vlastní, vyšší. Už měl výsledky studie provedené pro jeho obchod. 128 z 200 lidí, kteří vstoupili do jeho obchodu, něco koupilo. Majitel obchodu označil pas podíl lidí, kteří vstoupili do jeho obchodu s oděvy a něco si koupili. Nulová hypotéza, kterou vytvořil, byla p = 0,60 a alternativní hypotéza byla p> 0,60. Najděte hodnotu p pro výzkum na úrovni významnosti 5%.
Řešení:
Pro výpočet hodnoty P použijte následující údaje.
Zde je velikost vzorku n = 200. Budeme muset najít podíl vzorku
= 128/200
= 0,64
Z Statistika
Výpočet statistiky Z
= 0,64 - 0,60 / √ 0,60 * (1 - 0,60) / 200
Statistika Z bude -
Statistika Z = 1,1547
Hodnota P = P (z ≥ 1,1547)
Funkce NORMSDIST v aplikaci Excel
NORMSDIST bude -
NORMSDIST = 0,875893461
K dispozici je vestavěná funkce pro výpočet hodnoty p ze statistiky az v aplikaci Excel. Je známá jako funkce NORMSDIST. Funkce Excel NORMSDIST vypočítá funkci standardní normální kumulativní distribuce z dodané hodnoty. Jeho formát je NORMSDIST (z). Protože statistická hodnota z je v buňce B2, používá se funkce = NORMSDIST (B2).
Hodnota P bude -
Hodnota P = 0,12410654
Protože musíme najít oblast napravo od křivky,
p-hodnota = 1 - 0,875893 = 0,124107
Vzhledem k tomu, že p-hodnota 0,124107 je více než významná úroveň 0,05, nezavrhujeme nulovou hypotézu.
Relevance a použití
Hodnota P má široké použití při testování statistických hypotéz, konkrétně při testování nulových hypotéz. Správce fondu například spravuje podílový fond. Tvrdí, že výnosy z konkrétního systému podílového fondu jsou ekvivalentní Nifty, což je referenční index akciového trhu. Vytvořil by nulovou hypotézu, že výnosy systému podílových fondů jsou ekvivalentní výnosům Nifty. Alternativní hypotéza by byla, že výnosy systému a výnosy Nifty nejsou ekvivalentní. Poté vypočítá hodnotu p.