Střední vs medián | Rozdíly mezi metodami použitými ve statistice

Rozdíl mezi střední a střední hodnotou

Průměr a Medián jsou dva běžně používané výrazy v matematice, průměr je jako průměr z daných čísel a shrnuje čísla a dělí je počtem čísel, který nám dává průměr, zatímco medián na druhé straně vrací střední číslo z celku datová sada a je-li datová sada sudá, přidá medián dvě střední čísla a vydělí jej 2, čímž získáme medián.

Jsou měřítkem centrální tendence a často se používají při měření velkých souborů dat, kde je třeba vypracovat analýzu a interpretovat výsledky. Průměr, medián a režim jsou tři míry průměrů, které ukazují, že rozptyl dat je od průměru nebo průměru. Tyto metody se ve statistice používají široce, zatímco střední hodnota dat je nejpoužívanější metodou mezi těmito třemi.

Co to znamená?

Průměr je jednoduchý součet počtu pozorování v poli, který je vydělen počtem pozorování. Například když mluvíme o průměrné výšce nebo průměrné výšce skupiny skládající se z 5 lidí. Průměrná výška by byla vypočítána sečtením výšky 5 osob děleno počtem osob tj. 5.

Vzorec

Průměrný vzorec = (součet všech pozorování / počet pozorování)

Co je to medián?

Medián na druhé straně je střední číslo v sadě datového pole, které odděluje vyšší sadu dat od nižšího. Data je třeba nejprve seřadit vzestupně, aby bylo možné vypočítat medián dat. Pokud má soubor dat mohutnost, je třeba vzít průměr středních dvou čísel v souboru dat. Tyto dvě metody se však často používají zaměnitelně.

Vzorec

Medián vzorce = (n + 1) / 2

když n je liché číslo

Medián = [(n / 2) + {(n / 2) +1}] / 2

když n je sudé číslo

Střední vs. střední infografika

Podívejme se na hlavní rozdíly mezi průměrem vs. mediánem.

Průměrné a střední klíčové rozdíly

  • Mean se snadno používá a používá a lze jej použít na libovolnou sadu datových polí, ať už sudou nebo lichou. Medián je na druhou stranu mírně složitý a datová sada musí být před výpočtem nejprve uspořádána vzestupně nebo sestupně.
  • Průměr se obvykle používá pro normální distribuce, zatímco medián se používá pro datovou sadu se zkosenými distribucemi.
  • Průměr je jednoduchý, ale není robustní, může obsahovat odlehlé hodnoty v distribucích a někdy nemusí uživateli poskytnout správné výsledky interpretace. Na druhou stranu je mediánová metoda robustní a je vhodnější pro použití, protože se používá pro šikmé distribuce k odvození centrální tendence sady dat a poskytne uživateli mnoho přesných výsledků ve srovnání se střední hodnotou
  • Existuje pouze jeden vzorec střední hodnoty, který je součtem všech pozorování děleno počtem pozorování. Zatímco medián má dva vzorce, jeden z lichých, kde se mediánem stanou pouze prostřední čísla z datové sady. Ale když máme sudý datový soubor, střed dvou hodnot se vybere a vydělí se 2, což nám dá medián sudého datového souboru.

Průměrná vs. střední srovnávací tabulka

Znamenat Medián
Průměr se vypočítá sečtením všech hodnot v datovém poli, které se poté vydělí počtem pozorování Medián je přesná střední hodnota souboru dat. Lze jej vypočítat uspořádáním datové sady ve vzestupném pořadí a následným vyhledáním nebo výběrem střední hodnoty z datové sady
To je více široce používané v průmyslu kvůli snadnému výpočtu průměru a dává nám rychlé číslo V průmyslu se nepoužívá často, ale je úplnější a přesnější než průměr, což je jen jednoduchý součet čísel
Používá se obecně pro normálně zkosený soubor dat, tj. Normální distribuci Je obzvláště užitečné popsat datovou sadu s výraznou šikmostí v datech nebo v případě, že data mají dlouhý ocas. Používá se široce tam, kde obrysy nesou významnou váhu v datech, což znamená, že není dobrá metoda výpočtu
Nejedná se o robustní nástroj pro výpočet k odvození centrální tendence Jedná se o mnohem robustnější nástroj, protože určuje váhu v datech, což je obecně vysoká váha u delších ocasů
Je velmi citlivý na odlehlé hodnoty Je to mnohem méně ovlivněno odlehlými hodnotami
Je to jednoduché Má složitou povahu
Nelze jej vypočítat pro kategorická data, protože hodnoty nelze sečíst Nelze jej identifikovat pro kategorizovaná nominální data, protože jej nelze logicky objednat.

Závěr

Kromě průměru a mediánu existuje ještě jedna metoda, která se často používá k měření centrální tendence, což je režim. Režim je hodnota, která se nejčastěji vyskytuje v datové sadě, režim má výhodu oproti průměru a mediánu, který lze najít pro číselnou i kategorizovanou datovou sadu.

Navzdory existenci režimu a mediánu nadřazenosti lepších výsledků a analýz nad průměrem je průměr stále nejvhodnějším měřítkem centrální tendence, zejména pokud je soubor dat normální distribucí a data jsou normálně zkreslená.

Jako dobrý analytik by měla být centrální tendence měřena všemi třemi datovými metodami a rozptyl v analýze by měl být přemítán a pečlivě analyzován, aby se dosáhlo lepších a přesnějších výsledků v souboru dat.