Kovariance vs. korelace Top 5 rozdílů (s infografikou)

Rozdíl mezi kovariancí a korelací

Kovariance a korelace jsou dva pojmy, které jsou přesně opačné, oba se používají ve statistice a regresní analýze, kovariance nám ukazuje, jak se tyto dvě proměnné navzájem liší, zatímco korelace nám ukazuje vztah mezi těmito dvěma proměnnými a jak jsou příbuzné .

Korelace a kovariance jsou dva statistické pojmy, které se používají k určení vztahu mezi dvěma náhodnými proměnnými. Korelace definuje, jak změna jedné proměnné ovlivní druhou, zatímco kovariance definuje, jak se dvě položky liší společně. Matoucí? Pojďme se ponořit dále, abychom pochopili rozdíl mezi těmito úzce souvisejícími pojmy.

Co je Covariance?

Kovariance měří, jak se dvě proměnné pohybují vůči sobě navzájem, a je rozšířením konceptu rozptylu (který vypovídá o tom, jak se mění jedna proměnná). Může nabývat jakékoli hodnoty od -∞ do + ∞.

  • Čím vyšší je tato hodnota, tím více závisí vztah. Kladné číslo znamená pozitivní kovarianci a označuje, že existuje přímý vztah. Účinně to znamená, že zvýšení jedné proměnné by také vedlo k odpovídajícímu zvýšení druhé proměnné za předpokladu, že ostatní podmínky zůstanou konstantní.
  • Na druhou stranu záporné číslo znamená zápornou kovarianci, která označuje inverzní vztah mezi těmito dvěma proměnnými. Ačkoli kovariance je ideální pro definování typu vztahu, je špatné interpretovat jeho velikost.

Co je korelace?

Korelace je o krok napřed před kovariancí, protože kvantifikuje vztah mezi dvěma náhodnými proměnnými. Jednoduše řečeno, jedná se o jednotkovou míru toho, jak se tyto proměnné navzájem mění (normalizovaná hodnota kovariance).

  • Na rozdíl od kovariance má korelace horní a dolní limit rozsahu. Může nabývat pouze hodnot mezi +1 a -1. Korelace +1 naznačuje, že náhodné proměnné mají přímý a silný vztah.
  • Na druhou stranu korelace -1 naznačuje, že existuje silný inverzní vztah a zvýšení jedné proměnné povede ke stejnému a opačnému poklesu v druhé proměnné. 0 označuje, že obě čísla jsou nezávislá.

Vzorec pro kovarianci a korelaci

Pojďme tyto dva pojmy vyjádřit matematicky. Pro dvě náhodné proměnné A a B se středními hodnotami jako Ua a Ub a směrodatnou odchylkou jako Sa a Sb:

Účinně lze vztah mezi těmito dvěma definovat jako:

Korelace i kovariance nacházejí uplatnění v oblastech statistické a finanční analýzy. Vzhledem k tomu, že korelace standardizuje vztah, je užitečné ji porovnat s libovolnými dvěma proměnnými. To pomáhá analytikovi přijít se strategiemi, jako je párový obchod a zajištění nejen efektivních výnosů z portfolia, ale také zajištění těchto výnosů z hlediska nepříznivých pohybů na akciovém trhu.

Korelace vs. kovariance infografika

Podívejme se na hlavní rozdíl mezi Korelací a Kovariance.

Klíčové rozdíly

  • Kovariance je indikátorem míry, do jaké se dvě náhodné proměnné navzájem mění. Korelace na druhé straně měří sílu tohoto vztahu. Hodnota korelace je vázána na horní část o +1 a na spodní straně o -1. Jedná se tedy o určitý rozsah. Rozsah kovariance je však neurčitý. Může nabývat jakékoli kladné nebo záporné hodnoty (teoreticky je rozsah -∞ až + ∞). Můžete si být jisti, že korelace 0,5 je větší než 0,3 a první sada čísel (s korelací jako 0,5) jsou na sobě více závislá než druhá sada (s korelací jako 0,3). Interpretace takového výsledku by být velmi obtížné z kovariančních výpočtů.
  • Změna měřítka ovlivňuje kovarianci. Například pokud je hodnota dvou proměnných vynásobena podobnými nebo různými konstantami, pak to ovlivní vypočítanou kovarianci těchto dvou čísel. Avšak použití stejného mechanismu pro korelaci, násobení konstantami nezmění předchozí výsledek. Je to proto, že změna měřítka nemá vliv na korelaci.
  • Na rozdíl od kovariance je korelace jednotkovou mírou vzájemné závislosti dvou proměnných. To usnadňuje porovnání vypočítaných korelačních hodnot napříč libovolnými 2 proměnnými bez ohledu na jejich jednotky a rozměry.
  • Kovarianci lze vypočítat pouze pro 2 proměnné. Korelaci lze na druhou stranu vypočítat pro více sad čísel. Další faktor, díky kterému je korelace žádoucí pro analytiky ve srovnání s kovariancí.

Srovnávací tabulka kovariance vs korelace

Základ Kovariance Korelace
Význam Kovariance je indikátorem míry, do jaké jsou na sobě závislé 2 náhodné proměnné. Vyšší číslo označuje vyšší závislost. Korelace je ukazatelem toho, jak silně tyto 2 proměnné souvisejí, pokud jsou ostatní podmínky konstantní. Maximální hodnota je +1 označující dokonalý závislý vztah.
Vztah Korelaci lze odvodit z kovariance Korelace poskytuje míru kovariance na standardní stupnici. Je odvozena dělením vypočítané kovariance směrodatnou odchylkou.
Hodnoty Hodnota kovariance leží v rozsahu -∞ a + ∞. Korelace je omezena na hodnoty mezi rozsahem -1 a +1.
Škálovatelnost Ovlivňuje kovarianci Korelace není ovlivněna změnou měřítka nebo násobením konstantou.
Jednotky Kovariance má určitou jednotku, protože je odvozena vynásobením dvou čísel a jejich jednotek. Korelace je bezjednotkové absolutní číslo mezi -1 a +1 včetně desetinných hodnot.

Závěr

Korelace a kovariance spolu velmi úzce souvisejí, a přesto se velmi liší. Kovariance definuje typ interakce, ale korelace definuje nejen typ, ale také sílu tohoto vztahu. Z tohoto důvodu je korelace často označována jako speciální případ kovariance. Pokud si však jeden z těchto dvou musí vybrat, většina analytiků upřednostňuje korelaci, protože zůstává nedotčena změnami rozměrů, umístění a měřítka. Protože je omezen na rozsah -1 až +1, je užitečné kreslit srovnání mezi proměnnými napříč doménami. Důležitým omezením však je, že oba tyto koncepty měří jediný lineární vztah.