Multicollinearity (definice, typy) | Nejlepší 3 příklady s vysvětlením

Co je Multicollinearity?

Multicollinearity je statistický jev, ve kterém jsou dvě nebo více proměnných v regresním modelu závislé na ostatních proměnných takovým způsobem, že lze s vysokou mírou přesnosti lineárně předpovídat jednu od druhé. Obvykle se používá v observačních studiích a méně populární v experimentálních studiích.

Druhy multicollinearity

Existují čtyři typy multicollinearity

  • # 1 - Perfect Multicollinearity - Existuje, když nezávislé proměnné v rovnici předpovídají dokonalý lineární vztah.
  • # 2 - Vysoká multicollinearita - Vztahuje se k lineárnímu vztahu mezi dvěma nebo více nezávislými proměnnými, které navzájem dokonale nekorelují.
  • # 3 - Strukturální multicollinearita - To je způsobeno samotným výzkumníkem vložením různých nezávislých proměnných do rovnice.
  • # 4 - Multicollineaarita založená na datech - je to způsobeno experimenty, které výzkumník špatně navrhuje.

Příčiny multicollinearity

Nezávislé proměnné, změna parametrů proměnných způsobí, že malá změna v proměnných má významný dopad na výsledek a datové sbírky odkazují na vzorek vybrané populace, který se odebírá.

Příklady multicollinearity

Příklad č. 1

Předpokládejme, že společnost ABC Ltd a KPO je najata farmaceutickou společností k poskytování výzkumných služeb a statistické analýzy nemocí v Indii. Pro tuto společnost ABC ltd zvolila věk, váhu, povolání, výšku a zdraví jako prima facie parametry.

  • Ve výše uvedeném příkladu je situace multicollinearity, protože nezávislé proměnné vybrané pro studii přímo korelují s výsledky. proto by bylo vhodné, aby výzkumník nejprve upravil proměnné před zahájením jakéhokoli projektu, protože výsledky budou přímo ovlivněny kvůli zde vybraným proměnným.

Příklad č. 2

Předpokládejme, že společnost ABC Ltd byla jmenována společností Tata Motors, aby pochopila, že objem prodeje motorů tata bude vysoký v které kategorii na trhu.

  • Ve výše uvedeném příkladu budou nejprve dokončeny nezávislé proměnné, na základě kterých je třeba výzkum dokončit. může to být měsíční příjem, věk. značka, nižší třída. Znamená to pouze to, že budou vybrána data, která se vejdou do všech těchto karet, aby bylo možné zjistit, kolik lidí si může koupit toto auto (tata nano), aniž by se vůbec dívalo na jiné auto.

Příklad č. 3

Předpokládejme, že společnost ABC Ltd byla najata, aby předložila zprávu, aby věděla, kolik lidí do 50 let je náchylných k infarktu. pro toto jsou parametry věk, pohlaví, anamnéza

  • Ve výše uvedeném příkladu existuje multicollinearita, která vznikla, protože je třeba vyladit nezávislou proměnnou „age“ na věk do 50 let pro pozvání od veřejnosti, aby se automaticky filtrovaly osoby starší 50 let.

Výhody

Níže jsou uvedeny některé výhody

  • Lineární vztah mezi nezávislými proměnnými v rovnici.
  • Velmi užitečné ve statistických modelech a výzkumných zprávách připravených společnostmi založenými na výzkumu.
  • Přímý dopad na požadovaný výsledek.

Nevýhody

Níže jsou uvedeny některé z nevýhod

  • V některých situacích by tento problém byl vyřešen shromážděním více údajů o proměnných.
  • Nesprávné použití fiktivních proměnných, tj. Výzkumník může zapomenout používat fiktivní proměnné, kdykoli je to potřeba.
  • Vkládání 2 stejných nebo identických proměnných do rovnice jako kg a lbs v hmotnosti.
  • Vložení proměnné do rovnice, což je kombinace 2.
  • Složité provádět výpočty, protože se jedná o statistickou techniku ​​a k provedení vyžaduje statistické kalkulačky.

Závěr

Multicollinearity je jedním z nejoblíbenějších statistických nástrojů často používaných v regresní analýze a statistické analýze pro velké databáze a požadovaný výstup. Všechny významné společnosti mají ve své společnosti samostatné statistické oddělení, které provádí statistickou regresní analýzu produktů nebo lidí, aby poskytlo vedení strategický pohled na trh a také jim pomohlo s vypracováním jejich dlouhodobých strategií při zachování této mysli. Grafické znázornění analýzy poskytuje čtenáři jasný obraz přímého vztahu, přesnosti a výkonu.

  • Pokud je cílem výzkumného pracovníka porozumět nezávislým proměnným v rovnici, pak pro něj bude multicollinearita velkým problémem.
  • Výzkumník musí provést požadované změny proměnných ve fázi 0 sám, jinak to může mít obrovský dopad na výsledky.
  • Multicollinearity lze provést zkoumáním korelační matice.
  • Při řešení problémů multicolinearity hrají významnou roli nápravná opatření.