Multikollinearitet (definition, typer) | Top 3 eksempler med forklaring

Hvad er multikollinearitet?

Multikollinearitet er et statistisk fænomen, hvor to eller flere variabler i en regressionsmodel er afhængige af de andre variabler på en sådan måde, at man kan forudsiges lineært fra den anden med en høj grad af nøjagtighed. Det bruges generelt i observationsstudier og mindre populært i eksperimentelle studier.

Typer af multikollinearitet

Der er fire typer multikollinearitet

  • # 1 - Perfekt multikollinearitet - Den eksisterer, når de uafhængige variabler i ligningen forudsiger det perfekte lineære forhold.
  • # 2 - Høj multikollinearitet - Det refererer til det lineære forhold mellem de to eller flere uafhængige variabler, som ikke er perfekt korreleret til hinanden.
  • # 3 - Strukturel multikollinearitet - Dette skyldes forskeren selv ved at indsætte forskellige uafhængige variabler i ligningen.
  • # 4 - Databaseret multikollineaaritet - Det er forårsaget af eksperimenter, der er dårligt designet af forskeren.

Årsager til multikollinearitet

Uafhængige variabler, ændring i parametrene for variablerne gør, at en lille ændring i variablerne er der en betydelig indvirkning på resultatet & Dataindsamling henviser til prøven af ​​den valgte population, der tages.

Eksempler på multikollinearitet

Eksempel nr. 1

Lad os antage, at ABC Ltd a KPO er ansat af et lægemiddelfirma til at levere forskningstjenester og statistisk analyse af sygdommene i Indien. Til denne ABC ltd har valgt alder, vægt, erhverv, højde og sundhed som prima facie parametre.

  • I ovenstående eksempel er der en multikollinearitetssituation, da de uafhængige variabler, der er valgt til undersøgelsen, er direkte korreleret med resultaterne. derfor ville det være tilrådeligt for forskeren at justere variablerne først inden et projekt startes, da resultaterne vil blive direkte påvirket på grund af de valgte variabler her.

Eksempel 2

Lad os antage, at ABC Ltd er blevet udnævnt af Tata Motors til at forstå, at salgsmængden af ​​tata-motorer vil være høj i hvilken kategori på markedet.

  • I ovenstående eksempel vil først uafhængige variabler blive færdiggjort baseret på hvilken forskningen skal afsluttes. det kan være månedlig indkomst, alder. mærke, den lavere klasse. Det betyder kun, at der vælges data, der passer ind i alle disse faner for at finde ud af, hvor mange mennesker der kan købe denne bil (tata nano) uden engang at kigge på nogen anden bil.

Eksempel 3

Lad os antage, at ABC Ltd er ansat til at indsende en rapport for at vide, hvor mange mennesker under 50 år, der er tilbøjelige til hjerteanfald. for dette er parametrene alder, køn, medicinsk historie

  • I eksemplet ovenfor er der multikollinearitet, der er opstået, fordi den uafhængige variabel "alder" skal justeres til alder under 50 for at invitere applikationer fra offentligheden, så personer, der er over 50 år, automatisk bliver filtreret.

Fordele

Nedenfor er nogle af fordelene

  • Lineært forhold mellem de uafhængige variabler i ligningen.
  • Meget nyttigt i statistiske modeller og forskningsrapporter udarbejdet af de forskningsbaserede virksomheder.
  • Direkte indvirkning på det ønskede resultat.

Ulemper

Nedenfor er nogle af ulemperne

  • I nogle af situationerne ville dette problem blive løst ved at indsamle flere data om variablerne.
  • Forkert brug af dummyvariabler, dvs. forskeren kan glemme at bruge dummyvariablerne, når det er nødvendigt.
  • Indsættelse af 2 samme eller identiske variabler i ligningen som kg og lbs i vægte.
  • Indsættelse af en variabel i ligningen, som er en kombination af 2.
  • Kompliceret til at udføre beregninger, da det er den statistiske teknik og kræver, at statistiske regnemaskiner udfører udførelsen.

Konklusion

Multikollinearitet er et af de mest foretrukne statistiske værktøjer, der ofte bruges i regressionsanalyse og statistisk analyse til store databaser og det ønskede output. Alle større virksomheder har en separat statistisk afdeling i deres virksomhed til at udføre statistisk regressionsanalyse om produkter eller mennesker for at give ledelsen et strategisk overblik over markedet og også hjælpe dem med at udarbejde deres langsigtede strategier under hensyntagen til dette. Den grafiske præsentation af analysen giver læseren et klart billede af det direkte forhold, nøjagtighed og ydeevne.

  • Hvis forskerens mål er at forstå de uafhængige variabler i ligningen, vil multikollinearitet være et stort problem for ham.
  • Forskeren skal foretage de krævede ændringer i variablerne på selve trin 0, ellers kan det have en massiv indflydelse på resultaterne.
  • Multikollinearitet kan udføres ved at undersøge korrelationsmatrixen.
  • Afhjælpende foranstaltninger spiller en væsentlig rolle i løsningen af ​​problemerne for multikollinearitet.