Korrelationskoefficient (definition, formel) | Sådan beregnes?

Hvad er korrelationskoefficient?

Korrelationskoefficient bruges til at bestemme, hvor stærkt forholdet er mellem to variabler, og dets værdier kan variere fra -1,0 til 1,0, hvor -1,0 repræsenterer negativ korrelation og +1,0 repræsenterer et positivt forhold. Den overvejer de relative bevægelser i variablerne og definerer derefter, om der er noget forhold mellem dem.

Formel for korrelationskoefficient

Hvor

  • r = korrelationskoefficient
  • n = antal observationer
  • x = 1. variabel i sammenhængen
  • y = 2. variabel

Forklaring

Hvis der er nogen sammenhæng eller siger forholdet mellem to variabler, skal det indikere, om en af ​​variablerne ændrer sig i værdi, så vil den anden variabel også have tendens til at ændre sig i værdi, siger specifikt, som enten kan være i samme eller i modsat retning . Tællerdelen af ​​ligningen udfører en test og relativ styrke af de variabler, der bevæger sig sammen, og nævneren af ​​ligningen skalerer tælleren ved at multiplicere forskellene mellem variablerne fra kvadratiske variabler.

Eksempler

Du kan downloade denne Excel-skabelon med korrelationskoefficientformel her - Korrelationskoefficientformel Excel-skabelon

Eksempel nr. 1

Overvej følgende to variabler x andy, du skal beregne korrelationskoefficienten.

Nedenfor gives data til beregningen

Løsning:

Ved hjælp af ovenstående ligning kan vi beregne følgende

Vi har alle værdierne i ovenstående tabel med n = 4.

Lad os nu indtaste værdierne til beregning af korrelationskoefficienten.

Derfor er beregningen som følger,

r = (4 * 25,032,24) - (262,55 * 317,31) / √ [(4 * 20,855,74) - (262,55) 2] * [(4 * 30,058,55) - (317,31) 2]

r = 16,820,21 / 16,831,57

Koefficient vil være -

Koefficient = 0,99932640

Eksempel 2

Land X er et land i vækstøkonomi, og det ønsker at foretage en uafhængig analyse af de beslutninger, som centralbanken træffer vedrørende renteforandringer, om de har påvirket inflationen og har centralbanken mulighed for at kontrollere det samme.

Efter resuméet af renten og den inflation, der var fremherskende i landet i gennemsnit for disse år, er angivet nedenfor.

Nedenfor gives data til beregningen.

Landets præsident har henvendt dig til at foretage analyser og give en præsentation om det samme på det næste møde. Brug korrelation og fastlægg, om centralbanken har nået sit mål eller ej.

Løsning:

Ved hjælp af formlen beskrevet ovenfor kan vi beregne korrelationskoefficienten. Behandling af renten som en variabel siger x og behandling af inflationen som en anden variabel som y.

Vi har alle værdierne i ovenstående tabel med n = 6.

Lad os nu indtaste værdierne til beregning af korrelationskoefficienten.

r = (6 * 170,91) - (46,35 * 22,24) / √ [(6 * 361,19) - (46,35) 2] * [(6 * 82,74) - (22,24) 2]

r = -5,36 / 5,88

Korrelation vil være -

Korrelation = -0,92

Analyse: Det ser ud til, at sammenhængen mellem renten og inflationen er negativ, hvilket ser ud til at være et korrekt forhold, da renten stiger, inflationen falder, hvilket betyder, at de har tendens til at bevæge sig i den modsatte retning fra hinanden, og det fremgår af ovenstående resultat, at centralbanken havde succes med at gennemføre beslutningen om rentepolitik.

Eksempel 3

ABC-laboratorium forsker i højde og alder og ønskede at vide, om der er noget forhold mellem dem. De har samlet en prøve på 1000 personer til hver af kategorierne og kom op med en gennemsnitlig højde i den gruppe.

Nedenfor gives data til beregning af korrelationskoefficienten.

Du skal beregne korrelationskoefficienten og komme med den konklusion, at hvis der findes et forhold.

Løsning:

Behandling af alder som en variabel siger x og behandling af højde (i cms) som en anden variabel som y.

Vi har alle værdierne i ovenstående tabel med n = 6.

Lad os nu indtaste værdierne til beregning af korrelationskoefficienten.

r = (6 * 10.137) - (70 * 850) / √ [(6 * 940 - (70) 2] * [(6 * 1.20.834) - (850) 2]

r = 1.322,00 / 1.361,23

Korrelation vil være -

Korrelation = 0,971177099

Relevans og anvendelse

Det bruges i statistikker hovedsageligt til at analysere styrken af ​​forholdet mellem de variabler, der er under overvejelse, og det måler også, om der er nogen lineær sammenhæng mellem de givne datasæt, og hvor godt de kan relateres. Et af de almindelige målinger, der bruges i korrelation, er Pearson Correlation Coefficient.

Hvis en variabel ændrer sig i værdi og sammen med den anden variabel ændrer sig i værdi, er forståelse af forholdet kritisk, da man kan bruge værdien af ​​den tidligere variabel til at forudsige ændringen i en værdi af den sidstnævnte variabel. En sammenhæng har mange forskellige anvendelser i dag i denne moderne æra, som den bruges i den finansielle industri, videnskabelig forskning, og hvor ikke. Men det er dog vigtigt at vide, at korrelation har tre hovedtyper af forhold. Den første er et positivt forhold, der angiver, om der er en ændring i en variabels værdi, så vil der være en ændring i den relaterede variabel i samme retning, ligesom hvis der er en negativ sammenhæng, vil den relaterede variabel opføre sig i modsatte retning. Hvis der ikke er nogen sammenhæng, vil r også antyde en nulværdi.Se nedenstående billeder for bedre at forstå konceptet.