- Paano makalkula ang koepisyent ng ugnayan?
- Covariance at pagkakaiba-iba
- Nakalarawan kaso
- Covariance Sxy
- Standard na paglihis Sx
- Standard na paglihis Sy
- Koepisyent ng korelasyon r
- Pagbibigay kahulugan
- Pagkakasunod na pagkakaugnay
- Halimbawa
- Mga Sanggunian
Ang koepisyent ng ugnayan sa mga istatistika ay isang tagapagpahiwatig na sumusukat sa ugali ng dalawang variable na variable X at Y upang magkaroon ng isang guhit o proporsyonal na relasyon sa pagitan nila.
Kadalasan, ang mga pares ng variable X at Y ay dalawang katangian ng magkaparehong populasyon. Halimbawa, si X ay maaaring maging taas ng isang tao at Y ang kanyang timbang.
Larawan 1. Koepisyent ng korelasyon para sa apat na mga pares ng data (X, Y). Pinagmulan: F. Zapata.
Sa pagkakataong ito, ipapahiwatig ng koepisyent ng ugnayan kung mayroon o isang takbo patungo sa isang proporsyonal na relasyon sa pagitan ng taas at timbang sa isang naibigay na populasyon.
Ang linear correlation coefficient ng Pearson ay ipinapahiwatig ng maliit na titik r at ang minimum at maximum na mga halaga nito ay -1 at +1 ayon sa pagkakabanggit.
Ang isang halaga r = +1 ay magpahiwatig na ang hanay ng mga pares (X, Y) ay perpektong nakahanay at na kapag lumalaki ang X, lalaki ang Y sa parehong proporsyon. Sa kabilang banda, kung nangyari na ang r = -1, ang hanay ng mga pares ay magiging perpektong nakahanay, ngunit sa kasong ito kapag nadagdagan ang X, bumababa ang Y sa parehong proporsyon.
Figure 2. Iba't ibang mga halaga ng linear correlation coefficient. Pinagmulan: Wikimedia Commons.
Sa kabilang banda, ang isang halaga r = 0 ay magpahiwatig na walang linear na ugnayan sa pagitan ng mga variable X at Y. Habang ang isang halaga ng r = +0.8 ay nagpapahiwatig na ang mga pares (X, Y) ay may posibilidad na kumpol sa isang panig at isa pa sa isang tiyak na linya.
Ang pormula upang makalkula ang koepisyent ng correlation r ay ang mga sumusunod:
Paano makalkula ang koepisyent ng ugnayan?
Ang linear correlation coefficient ay isang istatistikal na dami na binuo sa mga siyentipikong calculator, karamihan sa mga spreadsheet, at mga istatistikong istatistika.
Gayunpaman, maginhawa upang malaman kung paano inilalapat ang pormula na tinukoy nito, at para sa isang detalyadong pagkalkula ay ipapakita, isinasagawa sa isang maliit na hanay ng data.
At tulad ng nakasaad sa nakaraang seksyon, ang koepisyu ng ugnayan ay ang covariance Sxy na hinati ng produkto ng karaniwang paglihis na Sx para sa mga variable na X at Sy para sa variable na Y.
Covariance at pagkakaiba-iba
Ang covariance Sxy ay:
Sxy = / (N-1)
Kung saan ang kabuuan napupunta mula sa 1 hanggang sa mga pares ng data ng N (Xi, Yi).
Para sa bahagi nito, ang karaniwang paglihis para sa variable X ay ang parisukat na ugat ng pagkakaiba-iba ng data set Xi, kasama ako mula 1 hanggang N:
Sx = √
Katulad nito, ang karaniwang paglihis para sa variable Y ay ang parisukat na ugat ng pagkakaiba-iba ng data set Yi, na may i mula 1 hanggang N:
Sy = √
Nakalarawan kaso
Upang maipakita nang detalyado kung paano makalkula ang koepisyentong ugnayan, kukunin namin ang sumusunod na hanay ng apat na pares ng data
(X, Y): {(1, 1); (2. 3); (3, 6) at (4, 7)}.
Una namin kinakalkula ang ibig sabihin ng aritmetika para sa X at Y, tulad ng sumusunod:
Pagkatapos ang natitirang mga parameter ay kinakalkula:
Covariance Sxy
Sxy = / (4-1)
Sxy = / (3) = 10.5 / 3 = 3.5
Standard na paglihis Sx
Sx = √ = √ = 1.29
Standard na paglihis Sy
Sx = √ =
√ = 2.75
Koepisyent ng korelasyon r
r = 3.5 / (1.29 * 2.75) = 0.98
Pagbibigay kahulugan
Sa hanay ng data ng nakaraang kaso, ang isang malakas na ugnayan sa linya ay sinusunod sa pagitan ng mga variable X at Y, na kung saan ay ipinahayag kapwa sa plot ng magkakalat (ipinapakita sa Larawan 1) at sa koepisyentong ugnayan, na nagbigay ng isang halaga na malapit sa pagkakaisa.
Sa lawak na ang koepisyent ng ugnayan ay mas malapit sa 1 o hanggang -1, ang higit na kahulugan na akma upang magkasya ang data sa isang linya, ang resulta ng linear regression.
Pagkakasunod na pagkakaugnay
Ang linya ng regression linear ay nakuha mula sa hindi bababa sa paraan ng mga parisukat. kung saan ang mga parameter ng linya ng regression ay nakuha mula sa pagliit ng kabuuan ng parisukat ng pagkakaiba sa pagitan ng tinatayang halaga ng Y at ng Yi ng N data.
Sa kabilang banda, ang mga parameter a at b ng linya ng regression y = a + bx, na nakuha ng pamamaraan ng hindi bababa sa mga parisukat, ay:
* b = Sxy / (Sx 2 ) para sa slope
* a =
Matatandaan na ang Sxy ay ang covariance na tinukoy sa itaas at ang Sx 2 ay ang pagkakaiba-iba o parisukat ng karaniwang paglihis na tinukoy sa itaas.
Halimbawa
Ang koepisyent ng ugnayan ay ginagamit upang matukoy kung mayroong isang guhit na ugnayan sa pagitan ng dalawang variable. Naaangkop ito kapag ang mga variable na pag-aaralan ay dami at, bukod dito, ipinapalagay na sinusunod nila ang isang normal na pamamahagi ng uri.
Ang isang nakalarawan na halimbawa ay ibinigay sa ibaba: isang sukatan ng antas ng labis na katabaan ay ang index ng mass ng katawan, na nakuha sa pamamagitan ng paghati sa bigat ng isang tao sa mga kilo sa pamamagitan ng kanilang parisukat na taas sa mga yunit ng mga metro kuwadrado.
Nais mong malaman kung mayroong isang malakas na ugnayan sa pagitan ng index ng mass ng katawan at ang konsentrasyon ng HDL kolesterol sa dugo, na sinusukat sa milimetro bawat litro. Para sa layuning ito, ang isang pag-aaral ay isinasagawa kasama ang 533 katao, na kung saan ay naitala sa sumusunod na graph, kung saan ang bawat punto ay kumakatawan sa data ng isang tao.
Larawan 3. Pag-aaral ng BMI at HDL kolesterol sa 533 mga pasyente. Pinagmulan: Aragonese Institute of Health Sciences (IACS).
Ang maingat na pagmamasid sa graph ay nagpapakita na mayroong isang tiyak na linear na takbo (hindi masyadong minarkahan) sa pagitan ng HDL kolesterol konsentrasyon at body mass index. Ang dami ng panukalang-batas na ito ay ang koepisyentong ugnayan, na sa kasong ito ay naging r = -0.276.
Mga Sanggunian
- González C. Pangkalahatang Istatistika. Nabawi mula sa: tarwi.lamolina.edu.pe
- IACS. Aragonese Institute of Health Sciences. Nabawi mula sa: ics-aragon.com
- Salazar C. at Castillo S. Mga pangunahing prinsipyo ng mga istatistika. (2018). Nabawi mula sa: dspace.uce.edu.ec
- Superprof. Koepisyent ng korelasyon. Nabawi mula sa: superprof.es
- USAC. Manwal na mga istatistika ng paglalarawan. (2011). Nabawi mula sa: statistics.ingenieria.usac.edu.gt
- Wikipedia. Koepisyentong ugnayan ni Pearson. Nabawi mula sa: es.wikipedia.com.