- Mga uri ng antas ng kalayaan
- Sa isang mekanikal na kaso
- Sa isang hanay ng mga random na halaga
- Mga halimbawa
- Pagkakaiba-iba at antas ng kalayaan
- Sa pamamahagi ng square square
- Sa pagsubok ng hypothesis (Sa nalutas na halimbawa)
- Mga Sanggunian
Ang antas ng kalayaan sa mga istatistika ay ang bilang ng mga independiyenteng sangkap ng isang random vector. Kung ang vector ay may mga sangkap at mayroong mga p linear equation na nauugnay sa mga bahagi nito, kung gayon ang antas ng kalayaan ay np.
Ang konsepto ng mga antas ng kalayaan ay lilitaw din sa mga teoretikal na mekanika, kung saan sila ay halos katumbas ng sukat ng puwang kung saan gumagalaw ang butil, binabawasan ang bilang ng mga bono.
Larawan 1. Ang isang palawit ay gumagalaw sa dalawang sukat, ngunit mayroon lamang itong isang antas ng kalayaan sapagkat pinilit itong lumipat sa isang arko ng radius L. Pinagmulan: F. Zapata.
Tatalakayin ng artikulong ito ang konsepto ng mga antas ng kalayaan na inilalapat sa mga istatistika, ngunit ang isang mekanikal na halimbawa ay mas madaling mailarawan sa form na geometric.
Mga uri ng antas ng kalayaan
Depende sa konteksto kung saan inilalapat ito, ang paraan upang makalkula ang bilang ng mga antas ng kalayaan ay maaaring magkakaiba, ngunit ang pinagbabatayan ng ideya ay palaging pareho: ang kabuuang sukat na mas kaunting bilang ng mga paghihigpit.
Sa isang mekanikal na kaso
Isaalang-alang natin ang isang oscillating na butil na nakatali sa isang string (isang pendulum) na gumagalaw sa patayong xy eroplano (2 mga sukat). Gayunpaman, ang maliit na butil ay pinilit na lumipat sa circumference ng radius na katumbas ng haba ng chord.
Dahil ang maliit na butil ay maaari lamang lumipat sa curve na iyon, ang bilang ng mga antas ng kalayaan ay 1. Ito ay makikita sa figure 1.
Ang paraan upang makalkula ang bilang ng mga antas ng kalayaan ay sa pamamagitan ng pagkuha ng pagkakaiba-iba ng bilang ng mga sukat na minus ang bilang ng mga hadlang:
antas ng kalayaan: = 2 (mga sukat) - 1 (ligature) = 1
Ang isa pang paliwanag na nagpapahintulot sa amin na makarating sa resulta ay ang mga sumusunod:
-Nalaman namin na ang posisyon sa dalawang sukat ay kinakatawan ng isang punto ng mga coordinate (x, y).
-Ngunit dahil ang punto ay dapat sumunod sa equation ng circumference (x 2 + y 2 = L 2 ) para sa isang naibigay na halaga ng variable x, ang variable y ay tinutukoy ng sinabi ng equation o paghihigpit.
Sa ganitong paraan, isa lamang sa mga variable ang independyente at ang sistema ay may isang (1) antas ng kalayaan.
Sa isang hanay ng mga random na halaga
Upang ilarawan kung ano ang ibig sabihin ng konsepto, ipagpalagay na ang vector
x = (x 1 , x 2 , …, x n )
Kinakatawan ang sample ng n karaniwang ibinahagi ang mga random na halaga. Sa kasong ito ang random vector x ay may mga independyenteng sangkap at samakatuwid x ay sinasabing mayroong n degree ng kalayaan.
Ipatayo natin ngayon ang vector r ng mga nalalabi
r = (x 1 -
Saan
Kaya ang kabuuan
(x 1 -
Ito ay isang equation na kumakatawan sa isang paghihigpit (o nagbubuklod) sa mga elemento ng vector r ng mga nalalabi, dahil kung ang n-1 mga sangkap ng vector r ay kilala , ang paghihigpit na paghihigpit ay tumutukoy sa hindi kilalang bahagi.
Samakatuwid ang vector r ng sukat n gamit ang paghihigpit:
∑ (x i -
Mayroon itong (n - 1) degree ng kalayaan.
Muli na inilalapat na ang pagkalkula ng bilang ng mga antas ng kalayaan ay:
antas ng kalayaan: = n (mga sukat) - 1 (pagpilit) = n-1
Mga halimbawa
Pagkakaiba-iba at antas ng kalayaan
Ang pagkakaiba-iba s 2 ay tinukoy bilang ang ibig sabihin ng parisukat ng mga paglihis (o tira) ng sample ng n data:
s 2 = ( r • r ) / (n-1)
kung saan r ay ang vector ng residuals r = (x1 -
s 2 = ∑ (x i -
Sa anumang kaso, dapat tandaan na kapag kinakalkula ang ibig sabihin ng parisukat ng mga nalalabi, nahahati ito ng (n-1) at hindi sa n, dahil tulad ng tinalakay sa nakaraang seksyon, ang bilang ng mga antas ng kalayaan ng vector r ay ( n-1).
Kung para sa pagkalkula ng pagkakaiba-iba ay hinati ito ng n sa halip na (n-1), ang resulta ay magkakaroon ng isang bias na napaka makabuluhan para sa mga halaga ng n mas mababa sa 50.
Sa panitikan, lumilitaw din ang variance formula kasama ang divisor n sa halip na (n-1), pagdating sa pagkakaiba-iba ng isang populasyon.
Ngunit ang hanay ng mga random variable ng mga nalalabi, na kinakatawan ng vector r , bagaman ito ay may sukat na n, mayroon lamang (n-1) degree ng kalayaan. Gayunpaman, kung ang bilang ng data ay sapat na malaki (n> 500), ang parehong mga formula ay magkakasama sa parehong resulta.
Ang mga calculator at mga spreadsheet ay nagbibigay ng parehong mga bersyon ng pagkakaiba-iba at ang karaniwang paglihis (na siyang parisukat na ugat ng pagkakaiba-iba).
Ang aming rekomendasyon, sa pagtingin sa pagsusuri na ipinakita dito, ay palaging pumili ng bersyon na may (n-1) sa bawat oras na kinakailangan upang makalkula ang pagkakaiba-iba o karaniwang paglihis, upang maiwasan ang mga bias na resulta.
Sa pamamahagi ng square square
Ang ilang mga pamamahagi ng posibilidad sa patuloy na random variable ay nakasalalay sa isang parameter na tinatawag na antas ng kalayaan, ito ang kaso ng pamamahagi ng parisukat na Chi (χ 2 ).
Ang pangalan ng parameter na ito ay eksaktong mula sa mga antas ng kalayaan ng pinagbabatayan na vector na kung saan nalalapat ang pamamahagi na ito.
Ipagpalagay na mayroon kaming mga populasyon na g, kung saan kinuha ang mga halimbawang laki ng n:
X 1 = (x1 1 , x1 2 ,… ..x1 n )
X2 = (x2 1 , x2 2 ,… ..x2 n )
….
X j = (xj 1 , xj 2 ,… ..xj n )
….
Xg = (xg 1 , xg 2 ,… ..xg n )
Isang populasyon j na may kahulugan
Ang standardized o normalized variable zj i ay tinukoy bilang:
zj i = (xj i -
At ang vector Zj ay tinukoy tulad nito:
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) at sumusunod sa pamantayang normal na pamamahagi N (0,1).
Kaya ang variable:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
sumusunod sa pamamahagi χ 2 (g) na tinawag na pamamahagi ng chi square na may antas ng kalayaan g.
Sa pagsubok ng hypothesis (Sa nalutas na halimbawa)
Kung nais mong subukan ang mga hypotheses batay sa isang tiyak na hanay ng mga random na data, kailangan mong malaman ang bilang ng mga antas ng kalayaan g upang mailapat ang pagsubok sa Chi-square.
Larawan 2. Mayroon bang kaugnayan sa pagitan ng kagustuhan ng ice cream FLAVOR at ng GENDER ng customer? Pinagmulan: F. Zapata.
Bilang halimbawa, ang data na nakolekta sa mga kagustuhan ng tsokolate o strawberry na ice cream sa mga kalalakihan at kababaihan sa isang tiyak na parlor ng sorbetes ay susuriin. Ang dalas kung saan pipiliin ng mga kalalakihan at kababaihan ang presa o tsokolate ay buod sa Larawan 2.
Una, ang talahanayan ng inaasahang mga frequency ay kinakalkula, na inihanda sa pamamagitan ng pagdaragdag ng kabuuang mga hilera sa kabuuan ng mga haligi, na hinati sa kabuuang data. Ang resulta ay ipinapakita sa mga sumusunod na pigura:
Larawan 3. Pagkalkula ng inaasahang mga frequency batay sa mga naobserbahang mga frequency (mga halaga sa asul sa figure 2). Pinagmulan: F. Zapata.
Kung gayon ang parisukat ng Chi ay kinakalkula (mula sa data) gamit ang sumusunod na pormula:
χ 2 = ∑ (F o - F e ) 2 / F e
Kung saan ang F o ang mga sinusunod na dalas (Larawan 2) at F e ay ang inaasahang mga dalas (Larawan 3). Ang paglalagom ay napupunta sa lahat ng mga hilera at haligi, na sa aming halimbawa ay nagbibigay ng apat na termino.
Matapos gawin ang mga operasyon na nakukuha mo:
χ 2 = 0.2043.
Ngayon kinakailangan upang ihambing sa teoretikal na Chi square, na nakasalalay sa bilang ng mga antas ng kalayaan g.
Sa aming kaso, ang bilang na ito ay natutukoy tulad ng sumusunod:
g = (# hilera - 1) (#columns - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Ito ay lumiliko na ang bilang ng mga antas ng kalayaan g sa halimbawang ito ay 1.
Kung nais mong suriin o tanggihan ang null hypothesis (H0: walang ugnayan sa pagitan ng TASTE at GENDER) na may antas ng kabuluhan ng 1%, ang teoretikal na halaga ng Chi-square ay kinakalkula na may antas ng kalayaan g = 1.
Hinahanap ang halaga na gumagawa ng naipon na dalas (1 - 0.01) = 0.99, iyon ay, 99%. Ang halagang ito (na maaaring makuha mula sa mga talahanayan) ay 6,636.
Habang ang teoretikal na Chi ay lumampas sa kinakalkula, kung gayon ang null hypothesis ay napatunayan.
Sa madaling salita, sa mga nakalap na data, walang ugnayan ang sinusunod sa pagitan ng mga variable na TASTE at GENDER.
Mga Sanggunian
- Minitab. Ano ang mga antas ng kalayaan? Nabawi mula sa: support.minitab.com.
- Moore, David. (2009) Mga pangunahing istatistikong inilalapat. Editor ng Antoni Bosch.
- Leigh, Jennifer. Paano makalkula ang antas ng kalayaan sa mga modelo ng istatistika. Nabawi mula sa: geniolandia.com
- Wikipedia. Degree ng kalayaan (istatistika). Nabawi mula sa: es.wikipedia.com
- Wikipedia. Degree ng kalayaan (pisikal). Nabawi mula sa: es.wikipedia.com