- Pahayag ng problema sa pagsubok sa Mann-Whitney U
- Kualitative variable kumpara sa dami variable
- Normal na kaso
- Kaso na may hindi normal na takbo
- Ipares o walang bayad na mga sample
- Mga katangian ng pagsubok ng Mann Whitney U
- Mann - formula ng Whitney
- Mga hakbang upang ilapat ang pagsubok
- Halimbawa ng praktikal na aplikasyon
- - Hakbang 1
- - Hakbang 2
- Rehiyon A
- Rehiyon B
- Hakbang 3
- Hakbang 4
- Mga pamantayan sa paghahambing
- Mga Online na calculator para sa pagsubok sa Mann - Whitney U
- Mga Sanggunian
Ang pagsubok sa Mann - Whitney U ay inilalapat para sa paghahambing ng dalawang independiyenteng mga sample kapag mayroon silang kaunting data o hindi sumusunod sa isang normal na pamamahagi. Sa ganitong paraan, itinuturing na isang non-parametric test, hindi katulad ng katapat nito, ang t test ng Student, na ginagamit kapag ang sample ay sapat na malaki at sumusunod sa normal na pamamahagi.
Inirerekomenda ito ni Frank Wilcoxon sa unang pagkakataon noong 1945, para sa mga halimbawa ng magkaparehong sukat, ngunit pagkaraan ng dalawang taon ay pinalawak ito para sa kaso ng mga sample ng iba't ibang laki nina Henry Mann at DR Whitney.

Larawan 1. Ang pagsubok sa Mann-Whitney U ay inilalapat para sa paghahambing ng mga independiyenteng halimbawa. Pinagmulan: Pixabay.
Ang pagsubok ay madalas na inilalapat upang suriin kung may kaugnayan sa pagitan ng isang husay at isang variable na variable.
Ang isang nakalarawan na halimbawa ay ang pagkuha ng isang hanay ng mga hypertensive na tao at kunin ang dalawang grupo, mula sa kanino araw-araw na data ng presyon ng dugo ay naitala sa isang buwan.
Ang paggamot A ay inilalapat sa isang pangkat at paggamot B sa iba pa.Dito ang presyon ng dugo ay ang dami na variable at ang uri ng paggamot ay ang husay sa isa.
Nais naming malaman kung ang panggitna, at hindi ang ibig sabihin, ng mga sinusukat na halaga ay ayon sa istatistika pareho o naiiba, upang maitaguyod kung may pagkakaiba sa pagitan ng parehong paggamot. Upang makuha ang sagot, inilalapat ang istatistika ng Wilcoxon o Mann - Whitney U test.
Pahayag ng problema sa pagsubok sa Mann-Whitney U
Ang isa pang halimbawa kung saan maaaring mailapat ang pagsubok ay ang mga sumusunod:
Ipagpalagay na nais mong malaman kung ang pagkonsumo ng malambot na inumin ay naiiba sa dalawang rehiyon ng bansa.
Ang isa sa mga ito ay tinawag na rehiyon A at ang iba pang rehiyon B. Isang talaan ay pinananatiling litrong natupok lingguhan sa dalawang halimbawa: isa sa 10 katao para sa rehiyon A at isa pang 5 tao para sa rehiyon B.
Ang data ay ang mga sumusunod:
-Promote A : 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-Banggit B : 12,14, 11, 30, 10
Ang sumusunod na tanong ay lumitaw:
Kualitative variable kumpara sa dami variable
-Qualitative variable X : Rehiyon
-Quantitative variable Y : pagkonsumo ng mga soft drinks
Kung ang dami ng litro na natupok ay pareho sa parehong mga rehiyon, ang konklusyon ay walang pag-asa sa pagitan ng dalawang variable. Ang paraan upang malaman ay upang ihambing ang ibig sabihin o median na takbo para sa dalawang rehiyon.
Normal na kaso
Kung ang data ay sumusunod sa isang normal na pamamahagi, dalawang mga hypotheses ang iminungkahi: ang null H0 at ang kahaliling H1 sa pamamagitan ng paghahambing sa pagitan ng mga kahulugan:
- H0 : walang pagkakaiba sa pagitan ng ibig sabihin ng dalawang rehiyon.
- H1 : magkakaiba ang mga paraan ng parehong mga rehiyon.
Kaso na may hindi normal na takbo
Sa kabilang banda, kung ang data ay hindi sumusunod sa isang normal na pamamahagi o ang sample ay napakaliit lamang upang malaman ito, sa halip na paghahambing ng ibig sabihin, ang median ng dalawang rehiyon ay ihahambing.
- H0 : walang pagkakaiba sa pagitan ng median ng dalawang rehiyon.
- H1 : naiiba ang mga median ng parehong rehiyon.
Kung ang mga median ay nag-tutugma, pagkatapos ay ang null hypothesis ay natutupad: walang kaugnayan sa pagitan ng pagkonsumo ng mga malambot na inumin at ang rehiyon.
At kung ang kabaligtaran ay nangyayari, ang alternatibong hypothesis ay totoo: mayroong isang relasyon sa pagitan ng pagkonsumo at rehiyon.
Ito ay para sa mga kasong ito kung saan ipinapahiwatig ang pagsubok ng Mann - Whitney U.
Ipares o walang bayad na mga sample
Ang susunod na mahalagang katanungan sa pagpapasya kung ilapat ang pagsubok sa Mann Whitney U ay kung magkatulad ang bilang ng data sa parehong mga sample, na sasabihin na sila ay nasa par.
Kung ang dalawang halimbawa ay ipinares, ang orihinal na bersyon ng Wilcoxon ay ilalapat. Ngunit kung hindi, tulad ng kaso sa halimbawa, pagkatapos ay ang nabagong pagsubok na Wilcoxon ay inilalapat, na tiyak na pagsusuri sa Mann Whitney U.
Mga katangian ng pagsubok ng Mann Whitney U
Ang pagsubok sa Mann - Whitney U ay isang non-parametric test, na naaangkop sa mga sample na hindi sumusunod sa normal na pamamahagi o may kaunting data. Mayroon itong mga sumusunod na katangian:
1.- Ihambing ang mga median
2.- Gumagana ito sa iniutos na mga saklaw
3.- Ito ay hindi gaanong makapangyarihan, nangangahulugang ang kapangyarihan ay ang posibilidad na tanggihan ang null hypothesis kapag ito ay totoo.
Isinasaalang-alang ang mga katangiang ito, ang pagsubok sa Mann - Whitney U ay inilalapat kapag:
-Ang data ay independyente
-Hindi nila sinusunod ang normal na pamamahagi
-Ang null hypothesis H0 ay tatanggapin kung ang mga median ng dalawang halimbawa ay nag-tutugma: Ma = Mb
-Ang alternatibong hypothesis H1 ay tinatanggap kung magkakaiba ang mga median ng dalawang halimbawang: Ma ≠ Mb
Mann - formula ng Whitney
Ang variable U ay ang kaibahan na istatistika na ginamit sa pagsubok sa Mann - Whitney at tinukoy bilang mga sumusunod:
Nangangahulugan ito na ang U ang pinakamaliit sa mga halaga sa pagitan ng Ua at Ub, na inilalapat sa bawat pangkat. Sa aming halimbawa ay magiging sa bawat rehiyon: A o B.
Ang mga variable na Ua at Ub ay tinukoy at kinakalkula ayon sa sumusunod na pormula:
Ua = Na Nb + Na (Na +1) / 2 - Ra
Ub = Na Nb + Nb (Nb +1) / 2 - Rb
Narito ang mga halaga ng Na at Nb ay ang mga sukat ng mga halimbawang naaayon sa mga rehiyon A at B ayon sa pagkakabanggit, at para sa kanilang bahagi, Ra at Rb ang ranggo ng mga ranggo na aming tatukoy sa ibaba.
Mga hakbang upang ilapat ang pagsubok
1.- Mag-order ng mga halaga ng dalawang sampol.
2.- Magtalaga ng isang ranggo ng order sa bawat halaga.
3.- Ituwid ang umiiral na ugnayan sa data (paulit-ulit na mga halaga).
4.- Kalkulahin ang Ra = Sum ng ranggo ng sample A.
5.- Hanapin Rb = Kabuuan ng ranggo ng sample B.
6.- Alamin ang halaga ng Ua at Ub, ayon sa mga pormula na ibinigay sa nakaraang seksyon.
7.- Ihambing ang Ua at Ub, at ang mas maliit sa dalawa ay itinalaga sa pang-eksperimentong istatistika U (iyon ay, ng data) na inihambing sa teoretikal o normal na istatistika U.
Halimbawa ng praktikal na aplikasyon
Ngayon inilalapat namin ang nabanggit sa problema ng mga soft drinks na nakataas dati:
Rehiyon A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
Rehiyon B: 12,14, 11, 30, 10
Depende sa kung ang mga paraan ng parehong mga sample ay ayon sa istatistika pareho o naiiba, ang null hypothesis ay tinanggap o tinanggihan: walang kaugnayan sa pagitan ng mga variable na Y at X, iyon ay, ang pagkonsumo ng mga malambot na inumin ay hindi nakasalalay sa rehiyon:
H0: Ma = Mb
H1: Ma ≠ Mb

Larawan 2. Ang data ng pag-inom ng soft inumin sa mga rehiyon A at B. Pinagmulan: F. Zapata.
- Hakbang 1
Patuloy kaming mag-order ng data nang magkasama para sa dalawang mga halimbawa, pag-order ng mga halaga mula sa pinakamababang hanggang sa pinakamataas:

Pansinin na ang halaga 11 ay lilitaw ng 2 beses (isang beses sa bawat sample). Orihinal na ito ay may mga posisyon o saklaw ng 3 at 4, ngunit upang hindi masobrahan o maliitin ang isa o iba pa, ang average na halaga ay pinili bilang saklaw, iyon ay, 3.5.
Sa katulad na paraan, nagpapatuloy kami sa halagang 12, na paulit-ulit na tatlong beses na may mga saklaw ng 5, 6 at 7.
Well, ang halaga ng 12 ay itinalaga sa average na saklaw ng 6 = (5 + 6 + 7) / 3. At ang parehong para sa halaga 14, na may ligature (lumilitaw sa parehong mga sample) sa mga posisyon 8 at 9, itinalaga ang average na saklaw na 8.5 = (8 + 9) / 2.
- Hakbang 2
Susunod, ang data para sa Rehiyon A at B ay muling pinaghiwalay, ngunit ngayon ang kanilang mga kaukulang saklaw ay itinalaga sa ibang hilera:
Rehiyon A

Rehiyon B

Ang mga saklaw ng Ra at Rb ay nakuha mula sa kabuuan ng mga elemento ng ikalawang hilera para sa bawat kaso o rehiyon.
Hakbang 3
Ang kaukulang mga halaga ng Ua at Ub ay kinakalkula:
Ua = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31
Eksperimento na halaga U = min (19, 31) = 19
Hakbang 4
Ipinapalagay na ang teoretikal na U ay sumusunod sa isang normal na pamamahagi N na may mga parameter na ibinigay ng eksklusibo sa laki ng mga sample:
N ((na⋅nb) / 2, √)
Upang maihambing ang variable U na nakuha sa eksperimento, kasama ang teoretikal na U kinakailangan na gumawa ng isang pagbabago ng variable. Lumipat kami mula sa pang-eksperimentong variable U hanggang sa pamantayang halaga nito, na tatawaging Z, upang magawa ang paghahambing sa isang pamantayang normal na pamamahagi.
Ang pagbabago ng variable ay ang mga sumusunod:
Z = (U - na.nb / 2) / √
Dapat pansinin na para sa pagbabago ng variable ang mga parameter ng teoretikal na pamamahagi para sa U ay ginamit.Kaya ang bagong variable Z, na isang mestiso sa pagitan ng teoretikal na U at ang eksperimentong U, ay kaibahan sa isang pamantayang normal na pamamahagi N (0,1 ).
Mga pamantayan sa paghahambing
Kung Z ≤ Zα ⇒ ang null hypothesis H0 ay tinanggap
Kung Z> Zα ⇒ tanggihan ang null hypothesis H0
Ang standardized na Zα kritikal na mga halaga ay nakasalalay sa kinakailangang antas ng kumpiyansa, halimbawa, para sa isang antas ng kumpiyansa α = 0.95 = 95%, na siyang pinaka karaniwan, ang kritikal na halaga na Zα = 1.96 ay nakuha.
Para sa data na ipinakita dito:
Z = (U - na nb / 2) / √ = -0.73
Alin ang nasa ibaba ng kritikal na halaga ng 1.96.
Kaya ang pangwakas na konklusyon ay ang null hypothesis H0 ay tinanggap:
Mga Online na calculator para sa pagsubok sa Mann - Whitney U
Mayroong mga tiyak na programa para sa mga pagkalkula ng istatistika, kabilang ang SPSS at MINITAB, ngunit ang mga programang ito ay binabayaran at hindi laging madali ang paggamit nito. Ito ay dahil sa ang katunayan na nagbibigay sila ng maraming mga pagpipilian na ang kanilang paggamit ay praktikal na nakalaan para sa mga eksperto sa Statistics.
Sa kabutihang palad, mayroong isang bilang ng mga tumpak, libre, at madaling gamitin na mga programa sa online na nagbibigay-daan sa iyo upang patakbuhin ang pagsubok sa Mann-Whitney U, bukod sa iba pa.
Ang mga programang ito ay:
-Social Science Statistics (socscistatistics.com), na mayroong parehong pagsubok sa Mann-Whitney U at pagsubok ng Wilcoxon sa kaso ng balanseng o ipinares na mga sample.
-AI Therapy Statistics (ai-therapy.com), na mayroong ilang mga karaniwang pagsusuri ng mga naglalarawang istatistika.
-Matutuya sa Paggamit (pisika.csbsju.edu/stats), isa sa mga pinakaluma, kaya ang interface nito ay maaaring magmukhang napetsahan, bagaman ito ay isang napakahusay na libreng programa.
Mga Sanggunian
- Dietrichson. Mga pamamaraan ng dami: ranggo ng pagsubok. Nabawi mula sa: bookdown.org
- Gabay sa Marín J P. SPSS: Pagsusuri at mga pamamaraan sa mga di-parametric na pagsubok. Nabawi mula sa: halweb.uc3m.es
- USAL MOOC. Mga nonparametric na pagsubok: Mann-Whitney U Nabawi mula sa: youtube.com
- Wikipedia. Mann-Whitney U pagsubok. Nabawi mula sa: es.wikipedia.com
- XLSTAT. Tulong sa Sentro. Mann - Tutorial sa Whitney test sa Excel. Nabawi mula sa: help.xlsat.com
