Prawf U Mann–Whitney

Mewn ystadegaeth, prawf U Mann-Whitney (a elwir hefyd y prawf Mann-Whitney-Wilcoxon, prawf swm safle Wilcoxon, neu brawf Wilcoxon-Mann-Whitney) yw prawf amharamedrig o'r rhagdybiaeth nwl bod, ar gyfer gwerthoedd a ddewiswyd ar hap X ac Y o ddwy boblogaeth, mae'r tebygolrwydd y bydd X yn fwy nag Y yn hafal i'r tebygolrwydd y bydd Y yn fwy na X.

Tybiaethau a datganiad ffurfiol y rhagdybiaethau[golygu | golygu cod]

Mae yna nifer o ffyrdd eraill o ffurfio'r rhagdybiaethau nwl ac amgen fel bod y prawf U Mann-Whitney yn ddilys.^[1] Yn wreiddiol gwnaeth Henry Mann a Donald Ransom Whitney^[2] ddatblygu'r prawf o dan y dybiaeth o ymatebion di-dor i wirio os yw un dosraniad yn stocastig yn fwy na'r llall. Yn fwy cyffredinol, tybiwn fod:

holl arsylwadau o'r ddau grŵp yn annibynnol o'i gilydd,
yr ymatebion yn drefnol (ordinal), h.y., o leiaf gallwn ddweud os yw un arsylwad yn fwy na'r llall,
o dan y rhagdybiaeth nwl H₀, mae dosraniad y ddwy boblogaeth yn gyfartal.
y rhagdybiaeth amgen H₁ yw nad yw'r dosraniadau'n gyfartal.

O dan y fformiwleiddiad cyffredinol hwn, mae'r prawf ond yn gyson pan fydd y canlynol yn digwydd: o dan H₁:

mae'r tebygolrwydd bod arsylwad o boblogaeth X fwy nag arsylwad o boblogaeth Y yn wahanol i'r tebygolrwydd bod arsylwad o Y yn fwy nag arsylwad o X; h.y., $P(X > Y) \neq P(Y > X)$ neu $P(X > Y) + 0.5 \cdot P(X = Y) \neq 0.5$ .

Cyfrifiadau[golygu | golygu cod]

Er mwyn gwneud y prawf mae angen cyfrifo ystadegyn, a elwir fel arfer yn U, y mae ei ddosbarthiad o dan y rhagdybiaeth nwl yn hysbys. Yn achos samplau bach, gellir darllen gwerthoedd y dosraniad o dablau ystadegol. Ar gyfer meintiau sampl mwy na tua 20, gallwn ei frasamcanu gan ddefnyddio'r dosbarthiad Normal yn weddol dda.

Mae prawf U Mann-Whitney wedi'i gynnwys yn y mwyafrif o feddalwedd ystadegol modern. Mae hefyd yn hawdd ei gyfrif gan law, yn enwedig ar gyfer samplau bach. Mae dwy ffordd o wneud hyn.

Dull un:

Ar gyfer cymharu dwy set fach o arsylwadau, mae dull uniongyrchol hwn yn gyflym, ac yn rhoi mewnwelediad i ystyr yr ystadegyn U. Mae'n cyfateb i nifer o weithiau, allan o'r holl gystadlaethau fesul pâr, y mae un boblogaeth yn ennill dros y boblogaeth arall. Ar gyfer pob arsylwad mewn un set, cyfrifwch y nifer o weithiau mae'r gwerth cyntaf hwn yn ennill dros unrhyw arsylwadau yn y set arall (mae'r gwerth arall yn colli os yw'r cyntaf hwn yn fwy). Cyfrif 0.5 ar gyfer unrhyw sgôr gyfartal. Y swm hwn yw U, h.y. $U_{1}$ ar gyfer y set gyntaf. Yna U ar gyfer yr ail set yw gwrthwyneb, $U_{2}$ .

Dull dau:

Ar gyfer samplau mwy:

Labelwch yr holl arsylwadau a'u safleoedd pan mae'r ddau grŵp yn yr un set. Dechreuwch gydag 1 am y gwerth lleiaf, ac yn y blaen. Lle mae gan arsylwadau werthoedd cyfartal, labelwch hwy i gyd gyda'r canolbwynt. E.e., os y gwerthoedd yw $(3, 5, 5, 5, 5, 8)$ , yna'i labeli safle yw $(1, 3.5, 3.5, 3.5, 3.5, 6)$ .
Nawr, symiwch y labeli ar gyfer yr arsylwadau a ddaeth o'r boblogaeth gyntaf, hwn yw R₁. Swm labeli'r ail boblogaeth yw R₂. (Gan fod R₁+R₂ = N(N+1)/2, lle N yw nifer yr arsylwadau, yna gallwn wirio'n cyfrifiadau).
Yna rhoddir yr ystadegyn U gan:^[3] $U_{1}=R_{1}-{n_{1}(n_{1}+1) \over 2}\,\!$ lle n₁ yw maint y sampl ar gyfer y boblogaeth gyntaf. Sylwch nad oes ots pa un o'r ddwy boblogaeth sy'n cael ei ystyried fel yr un cyntaf. Ar gyfer yr ail boblogaeth: $U_{2}=R_{2}-{n_{2}(n_{2}+1) \over 2}\,\!$ Gwerth lleiaf U₁ ac U₂ yw'r ystadegyn a ddefnyddir am y prawf: $U=\min(U_{1},U_{2})$ . Rhoddir swm y ddau werth gan $U_{1}+U_{2}=R_{1}-{n_{1}(n_{1}+1) \over 2}+R_{2}-{n_{2}(n_{2}+1) \over 2}.\,\!$ Gan wybod bod $R 1 + R 2 = N (N + 1)/2$ ac $N = n 1 + n 2$ , gwelwn fod y swm y $U 1 + U 2 = n 1 n 2$ .
Yna gallwn gymharu U gyda thablau ystadegol. Os yw U yn fwy na'r gwerth critigol yna mae digon o dystiolaeth i wrthod y rhagdybiaeth nwl, os yw U yn llai na'r gwerth critigol does dim.

Enghraifft[golygu | golygu cod]

Tybiwch ein bod cynnal prawf i weld os yw crwbanod yn fwy tebygol o guro cwningod mewn ras. Casglwn sampl o 10 crwman a 10 cwningen, ac maent yn rasio ar yr un pryd. Y drefn gwnaethant groesi'r llinell gorffen, yn ysgrifennu T am grwban a H am gwningen, yw:

H T T H H H H H H T T T H T T T H T H T

H₀ yw bod safleoedd y crwbanod yn gyfartal i safleoedd y cwningod, a H₁ yw bod un anifail ynn gwell yn rasio na'r llall.

Beth yw gwerth U?

Gan ddefnyddio'r dull cyntaf: rydyn ni'n cymryd pob crwban yn ei dro, ac yn cyfrif nifer o gwningod y mae'n eu curo, sef 9, 9, 3, 3, 3, 2, 2, 2, 1, a 0, sy'n golygu bod U₁ = 34. Fel arall, gallem gymryd pob cwningen yn ei thro, a chyfrif nifer y crwbanod y mae'n eu curo. Yn yr achos hwn, rydym yn cael 10, 8, 8, 8, 8, 8, 8, 5, 2, 1 felly U₂ = 66. Sylwch fod swm y ddau werth hyn ar gyfer U₁ + U₂ = 100, sef 10×10.
Gan ddefnyddio'r ail ddull: labelwch yr anifeiliaid gyda'r drefn y maen nhw'n gorffen y ras, felly labelwch yr anifail a ddaeth gyntaf gyda 20, yr anifail a ddaeth yn ail gyda 19, ac ati. Swm labeli'r grwbanod yw 20 + 18 + 16 + 15 + 14 + 12 + 11 + 10 + 3 + 2 = 121. Felly U₁ = 121 - (10 × 11) / 2 = 121 - 55 = 66. Swm labeli'r cwningod yw 19 + 17 + 13 + 9 + 8 + 7 + 6 + 5 + 4 + 1 = 89. Felly U₂ = 89 - 55 = 34.

Nawr $U=\min(66,34)=34$ . O dablau ystadegol^[4] y gwerth critigol yw 8, felly gallwn wrthod y rhagdybiaeth nwl.

Hanes[golygu | golygu cod]

Ymddangosodd yr ystadegyn yn gyntaf mewn erthygl yn 1914^[5] gan yr Almaenwr Gustav Deuchler (gyda therm coll yn ei amrywiant).

Mewn un papur ym 1945, cynigiodd Frank Wilcoxon^[6] y prawf swm safle un sampl a'r prawf swm safle dau sampl, yn gwirio poblogaethau cyfartal yn erbyn poblogaethau nad yw'n gyfartal). Fodd bynnag, yn y papur hwnnw dim ond ychydig bwyntiau a gyflwynodd ar gyfer yr achos lle mae'r meintiau sampl yn gyfartal (er mewn papur diweddarach rhoddodd dablau mwy).

Ymddangosodd dadansoddiad trylwyr o'r ystadegyn yn yr erthygl gan Henry Mann a'i fyfyriwr Donald Ransom Whitney ym 1947.^[2] Trafododd yr erthygl hon y rhagdybiaethau amgen. Fe wnaeth y papur hwn hefyd gyfrifo pedair moment gyntaf a sefydlodd bod gan yr ystadegyn terfan Normal, gan sefydlu felly ei fod yn annibynnol o ddosraniad yn asymptotig.

Nodiadau[golygu | golygu cod]

↑ Fay, Michael P.; Proschan, Michael A. (2010). "Wilcoxon–Mann–Whitney or t-test? On assumptions for hypothesis tests and multiple interpretations of decision rules". Statistics Surveys 4: 1–39. doi:10.1214/09-SS051. MR 2595125. PMC 2857732. PMID 20414472. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2857732.
↑ ^2.0 ^2.1 Mann, Henry B.; Whitney, Donald R. (1947). "On a Test of Whether one of Two Random Variables is Stochastically Larger than the Other". Annals of Mathematical Statistics 18 (1): 50–60. doi:10.1214/aoms/1177730491. MR 22058. Zbl 0041.26103. https://archive.org/details/sim_annals-of-mathematical-statistics_1947-03_18_1/page/50.
↑ Zar, Jerrold H. (1998). Biostatistical Analysis. New Jersey: Prentice Hall International, INC. t. 147. ISBN 978-0-13-082390-8.
↑ "Mann-Whitney Table | Real Statistics Using Excel" (yn Saesneg). Cyrchwyd 2020-10-18.
↑ Kruskal, William H. (September 1957). "Historical Notes on the Wilcoxon Unpaired Two-Sample Test". Journal of the American Statistical Association 52 (279): 356–360. doi:10.2307/2280906. JSTOR 2280906. https://archive.org/details/sim_journal-of-the-american-statistical-association_1957-09_52_279/page/356.
↑ Wilcoxon, Frank (1945). "Individual comparisons by ranking methods". Biometrics Bulletin 1 (6): 80–83. doi:10.2307/3001968. JSTOR 3001968.

[1] Fay, Michael P.; Proschan, Michael A. (2010). "Wilcoxon–Mann–Whitney or t-test? On assumptions for hypothesis tests and multiple interpretations of decision rules". Statistics Surveys 4: 1–39. doi:10.1214/09-SS051. MR 2595125. PMC 2857732. PMID 20414472. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2857732.

[mannwhitney1947-2] 2.0 ^2.1 Mann, Henry B.; Whitney, Donald R. (1947). "On a Test of Whether one of Two Random Variables is Stochastically Larger than the Other". Annals of Mathematical Statistics 18 (1): 50–60. doi:10.1214/aoms/1177730491. MR 22058. Zbl 0041.26103. https://archive.org/details/sim_annals-of-mathematical-statistics_1947-03_18_1/page/50.

[3] Zar, Jerrold H. (1998). Biostatistical Analysis. New Jersey: Prentice Hall International, INC. t. 147. ISBN 978-0-13-082390-8.

[4] "Mann-Whitney Table | Real Statistics Using Excel" (yn Saesneg). Cyrchwyd 2020-10-18.

[Kruskal57-5] Kruskal, William H. (September 1957). "Historical Notes on the Wilcoxon Unpaired Two-Sample Test". Journal of the American Statistical Association 52 (279): 356–360. doi:10.2307/2280906. JSTOR 2280906. https://archive.org/details/sim_journal-of-the-american-statistical-association_1957-09_52_279/page/356.

[wilcoxon1945-6] Wilcoxon, Frank (1945). "Individual comparisons by ranking methods". Biometrics Bulletin 1 (6): 80–83. doi:10.2307/3001968. JSTOR 3001968.

[1]

[2]

[3]

[4]

[5]

[6]