Paradocs Simpson

Oddi ar Wicipedia
Jump to navigation Jump to search
Paradocs Simpson ar gyfer data mesurol: mae tuedd positif (coch a glas) yn ymddangos ar gyfer y dau grŵp ar wahân, ond mae tuedd negyddol (drylledig) yn ymddangos pan gyfunir y grwpiau.
Simpsons paradox - animation.gif
Mae'r delwedd hwn o baradocs Simpson ar ddata sy'n debyg i amrywioldeb y byd go iawn, yn dangos y gall fod yn anodd gweld camfarn y gwir berthynas.

Mae paradocs Simpson (neu wrthdroad Simpson, effaith Yule-Simpson, y paradocs uno, neu'r baradocs gwrthdroad)[1] yn ffenomen mewn tebygolrwydd ac ystadegaeth, lle mae tuedd yn ymddangos mewn sawl grŵp gwahanol o ddata ond yn diflannu neu'n gwrthdroi pan gyfunir y grwpiau hyn.

Mae'r canlyniad hwn yn aml yn ymddangos mewn ystadegau'r gwyddorau gymdeithasol a feddygol[2][3][4] ac mae'n dod yn broblem pan ddehonglir ddata amledd yn achosol. Gellir datrys y paradocs ystyrir chysylltiadau achosol yn briodol yn y modelau ystadegol.[5] Defnyddir paradocs Simpson fel enghraifft i ddangos i'r gynulleidfa anarbenigol neu gyhoeddus y math o ganlyniadau camarweiniol y gall cam-gymhwyso ystadegau eu cynhyrchu.[6] Ysgrifennodd Martin Gardner gyfrif poblogaidd o baradocs Simpson yn ei golofn Mathematical Games Mawrth yn 1976 yn y Scientific American.[7]

Disgrifiodd Edward H. Simpson y ffenomen hon yn gyntaf mewn papur technegol ym 1951,[8] ond soniodd yr ystadegwyr Karl Pearson et al., ym 1899,[9] ac Udny Yule, ym 1903,[10] am effeithiau tebyg yn gynharach. Cyflwynodd Colin R. Blyth yr enw paradocs Simpson ym 1972.[11]

Enghreifftiau[golygu | golygu cod y dudalen]

Rhagfarn rhyw UC Berkeley[golygu | golygu cod y dudalen]

Un o'r enghreifftiau mwyaf adnabyddus o baradocs Simpson yw astudiaeth o ragfarn ar sail rhyw ymhlith derbyniadau ôl-radd i Brifysgol Califfornia, Berkeley. Dangosodd y ffigurau derbyn ar gyfer hydref 1973 fod dynion a wnaeth gais yn fwy tebygol na menywod o gael eu derbyn, ac roedd y gwahaniaeth mor fawr fel ei bod yn annhebygol o fod oherwydd siawns.[12]

Dynion Menywod
Ymgeiswyr Derbyniwyd Ymgeiswyr Derbyniwyd
Cyfanswm 8442 44% 4321 35%

Ond wrth edrych ar yr adrannau unigol, roedd yn ymddangos bod chwech o'r 85 adran yn rhagfarnu'n sylweddol yn erbyn dynion, lle dim ond pedair oedd â rhagfarn sylweddol yn erbyn menywod. Mewn gwirionedd, pan cyfunwyd y data yn gywir, ymddangosodd "rhagfarn bach ond ystadegol arwyddocaol o blaid menywod".[12] Rhestrir y data o'r chwe adran fwyaf isod: y ddwy adran gyda'r mwyaf ymgeiswyr ar gyfer pob rhyw wedi'i italeiddio.

Adran Dynion Menywod
Ymgeiswyr Derbyniwyd Ymgeiswyr Derbyniwyd
A. 825 62% 108 82%
B. 560 63%   25 68%
C. 325 37% 593 34%
Ch. 417 33% 375 35%
D. 191 28% 393 24%
Dd. 373   6% 341 7%

Mewn papur ymchwil gan Bickel et al.[12] casglwyd bod menywod yn tueddu i wneud cais i adrannau cystadleuol sydd â chyfraddau derbyn isel hyd yn oed ymhlith ymgeiswyr cymwys (megis yn yr Adran Saesneg), tra bod dynion yn tueddu i wneud cais i adrannau llai cystadleuol gyda chyfraddau derbyn uchel ymhlith yr ymgeiswyr cymwys (megis mewn peirianneg a chemeg).

Triniaeth carreg yn yr arennau[golygu | golygu cod y dudalen]

Dyma enghraifft bywyd go iawn o astudiaeth feddygol[13] yn gymharu cyfraddau llwyddiant dwy driniaeth ar gyfer cerrig yn yr arennau.[14]

Mae'r tabl isod yn dangos cyfraddau llwyddiant a nifer y triniaethau ar gyfer triniaethau sy'n cynnwys cerrig bach a cerrig mawr yn yr arennau, lle mae Triniaeth A yn cynnwys yr holl driniaethau llawfeddygol agored a Thriniaeth B yw neffrolithotomi trwy'r croen (pwniad bach yn unig). Mae'r niferoedd mewn cromfachau yn nodi nifer yr achosion llwyddiannus dros gyfanswm maint y grŵp.

Triniaeth A Triniaeth B
Cerrig bach Grŵp 1



93% (81/87)
Grŵp 2



87% (234/270)
Cerrig mawr Grŵp 3



73% (192/263)
Grŵp 4



69% (55/80)
Y ddau 78% (273/350) 83% (289/350)

Y casgliad paradocsaidd yw bod triniaeth A yn fwy effeithiol pan defnyddir ar gerrig bach, a hefyd pan defnyddir ar gerrig mawr. Ond mae triniaeth B yn fwy effeithiol wrth ystyried y ddau faint ar yr un pryd. Yn yr enghraifft hon, y newidyn "llechu" (neu'r newidyn dryslyd) yw difrifoldeb yr achos (a gynrychiolir gan duedd i feddygon ffafrio triniaeth B mewn achosion llai difrifol).

Y peth sy'n achosi'r paradocs fan hyn yw anghydraddoldeb rhwng y cymarebau:

  1. Mae maint y grwpiau, sy'n cael eu cyfuno pan anwybyddir y newidyn dryslyd, yn wahanol iawn. Mae meddygon yn tueddu i roi'r driniaeth well (A) i'r achosion difrifol (cerrig mawr), a'r driniaeth israddol (B) i'r achosion llai (cerrig bach). Felly grwpiau 3 a 2 sy'n dominyddu'r cyfansymiau, yn hytrach na'r ddau grŵp llawer llai 1 a 4.
  2. Mae'r newidyn dryslyd yn cael effaith fawr ar y cymarebau; h.y, mae'r gyfradd llwyddiant yn cael ei dylanwadu'n gryfach gan ddifrifoldeb yr achos na chan y dewis o driniaeth. Felly, mae'r grŵp o gleifion â cherrig mawr yn gwneud yn waeth na'r grŵp â cherrig bach pa bynnag triniaeth a ddefnyddir.

Cydberthynas rhwng newidynnau[golygu | golygu cod y dudalen]

Gall paradocs Simpson hefyd godi yng nghydberthnasau, lle mae'n ymddangos (er enghraifft) bod gan ddau newidyn gydberthynas positif tuag at ei gilydd, pan mewn gwirionedd mae ganddyn nhw gydberthynas negyddol. Mae'r gwrthdroad hyn wedi ei achosi gan newidyn dryslyd anhysbys. Rhoddodd Berman et al.[15] enghraifft o maes economeg, lle gall set ddata yn awgrymu bod cydberthynas positif rhwng y galw a'r pris (hynny yw, mae prisiau uwch yn arwain at fwy o alw), yn groes i'r disgwyliad. Mae dadansoddi pellach yn datgelu'r taw amser yw'r newidyn dryslyd: mae plotio pris a galw yn erbyn amser yn datgelu'r gydberthynas negyddol ddisgwyliedig dros nifer o gyfnodau, sydd wedyn yn gwrthdroi i ddod yn bositif os anwybyddir dylanwad amser trwy ond plotio galw yn erbyn pris.

Tebygolrwydd[golygu | golygu cod y dudalen]

Mewn papur gan Pavlides a Perlman cyflwynir prawf fod hap-dabl 2 × 2 × 2 gyda dosbarthiad unffurf yn dangos paradocs Simpson gyda thebygolrwydd yn union 1/60.

Ail baradocs Simpson[golygu | golygu cod y dudalen]

Trafodwyd "ail" paradocs Simpson, llai adnabyddus, yn ei bapur yn 1951. Gall digwydd pan mae'r dehongliad rhesymol i'w weld yn y tabl cyfun, nid yn y tabl wedi'i ei hollti gan y newidyn dryslyd. Mae'r fath o'r data y dylid ei ddefnyddio yn dibynnu ar y cefndir a'r broses sy'n arwain at y data.

Mae Norton a Divine yn rhoi enghraifft ddamcaniaethol o'r ail baradocs.[16]

Cyfeiriadau[golygu | golygu cod y dudalen]

  1. I. J. Good, Y. Mittal (June 1987). "The Amalgamation and Geometry of Two-by-Two Contingency Tables". The Annals of Statistics 15 (2): 694–711. doi:10.1214/aos/1176350369. ISSN 0090-5364. JSTOR 2241334.
  2. Clifford H. Wagner (February 1982). "Simpson's Paradox in Real Life". The American Statistician 36 (1): 46–48. doi:10.2307/2684093. JSTOR 2684093.
  3. Holt, G. B. (2016). Potential Simpson's paradox in multicenter study of intraperitoneal chemotherapy for ovarian cancer. Journal of Clinical Oncology, 34(9), 1016-1016.
  4. Franks, Alexander; Airoldi, Edoardo; Slavov, Nikolai (2017). "Post-transcriptional regulation across human tissues". PLOS Computational Biology 13 (5): e1005535. arXiv:1506.00219. doi:10.1371/journal.pcbi.1005535. ISSN 1553-7358.
  5. Kock, N., & Gaskins, L. (2016). Simpson's paradox, moderation and the emergence of quadratic relationships in path models: An information systems illustration. International Journal of Applied Nonlinear Science, 2(3), 200-234.
  6. Robert L. Wardrop (February 1995). "Simpson's Paradox and the Hot Hand in Basketball". The American Statistician, 49 (1): pp. 24–28.
  7. Gardener, Martin (March 1979). "MATHEMATICAL GAMES: On the fabric of inductive logic, and some probability paradoxes". Scientific American 234 (3): 119. doi:10.1038/scientificamerican0376-119. http://flowcytometry.sysbio.med.harvard.edu/files/flowcytometryhms/files/herzenbergfacshistory.pdf#129. Adalwyd 28 February 2017.
  8. Simpson, Edward H. (1951). "The Interpretation of Interaction in Contingency Tables". Journal of the Royal Statistical Society, Series B 13: 238–241.
  9. Pearson, Karl; Lee, Alice; Bramley-Moore, Lesley (1899). "Genetic (reproductive) selection: Inheritance of fertility in man, and of fecundity in thoroughbred racehorses". Philosophical Transactions of the Royal Society A 192: 257–330. doi:10.1098/rsta.1899.0006.
  10. G. U. Yule (1903). "Notes on the Theory of Association of Attributes in Statistics". Biometrika 2 (2): 121–134. doi:10.1093/biomet/2.2.121. https://zenodo.org/record/1431599.
  11. Colin R. Blyth (June 1972). "On Simpson's Paradox and the Sure-Thing Principle". Journal of the American Statistical Association 67 (338): 364–366. doi:10.2307/2284382. JSTOR 2284382.
  12. 12.0 12.1 12.2 P.J. Bickel, E.A. Hammel and J.W. O'Connell (1975). "Sex Bias in Graduate Admissions: Data From Berkeley". Science 187 (4175): 398–404. doi:10.1126/science.187.4175.398. PMID 17835295. http://homepage.stat.uiowa.edu/~mbognar/1030/Bickel-Berkeley.pdf.
  13. C. R. Charig; D. R. Webb; S. R. Payne; J. E. Wickham (29 March 1986). "Comparison of treatment of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal shockwave lithotripsy". Br Med J (Clin Res Ed) 292 (6524): 879–882. doi:10.1136/bmj.292.6524.879. PMC 1339981. PMID 3083922. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=1339981.
  14. Steven A. Julious; Mark A. Mullee (3 December 1994). "Confounding and Simpson's paradox". BMJ 309 (6967): 1480–1481. doi:10.1136/bmj.309.6967.1480. PMC 2541623. PMID 7804052. http://bmj.bmjjournals.com/cgi/content/full/309/6967/1480.
  15. Berman, S. DalleMule, L. Greene, M., Lucker, J. (2012), "Simpson’s Paradox: A Cautionary Tale in Advanced Analytics", Significance.
  16. Norton, H. James; Divine, George (August 2015). "Simpson's paradox … and how to avoid it". Significance 12 (4): 40–43. doi:10.1111/j.1740-9713.2015.00844.x. http://doi.wiley.com/10.1111/j.1740-9713.2015.00844.x.