Dilema'r carcharorion

Oddi ar Wicipedia
(Ailgyfeiriad o Cyfyng-gyngor y carcharor)

Enghraifft o gêm fathemategol yw Dilema'r Carcharorion a astudir yn namcaniaeth gemau. Mae'n enghraifft safonol sy'n dangos neu'n esbonio pam gall dau unigolyn rhesymegol peidio â chydweithio, er taw'r peth gorau i'r ddau unigolyn ei wneud bydd i gydweithio. Gosodwyd yn wreiddiol gan Merrill Flood a Melvin Dresher wrth weithio i RAND yn 1950. Yna cafodd ei ffurfioli gan Albert W. Tucker gyda'r gosodiad carcharorion, a'i ail-enwi'r "dilema carcharorion" (prisoner's dilemma).[1] Cyflwynwyd fel y ganlyn:

Arestiwyd a charcharwyd dau aelod o griw troseddol, A a B. Mae'r ddau yn cael ei wahanu a'i rhoi mewn celloedd ar ben ei hun, heb unrhyw ffordd o siarad â'i gilydd. Does dim digon o dystiolaeth i'w gyhuddo am drosedd mawr, ond mae digon i'w gyhuddo am drosedd llai. Ar yr un pryd, mae dau heddwas yn cynnig bargen i'r ddau garcharwr. Mae gan bob carcharwr y cyfle i fradychu'r llall trwy fframio'r llall am y trosedd mawr, neu i gydweithio a'r llall trwy aros yn dawel. Y posibiliadau yw:

  • Os yw A a B yn bradychu ei gilydd, mae'r ddau yn hala dwy flynedd yn y carchar
  • Os yw A yn bradychu B, ac mae B yn aros yn dawel, yna rhyddhawyd A a fydd B yn hala tair blynedd yn y carchar (ac i'r gwrthwyneb)
  • Os yw A a B yn aros yn dawel bydd y ddau yn hala un flwyddyn yn y carchar (am y trosedd llai)

Yn y sefyllfa hon does dim modd i'r carcharorion cosbi'i gilydd, heblaw am y blynyddoedd yn y carchar a osodir gan y dilema ei hun. Gan fod bradychu eich partner trwy'r amser yn arwain tuag at lai o gosb na chydweithio, bydd unrhyw unigolyn rhesymegol hunanol trwy'r amser yn dewis i fradychu.[2] Y peth diddorol am hyn yw, os yw'r ddau unigolyn yn ymddwyn yn rhesymegol hunanol, yna bydd y ddau yn bradychu ei gilydd, sy'n arwain at gosb fwy na os bydd y ddau unigolyn yn cadw'n dawel.

Y gêm[golygu | golygu cod]

Gellir cyffredinoli Dilema'r Carcharorion o'i osodiad gwreiddiol. Tybiwch fod dau chwaraewr wedi'u cynrychioli gan y lliwiau coch a glas, a gall pob un chwaraewr dewis i naill ai "Cydweithio" neu "Bradychu".

Os yw'r ddau chwaraewr yn cydweithio, maent yn ennill gwobr R. Os yw'r ddau chwaraewr yn bradychu ei gilydd, maent yn derbyn gwobr cosb P. Os yw'r chwaraewr glas yn bradychu tra bod y chwaraewr coch yn cydweithio, yna mae'r chwaraewr glas yn derbyn gwobr temtasiwn T, tra bod y chwaraewr coch yn derbyn gwobr "sucker" S. Yn debyg, yn y sefyllfa wrthwyneb, os yw'r chwaraewr glas yn cydweithio tra bod y chwaraewr coch yn bradychu, mae'r chwaraewr glas yn derbyn gwobr S tra bod y chwaraewr coch yn derbyn gwobr T.

Gellir mynegi'r gêm yn y ffurf normal:

Cydweithio Bradychu
Cydweithio (R, R) (S, T)
Bradychu (T, S) (P, P)

Er mwyn i hwn fod yn Dilema'r Carcharorion, mae angen i T > R > P > S.

Enghreifftiau bywyd go iawn[golygu | golygu cod]

Mae nifer o enghreifftiau bywyd go iawn sy'n cyfateb i Dilema'r Carcharorion:

  • Yr amgylchedd: Mae'r dilema yn ymddangos o fewn yr argyfwng amgylcheddol a newid hinsawdd fyd-eang. Gall pob gwlad elwa o hinsawdd sefydlog, ond mae pob gwlad yn poeni am leihau lledaeniad carbon deuocsid. Os bydd pob gwlad yn cydweithio bydd budd i bawb, ond os nad yw un neu fwy o wledydd yn ceisio lleihau eu holion traed carbon gall achosi niwed i bawb.[3]
  • Seicoleg: Gellir meddwl am atgwymp rhyw ddibyniaeth fel dilema'r carcharorion rhwng y claf presennol a'r claf dyfodol, lle'r canlyniad gorau bydd i'r ddau chwaraewr, y claf presennol a'r claf dyfodol, i beidio atgwympo.[4]
  • Economeg: Mae hysbysebu sigaréts wedi cael ei ddisgrifio fel dilema'r carcharorion. Os oes dau gwmni sigarét yn hysbysebu ar yr un pryd, mae effaith yr hysbyseb yn canslo allan, ac mae'r ddau gwmni wedi gwastraffu arian. Os yw ond un cwmni yn hysbysebu, byddant yn cymryd masnach oddi ar y cwmni arall.[5]
  • Chwaraeon: Mae drygio yn chwaraeon wedi cael ei ddisgrifio fel dilema'r carcharorion. Os yw un chwaraewr yn dewis cymryd cyffuriau i wella perfformiad, bydd gan y chwaraewr yna mantais dros ei gwrthwynebwyr, ond mae risg o golli popeth os caiff ei ddal. Os yw'r pob chwaraewr yn dewis cymryd cyffuriau i wella perfformiad nid oes gan unrhyw chwaraewr mantais, ac ond y risg o gael eich dal sydd ar ôl.[6]

Dilema ailadroddol y carcharorion[golygu | golygu cod]

Os chwaraeir Dilema'r Carcharorion tro ar ôl tro, mae'r chwaraewyr yn cofio hanes y gêm, ac yn newid ei strategaeth o ganlyniad. Gelwir hwn yn Dilema Ailadroddol y Carcharorion (Iterated Prisoner's Dilemma) neu IPD. Yn ogystal â'r ffurf gyffredinol uchod, mae angen i'r fersiwn ailadroddol cael 2R > T + S, er mwyn rhwystro'r strategaeth o amnewid rhwng cydweithio a bradychu pob yn ail rhoi wobr fwy na chydweithio cilyddol.

Mae dilema ailadroddol y carcharorion yn sylfaenol i nifer o ddamcaniaethau am gydweithio dynol ac ymddiriedaeth. Wrth dybio bod y gêm yn gallu modelu trafodaethau rhwng dau berson sydd angen ymddiriedaeth, gallwn fodelu ymddygiad cydweithiol mewn poblogaethau trwy fersiwn aml-chwaraewr, ailadroddol o'r gêm. Felly mae wedi dal sylw nifer o ysgolheigion dros y blynyddoedd. Yn 1975 amcangyfrifodd Grofman a Pool bod mwy na 2,000 o erthyglau academaidd wedi ei astudio. Gelwir yr IPD hefyd y "gêm Heddwch-Rhyfel".[7]

Astudir fersiwn cyfrifiadurol o dwrnameintiau'r dilema ailadroddol yn aml.[8] Bydd ymchwilwyr yn chwarae strategaethau yn erbyn ei gilydd megis 'Cydweithiwr' sy'n cydweithio pob tro, 'Bradychwr' sy'n bradychu pob tro, 'Tit-for-Tat' sy'n newid pob yn ail, a 'Grudger' sy'n dechrau wrth gydweithio nes i'w wrthwynebydd bradychu, yna bydd yn bradychu pob to. Mae fersiwn esblygol o'r twrnamaint yn gallu esbonio ymddangosiad allgarwch a chydweithredu ynghylch bodau byw mewn natur.

Cyfeiriadau[golygu | golygu cod]

  1. "Encyclopaedia Britannica".
  2. Milovsky, Nicholas. The Basics of Game Theory and Associated Games. https://issuu.com/johnsonnick895/docs/game_theory_paper.CS1 maint: location (link)
  3. "Playing Games With the Planet". The Economist.
  4. Ainslie, George, 1944- (2001). Breakdown of will. Cambridge: Cambridge University Press. ISBN 0-511-03912-3. OCLC 559155771.CS1 maint: multiple names: authors list (link)
  5. Axelrod, Robert (1980). "Effective Choice in the Prisoner's Dilemma". The Journal of Conflict Resolution 24 (1): 3–25. ISSN 0022-0027. http://www.jstor.org/stable/173932.
  6. SCHNEIER, BRUCE (2012-10-26). "Lance Armstrong and the Prisoners' Dilemma of Doping in Professional Sports". Wired. ISSN 1059-1028. Cyrchwyd 2019-11-25.
  7. Shy, Oz. (1995). Industrial organization : theory and applications. Cambridge, Mass.: MIT Press. ISBN 0-585-13511-8. OCLC 43476822.
  8. Knight, Vincent; Campbell, Owen; Harper, Marc; Langner, Karol; Campbell, James; Campbell, Thomas; Carney, Alex; Chorley, Martin et al. (2016-08-31). "An Open Framework for the Reproducible Study of the Iterated Prisoner’s Dilemma" (yn en). Journal of Open Research Software 4 (1): e35. doi:10.5334/jors.125. ISSN 2049-9647. http://openresearchsoftware.metajnl.com/article/10.5334/jors.125/.