Dadansoddi data

Oddi ar Wicipedia
Jump to navigation Jump to search
Engraifft o ddarlunio data
Engraifft o ddarlunio data
Siart yn dangos llinach Rhodri Mawr, Brenin Cymru a'i blant a'i wyrion ayb
Llun manwl
Rhan o'r graff uchod.

Mae dadansoddi data yn broses o archwilio, glanhau, trawsnewid a modelu data gyda'r nod o ddarganfod gwybodaeth ddefnyddiol, dod i gasgliadau, a chefnogi'r broses o wneud penderfyniadau. Mae gan ddadansoddi data sawl agwedd a thechnegau amrywiol o dan amrywiaeth o enwau. Caiff ei ddefnyddio mewn gwahanol feysydd busnes, gan gynnwys gwyddoniaeth a gwyddorau cymdeithasol, lle mae dadansoddi data'n chwarae rhan allweddol gan droi'r broses o wneud penderfyniadau yn broses mwy gwyddonol.[1]

Ystyrir technegau cloddio data yn rhan anhepgor o ddadansoddi data sy'n canolbwyntio ar fodelu a darganfod gwybodaeth ar gyfer rhagfynegi yn hytrach nag yn ddisgrifiadol yn unig.[2] O fewn cymhwyso ystadegau, gellir rhannu dadansoddi data yn ystadegaeth ddisgrifiol, ymchwilio'r data (EDA, neu exploratory data analysis) a chadarnhau'r ymchwil hwnnw (CDA, neu confirmatory data analysis). Y gwahaniaeth pennaf rhwng EDA a CDA yw fod y naill yn canolbwytio ar ddarganfod nodweddion newydd a bod y llall (CDA) yn canolbwytio ar gadarnhau (neu beidio) damcaniaethau cyfoes.

Mae dadansoddiadau rhagfynegol yn canolbwyntio ar gymhwyso modelau ystadegol ar gyfer rhagfynegi neu ddosbarthu rhagfynegol, tra bod 'dadansoddi testun' yn defnyddio technegau ystadegol, ieithyddol a strwythurol i dynnu a dosbarthu gwybodaeth. Mae'r rhain yn fathau gwahanol o ddadansoddi data.

Ystadegaeth gasgliadol[golygu | golygu cod y dudalen]

Searchtool.svg
Prif erthygl: Ystadegaeth gasgliadol

Ystadegaeth gasgliadol yw'r broses o ddefnyddio dadansoddi data i ddidynnu priodweddau sy'n sail i ddosbarthiad, o fewn tebygolrwydd. Mae'n cyfeirio at boblogaeth yng nghyd-destun dadansoddi'r ystadegau; er enghraifft, trwy brofi damcaniaethau a chanfod amcangyfrifon. Gellir cyferbynnu ystadegau gasgliadol ag ystadegaeth ddisgrifiol, sydd yn ymwneud yn unig â phriodweddau'r data dan sylw, ac nid yw'n gorffwys ar rwyfau'r rhagdybiaeth bod y data'n dod o boblogaeth fwy.

Gweler hefyd[golygu | golygu cod y dudalen]

Cyfeiriadau[golygu | golygu cod y dudalen]

  1. Xia, B. S., & Gong, P. (2015). Review of business intelligence through data analysis. Benchmarking, 21(2), 300-311. doi:10.1108/BIJ-08-2012-0050
  2. Exploring Data Analysis