Ensembl

Oddi ar Wicipedia
Jump to navigation Jump to search

Prosiect gwyddonol yw Ensembl sydd yn cael ei redeg ar y cyd gan y Sefydliad Biowybodeg Ewropeaidd a Sefydliad Sanger yr Ymddiriedolaeth Wellcome. Cafodd ei lansio yn 1999 fel yr oedd Prosiect y Genom Dynol yn dirwyn i ben.[1] Nod y prosiect yw i ddarparu adnodd canolog ar gyfer genetegwyr, biolegwyr moleciwlaidd ac ymchwilwyr eraill sy'n astudio genomau dynol, fertebrau eraill ac organebau model.[2] Mae Ensembl yn un o lawer o borwyr genom a ddefnyddir gan wyddonwyr ar gyfer adalw gwybodaeth genomig.

Cefndir[golygu | golygu cod y dudalen]

Mae'r genom dynol yn cynnwys tri biliwn pâr o fasau, sy'n codio am tua 20,000–25,000 genyn. Ond does dim llawer i'w ganfod o wybod dilyniant y genom ar ben ei hun heb wybod hefyd am leoliadau genynau a'r cysylltiadau rhyngddynt. Mae modd anodi'r lleoliadau yma â llaw, gan ddefnyddio data o arbrofion wedi eu cyhoeddi mewn cyfnodolion gwyddonol. Fodd bynnag, mae hyn yn waith araf a dyfal. Opsiwn arall yw anodiad awtomatig – defnyddio pŵer cyfrifiadurol i gymharu dilyniannau protein a DNA.

Yn y prosiect Ensembl, mae data dilyniant genom yn cael ei fwydo i mewn i system anodi gyfrifiadurol (cyfres o sgriptiau yn yr iaith gyfrifiadurol Perl), gan greu casgliad o leoliadau genynau rhagweledig a'u harbed mewn cronfa ddata ar gyfer eu hymdrin ymhellach. Mae Ensembl yn rhyddhau'r holl wybodaeth i'w defnyddio gan y gymuned ymchwil fyd-eang. Gall unrhyw un lawrlwytho data a chôd y prosiect,[3] ac mae gweinydd cronfa ddata agored ar gael er mwyn cysylltu o bell. Mae gwefan Ensembl hefyd yn cynnwys dadansoddiadau gweledol o lawer o'r data.

Dros amser, mae'r prosiect wedi ei ehangu i gynnwys organebau ychwanegol (gan gynnwys organebau model pwysig megis llygod, pryfed ffrwythau a physgod rhesog), yn ogystal ag ystod ehangach o wybodaeth genomig, gan gynnwys amrywiadau genetig a nodweddion rheoli. Ers mis Ebrill 2009, mae chwaer-brosiect i Ensembl wedi estyn ffiniau'r prosiect i gynnwys anifeiliaid heb asgwrn cefn, planhigion, ffyngau, bacteria, a protistiaid, tra bo'r prosiect gwreiddiol yn dal i ganolbwyntio ar fertebratau.

Dangos data genomig[golygu | golygu cod y dudalen]

Delwedd:Ensembl release58 sgcb screenshot.png
Sgrinlun o borwr genom Ensembl yn dangos y genyn SGCB wedi alino i'r genom dynol.

Rhan bwysig o brosiect Ensembl yw'r gallu i greu deleweddau awtomatig o enynau a data genetig eraill wedi alino at enom cyfeirio. Mae data fel hyn yn cael ei ddangos fel traciau data, a gall defnyddwyr droi'r traciau ymlaen neu i ffwrdd er mwyn gallu edrych ar nodweddion sydd o ddiddordeb iddynt. Mae rhyngwyneb Ensembl hefyd yn galluogi defnyddwyr i chwyddo mannau penodol o'r genom neu symud ar hyd y genom yn hawdd.

Gall y porwr hefyd ddangos data ar gydraniadau gwahanol, o ddangos caryoteipiau cyfan i ddangos dilyniannau DNA ac asidau amino yn fanwl. Mae hefyd modd o edrych ar ddilyniannau tebyg trwy ddiagramau coeden a chymharu genynau cyfatebol mewn ystod o rywogaethau. Gall Ensembl hefyd roi'r un wybodaeth mewn fformatiau eraill, ee FASTA, er mwyn defnyddio'r data mewn rhaglenni eraill.

Gellir agor data o raglenni eraill yn Ensembl hefyd, un ai drwy ddefnyddio gweinydd arlein neu drwy uwchlwytho ffeil mewn fformat cydweddol, megis BAM, BED neu PSL.

Rhywogaethau[golygu | golygu cod y dudalen]

Mae'r genomau sydd wedi eu hanodi yn cynnwys y rhan fwyaf o'r genomau fertebrat sydd wedi eu dilyniannu. Maen nhw'n cynnwys:

Cyfeiriadau[golygu | golygu cod y dudalen]

  1. "Ensembl 2011". Nucleic Acids Res 39 (Database issue): D800–D806. November 2010. doi:10.1093/nar/gkq1064. PMC 3013672. PMID 21045057. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3013672.
  2. "Ensembl's 10th year". Nucleic Acids Res. 38 (Database issue): D557–62. January 2010. doi:10.1093/nar/gkp972. PMC 2808936. PMID 19906699. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2808936.
  3. Ruffier, Magali; Kähäri, Andreas; Komorowska, Monika; Keenan, Stephen; Laird, Matthew; Longden, Ian; Proctor, Glenn; Searle, Steve et al. (January 2017). "Ensembl core software resources: storage and programmatic access for DNA sequence and genome annotation". Database 2017 (1). doi:10.1093/database/bax020.

Dolenni allanol[golygu | golygu cod y dudalen]