Gwasanaethau Digidol » Llyfrgell ac Adnoddau Dysgu (LLR) » Mynediad Agored ac Ymchwil » Rheoli Data Ymchwil » Ymchwil a Rheoli Data Rhestr Termau
Copi ychwanegol o ddata digidol sy’n cael ei storio i’w ddefnyddio yn lle’r prif gopi, rhag ofn i hwnnw gael ei ddileu neu’i lygru. Nid yw gwasanaeth wrth gefn yn darparu’r un gwasanaeth ag archif: fel arfer nid yw wedi’i fwriadu ar gyfer cadwraeth tymor hir ar ôl diwedd prosiect, ac nid yw’n rhoi mynediad i ddefnyddwyr data neu unigolion heblaw’r perchennog data ac o bosibl staff cymorth TG.
Gwasanaeth a gynlluniwyd i gadw, trefnu a chatalogio eitemau (digidol) yn yr amodau gorau posibl, gyda labelu safonol i sicrhau eu hirhoedledd a mynediad parhaus iddynt. Defnyddir y term yn aml yn gyfnewidiol am gadwrfa.
Dogfennaeth sy’n disgrifio cynnwys, fformat a strwythur set ddata a’r berthynas rhwng ei helfennau. Mae geiriadur data’n darparu metadata am elfennau data: er enghraifft, gallai gynnwys tabl yn rhestru priodoleddau data, gyda cholofnau’n rhoi enw’r briodoledd, p’un a yw’n ddewisol neu’n ofynnol, y math o briodoledd neu’i fformat, ac ati. Mae hefyd o gymorth cael colofn ychwanegol ar gyfer nodiadau esboniadol am bob priodoledd, yn enwedig os yw’r data i’w rhannu ag eraill. Gallai hyn gynnwys esboniad byr o sut y ceir y priodoledd neu sut y’i cyfrifir.
Mae cynllun rheoli data, neu CRhD, yn ddogfen ffurfiol sy’n amlinellu sut y bydd prosiect yn rheoli ei ddata ymchwil drwy gydol cyfnod cyfan y prosiect ymchwil. Mae hyn yn ymdrin â’r math o ddata dan sylw, sut y caiff y data eu casglu a’u storio, a sut y cedwir copi wrth gefn, a sut y bydd cydweithredwyr yn cael mynediad atynt mewn ffordd ddiogel, a sut y bodlonir unrhyw ofynion cyfreithiol neu foesegol. Dylai hefyd roi sylw i’r cwestiynau tymor hwy o gadw a rhannu data.
Mae cronfa ddata yn set strwythuredig o ddata, y ceir mynediad ati drwy system rheoli cronfa ddata (DBMS). Y nod yw ei gwneud yn bosibl ymholi’r data’n hawdd, gan ganiatáu i ddefnyddwyr ddod o hyd i ddarn penodol o wybodaeth, neu ateb cwestiynau mwy cyffredinol.
Mae amrywiol fathau o gronfeydd data, sy’n darparu ffyrdd gwahanol o strwythuro gwybodaeth. Y math mwyaf cyffredin yw cronfa ddata berthynol, sy’n cynnwys set o dablau cysylltiedig sy’n cofnodi priodweddau mathau amrywiol o endidau, a’r berthynas rhyngddynt. Mae Microsoft Access a MySQL yn enghreifftiau o systemau rheoli cronfeydd data perthynol. Mae cronfeydd data XML, fel eXist, wedi’u llunio i weithio gydag gwybodaeth sydd wedi’i thagio â XML. Mae cronfeydd data sy’n seiliedig ar ddogfennau (neu noSQL) yn systemau hyblyg lle nad oes angen i briodoleddau gwrthrychau fod â strwythur cyson. Mae MongoDB yn enghraifft o gronfa ddata sy’n seiliedig ar ddogfen.
Term cyffredinol a ddefnyddir yn aml i ddisgrifio casgliad o ddata ymchwil. Gallai set ddata ddigidol gynnwys un eitem, fel taenlen o ddata rhifiadol, neu gallai fod yn llawer mwy, gan gynnwys casgliad o eitemau cysylltiedig fel taenlenni, delweddau, darlleniadau offeryn gwyddonol ar ddiwrnod penodol, neu gymysgedd o’r rhain a llawer o fathau eraill o ddata.
A digital object is a specific digital ‘thing’. It may comprise a single file, such as a research publication, with its associated metadata, or it may be a package containing multiple files and metadata.
Mae gwrthrych digidol yn ‘eitem’ ddigidol benodol. Gall gynnwys un ffeil, fel cyhoeddiad ymchwil, gyda metadata cysylltiedig, neu gall fod yn becyn sy’n cynnwys ffeiliau lluosog a metadata.
Yn aml neilltuir dynodyddion i wrthrychau digidol, sy’n gwahaniaethu rhyngddynt a gwrthrychau tebyg eraill, a gellir eu defnyddio at ddibenion cyfeirnodi. Neilltuir Dynodyddion Gwrthrych Digidol, neu DOIs, i nifer o eitemau data ymchwil.
Mae DOI yn fath penodol o ddynodydd parhaus a neilltuir i eitemau digidol fel erthygl neu set ddata, fel y gellir dod o hyd iddynt a’u cyfeirnodi. Mae’n cael ei safoni gan y Sefydliad Rhyngwladol ar gyfer Safoni (ISO).
Gellir cynnwys DOIs mewn URLs fel y gall defnyddwyr bob amser gael mynediad at y cynnwys digidol, hyd yn oed os yw wedi symud lleoliad ar-lein. Os nad yw’r cynnwys ar gael, dylai’r DOI roi cofnod o’r eitem o hyd. Mae cyhoeddwyr yn defnyddio DOIs i ddynodi erthyglau: er enghraifft, mae’r DOI 10.1103/PhysRevLett.107.133902 wedi’i ymgorffori yn URL y cyhoeddwr: http://link.aps.org/doi/10.1103/PhysRevLett.107.133902. Mae bob amser yn bosibl olrhain eitem gan ddefnyddio’r DOI trwy ychwanegu’r rhagddodiad http://dx.doi.org/ (gan roi, yn yr achos hwn, yr URL http://dx.doi.org/10.1103/PhysRevLett.107.133902).
Y broses o storio’r didau a’r beitiau sy’n cynnwys gwrthrychau digidol. Nid yw cadwraeth o reidrwydd yn awgrymu mynediad parhaus.
Mae cadwraeth yn rhan bwysig o ymestyn oes data ymchwil, ond nid yw’n ddigonol ynddo’i hun. Gall storio ffeiliau data yn syml heb eu rheoli’n weithredol arwain at ddata sy’n dal i fodoli, ond na ellir eu defnyddio. Er enghraifft, efallai na fydd gwiriadau uniondeb data wedi’u cynnal, efallai bod bit-rot (dirywiad data) wedi golygu nad oes modd defnyddio’r data, neu nad yw’r feddalwedd sydd ei hangen i agor y ffeiliau ar gael mwyach.
Gwybodaeth gyd-destunol a ddarperir gyda data i alluogi defnyddwyr i wneud synnwyr ohonynt ac i’w dehongli’n iawn. Gall dogfennaeth ymwneud â set ddata gyfan (e.e. ffeil README sy’n cyd-fynd â’r ffeiliau data, neu ddisgrifiad manwl o ddulliau casglu data), neu agweddau penodol ohoni (e.e. labelu colofnau mewn taenlen, neu anodi anghysondebau yn y data).
Os oes embargo ar set ddata a adneuwyd mewn archif data, mae’n golygu nad yw’r set ddata yn hygyrch. Fel arfer, bydd cofnod metatada yn disgrifio’r data, ond ni fydd y data eu hun ar gael. Gall embargos fod yn barhaol, neu dros gyfnod penodol o amser. Mae ymchwilwyr weithiau’n dewis adneuo set ddata ar ddiwedd eu prosiect, ond yn ei roi dan embargo am gyfnod pellach – er enghraifft, tan fod cyhoeddiadau sy’n defnyddio’r data wedi ymddangos.
Data sy’n bodloni set o egwyddorion ar gyfer rheoli a stiwardio data a sefydlwyd gan gonsortiwm o wyddonwyr, ac a gymeradwywyd gan uwchgynhadledd G20 yn Hangzhou yn 2016. Mae FAIR yn acronym sy’n golygu canfyddadwy, hygyrch, rhyngweithredol ac ailddefnyddiadwy – Findable, Accessible, Interoperable a Reusable.
Datganiad am eitem (fel gwaith creadigol neu set ddata) sy’n nodi beth y gall a beth na all darpar ddefnyddwyr ei wneud â hi. Mae rhai trwyddedau yn gontractau cyfreithiol ffurfiol sydd wedi’u hysgrifennu’n bwrpasol y mae angen iddynt gael eu llofnodi gan berchennog yr eitem a’r ailddefnyddiwr. Mae eraill yn drwyddedau agored, sy’n rhoi hawliau ailddefnyddio i unrhyw un, weithiau yn amodol ar amodau fel cydnabod y crëwr data neu ofyniad bod unrhyw weithiau sy’n deillio o hyn ar gael gyda thrwydded agored debyg. Mae Creative Commons ac Open Data Commons yn enghreifftiau o drwyddedau agored.
Data digidol strwythuredig sy’n gysylltiedig â data digidol eraill, yn aml gan ddefnyddio technolegau gwe cyffredin fel HTTP, RDF, ac URIs. Mae data cysylltiedig yn cael eu llunio nid yn unig i fod yn ddealladwy i bobl, ond hefyd i wneud gwybodaeth yn ddarllenadwy i beiriannau. Er enghraifft, gallai brawddeg fel ‘Charles Dickens ysgrifennodd Oliver Twist’ gael ei mynegi fel “ ‘Charles Dickens’ yw Awdur ‘Oliver Twist’ ”, gyda phob elfen o’r gosodiad yn cael dynodydd unigryw sy’n ddarllenadwy i beiriannau, sy’n cyfeirio’r peiriant (a’r darllenydd) at dudalen sy’n egluro’n glir pwy neu beth ydyn nhw – gan ei gwneud yn hawdd darganfod mai person oedd Charles Dickens, tra bod Oliver Twist yn nofel.
Yn llythrennol, data am ddata – er enghraifft, data sy’n disgrifio eitem fel set ddata.
Defnyddir y term weithiau’n gyfnewidiol am ‘ddogfennaeth’, ond yn aml mae’n golygu gwybodaeth â strwythur pendant, ac sydd wedi’i chynllunio i fod yn ddarllenadwy i beiriannau. Mae sgema neu safon metadata yn set o ddarnau o wybodaeth am wrthrych wedi’u cofnodi mewn ffordd gyson. Er enghraifft, gallai metadata ar gyfer set ddata ymchwil gynnwys meysydd am awdur neu grëwr yr eitem, y teitl, y dyddiad creu neu gyhoeddi, y cyhoeddwr, dynodydd unigryw ac ati. Gall y math o fetadata y byddai’n gwneud synnwyr eu cofnodi hefyd fod yn fwy penodol i’r math o ddata: er enghraifft, gallai metadata ar gyfer ffeil ffotograff digidol gynnwys gwybodaeth ynglŷn â’r lens, pa mor olau oedd hi, a lleoliad y camera pan dynnwyd y llun.
Unrhyw ddata am unigolion byw, adnabyddadwy. Rhaid trin data personol yn unol â’r ddeddfwriaeth berthnasol, gan gynnwys Rheoliad Cyffredinol y DU ar Ddiogelu Data (GDPR).
Mae rhoi dan ffugenw yn gofyn am wahanu dynodyddion ‘byd go iawn’ yn ffisegol oddi wrth weddill y data ymchwil. Cedwir cyswllt rhwng data ymchwil a dynodyddion ‘byd go iawn’ trwy seiffr neu god. Cedwir y seiffr yn ddiogel ac ar wahân i’r data ymchwil a thrwy hynny cyfyngir ar faint o bobl yn y tîm ymchwil sydd â mynediad at ddynodyddion byd go iawn, gan ei gwneud yn anoddach adnabod unigolion o ddata ymchwil, a helpu felly i ddiogelu rhag datgelu damweiniol. Fodd bynnag, mae Swyddfa’r Comisiynydd Gwybodaeth (ICO) yn nodi tra gall data dan ffugenw helpu i leihau risgiau preifatrwydd trwy ei gwneud yn anoddach adnabod unigolion, mae’n dal i fod yn ddata personol.
Gwasanaeth lle gellir adneuo data ymchwil neu gyhoeddiadau a’u cadw’n ddiogel yn y tymor hir. Gall data mewn cadwrfeydd fod yn fynediad agored, neu’n gyfyngedig.
Mae’r Ganolfan Curadu Digidol yn diffinio data ymchwil fel cynrychioliadau o arsylwadau, gwrthrychau neu endidau eraill a ddefnyddir fel tystiolaeth o ffenomenau at ddibenion ymchwil neu ysgolheictod. Gall data ymchwil fod ar sawl ffurf wahanol, yn dibynnu ar y maes astudio: gall fod yn rhifiadol, yn destunol, yn cynnwys delweddau neu ddata clyweled, neu gall fod yn rhywbeth arall yn llwyr. Mae rhai data ymchwil yn strwythuredig iawn (e.e. data tablaidd); mae rhai yn anstrwythuredig; ac mae rhai rywle yn y canol.
Set ddata fel y mae ar adeg benodol mewn amser. Mae setiau data yn aml yn esblygu drwy gydol prosiect: maent yn tyfu wrth i ragor o ddata gael eu casglu, ac maent yn newid wrth i ddata gael eu golygu, eu prosesu a’u trin. Felly gall fod sawl fersiwn wahanol o un set ddata.