Na kratko o načelih FAIR

Načela FAIR so koncept upravljanja z raziskovalnimi podatki, ki ga je mednarodna skupina raziskovalcev leta 2016 predstavila v članku z naslovom The FAIR Guiding Principles for scientific data management and stewardship, objavljenem v reviji Scientific Data. Glavni namen načel FAIR, ki so med drugim del koncepta odprte znanosti, je olajšati izmenjavo raziskovalnih podatkov med raziskovalci po svetu ter zagotoviti njihovo trajno dostopnost in uporabnost.

Z uveljavljanjem načel FAIR se v prvi vrsti ukvarjajo knjižnice, repozitoriji znanstvenih del in specializirane institucije, kot je pri nas na primer Arhiv družboslovnih podatkov. V tem članku se zato ne bom spuščala v podrobnosti, pač pa le na kratko orisala, kaj bi moral vsak raziskovalec vedeti o načelih FAIR. Bralcem, ki jih zanima kaj več, priporočam obisk spletne strani projekta GO FAIR, ki deluje pod okriljem Evropskega oblaka odprte znanosti (EOSC). Odlično kratko razlago pa ponuja tudi spodnji video.

Zakaj bi vsakega raziskovalca morala zanimati načela FAIR?

Načela FAIR bodo pridobila še večji pomen, ko bo v veljavo stopil Načrt S. Ta predvideva, da bodo po 1. januarju 2020 morale biti vse znanstvene publikacije, ki so plod raziskav, financiranih z javnim denarjem, prosto dostopne. V kolikor ni zadržkov glede objave surovih raziskovalnih podatkov, npr. v primerih varstva osebnih podatkov ali patentnega postopka, je koristno objaviti tudi te. V repozitorijih se podatkom pripiše trajni identifikator (npr. DOI), kar pomeni, da postanejo informacijska enota, ki jo je mogoče citirati, prav tako pa so zaščiteni pred spreminjanjem. Kako to deluje v Elsevierjevem repozitoriju Mendeley, si lahko ogledate v webinarjih Elsevier Researcher Academy:

Repozitoriji za javno objavo raziskovalnih podatkov se razlikujejo od področja do področja. Poleg komercialnih, kot sta Mendeley in figshare, izmed splošnih repozitorijev velja omeniti Zenodo, ki je bil vzpostavljem v okviru evropskega programa OpenAire, z njim pa upravlja CERN. Primeren repozitorij za vaše potrebe lahko poiščete s pomočjo brskalnika re3data.org, revija Scientific Data pa je pripravila tudi izbor zaupanja vrednih repozitorijev po posameznih raziskovalnih področjih.

Kaj pomeni kratica FAIR?

FAIR je akronim, sestavljen iz besed findable, accessible, interoperable in reusable, ki pomenijo štiri zahteve, ki jih morajo podatki izpolnjevati, da bi bili splošno in dolgotrajno uporabni.

načela FAIR

Pomen kratice FAIR (vir: Wikipedia, avtorica: Sangya Pundir, CC BY-SA 4.0)

Liber Europe ter GO FAIR pomen kratice FAIR pojasnjujeta takole:

  • Findability (možnost iskanja) pomeni, da morajo podatki biti registrirani oziroma indeksirani v viru, ki ga je mogoče najti (običajno repozitoriju, lahko pa tudi na omrežjih, kot sta ResearchGate in Academia.edu) ter opremljeni s primernimi metapodatki in edinstvenim, trajnim identifikatorjem (najpogosteje DOI). Z drugimi besedami, podatki, zapisani le v vašem laboratorijskem dnevniku ali shranjeni na vašem trdem disku, temu pogoju ne zadoščajo. Prav tako ni dovolj, če na znanstveno socialno omrežje naložite Excelovo tabelo, iz katere se znajdete le vi, prav tako pa ni jasno, kdo je njen avtor, kdaj je bila ustvarjena in h kateri znanstveni publikaciji sodi.
  • Accessibility (dostopnost) pomeni, da morajo biti (meta)podatki razumljivi tako ljudem kot strojem, izmenljivi s pomočjo standardiziranih komunikacijskih protokolov ter po potrebi zaščiteni s postopki avtorizacije in avtentifikacije. Metapodatki morajo ostati dostopni, tudi če podatke umaknemo. Za ta del skrbijo zaupanja vredni in primerno upravljani repozitoriji.
  • Interoperability (interoperabilnost) v grobem pomeni, da morajo biti standardizirani in splošno razumljivi tudi metapodatki, ki morajo sami zadoščati načelom FAIR.
  • Reusability (možnost ponovne uporabe) pomeni, da morajo imeti (meta)podatki in podatkovne zbirke jasne licence za uporabo ter zagotavljati jasne informacije o poreklu podatkov.

Kaj lahko naredim, da bodo moji podatki zadoščali načelom FAIR?

Izvedba načel FAIR je skupinska naloga, kjer za levji delež dela skrbijo repozitoriji podatkov. Kaj lahko storimo sami, pa nam predlaga izumitelj svetovnega spleta, Tim Berners-Lee, v svoji shemi petih zvezdic za odprte podatke:

five stars Tim Berners-Lee

Koncept petih zvezdic za odprte podatke Tima Bernersa-Leeja (vir: 5stardata.info, CC0)

* Open license (OL) Podatki so voljo na spletu (v kateremkoli formatu) pod odprto licenco
** OL + machine-readable data (RE) Odprti podatki na spletu so v strukturirani obliki, ki omogoča strojno branje (npr. Excel namesto slikovnega posnetka tabele)
*** OL + RE + open format (OF) Enako kot (2), le da so strukturirani podatki v nelastniškem formatu (npr. CSV namesto Excela)
**** OL + RE + OF + open standards (URI) Enako kot (3), le da se za identifikacijo podatkov uporabljajo odprti standardi W3C (RDF in SPARQL), da lahko drugi ljudje ustvarijo povezavo do vaših podatkov
***** OL + RE + OF + URI + linked data (LD) Enako kot (4), le da tudi vi svoje podatke povežete s podatki drugih ljudi, da ustvarite kontekst

To so preprosti ukrepi, ki jih lahko uveljavi vsakdo, tudi če svoje podatke objavlja na neuradnih mestih, npr. osebnih spletnih straneh ali znanstvenih družabnih omrežjih. Več o koristih, ki jih to prinaša, si lahko preberete na spletni strani Tima Bernersa-Leeja.

[Nazadnje spremenjeno: 30. 4. 2019]

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava /  Spremeni )

Google photo

Komentirate prijavljeni s svojim Google računom. Odjava /  Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava /  Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava /  Spremeni )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.