FAIR-principerna

FAIR är en akronym som står för Findable, Accessible, Interoperable och Reusable. FAIR-principerna innebär att forskningsdata ska gå att hitta, det ska finnas information om hur man får tillgång till dem, de ska vara kompatibla med andra data, och de ska vara möjliga att återanvända. FAIR-principerna spelar en viktig roll i arbetet för öppen vetenskap och beskriver några av de mest centrala riktlinjerna för god datahantering och öppen tillgång till forskningsdata. SND arbetar för att data i den nationella forskningsdatakatalogen så långt som möjligt ska uppfylla kriterierna för FAIR, men du som forskare har också en viktig roll här.

Findable: hur kan man hitta data?

För att forskningsdata ska kunna uppfylla FAIR-principerna behöver det vara möjligt för andra forskare att hitta materialet. Genom att visa upp data i en relevant forskningsdatakatalog och se till att de är beskrivna med utförliga och relevanta metadata (se nedan) så kan andra hitta dem. I SND:s system kallat DORIS kan du som forskare själv fylla i metadata om forskningsprojektet och dess data. Du är väl förtrogen med projektets data och är den som bäst kan beskriva olika aspekter av dem. SND eller något annat datarepositorium som uppfyller FAIR-principerna kan därefter ge data en beständig identifierare (PID), det vill säga ett permanent och unikt ID-nummer, som gör det enklare att citera data korrekt så att de går att hitta.

Metadata

Metadata är välstrukturerad information om det insamlade datamaterialet. Informationen beskriver materialet på olika nivåer, till exempel var och av vem det har skapats; vid vilka tillfällen och hur data har samlats in; vad en variabel betyder och vilka värden den kan ha. Metadata är inte samma sak som dokumentation, utan det som är utmärkande för metadata är att de är strukturerade för att kunna läsas av både människor och datorer.

Accessible: hur får man tillgång till data?

Nästa del i FAIR-principerna handlar om att data ska vara tillgängliga. Att göra ett datamaterial tillgängligt är inte detsamma som att data sprids fritt och kan nås och användas av vem som helst. Innehåller materialet exempelvis känsliga personuppgifter måste en sekretessprövning göras innan någon annan kan ta del av materialet. Metadata är däremot inte känsliga och även om det inte går att göra själva datamaterialet öppet tillgängligt så kan du använda metadata för att berätta att materialet existerar och vilka villkor som råder för att komma åt och återanvända det.

Interoperable: är data och metadata interoperabla?

För att uppfylla I:et i FAIR behöver både data och metadata följa vedertagna standarder. Huvudansvaret ligger på den organisation som ansvarar för att göra data tillgängliga (till exempel SND). Men det innebär även att du som forskare använder dig av standarder för att till exempel ange datum, tidsperioder och geografiska koordinater, att du väljer vanligt förekommande vetenskapliga vokabulärer för att beskriva kategorier och att du kodar variabler enligt vedertagen standard. Du bör även om möjligt välja att spara data i vanligt förekommande filformat som stöds av olika operativsystem och kan öppnas i flera program, eller använda program som kan exportera data i sådana filformat när projektet är slut.

Reusable: kan andra använda data i framtiden?

Slutligen ska data vara möjliga att återanvända. En förutsättning för återanvändning är att data beskrivs med tillräckliga metadata, att metadata kan läsas av både människor och datorer och att det finns tydliga upplysningar om exempelvis vetenskapligt syfte, i vilket sammanhang data samlades in och vilken utrustning och programvara som användes. Även villkor för hur data får användas måste anges tydligt.

FAIR över tid

FAIR-principerna spelar en viktig roll i arbetet med att göra forskningsdata tillgängliga, men också i arbetet med att bevara forskningsdata och all annan forskningsinformation. All arkivverksamhet bygger på att informationen i arkiven ska vara sökbar, tillgänglig, interoperabel och möjlig att återanvända. Målet för lärosätets arkivarbete är att forskningsinformationen ska vara FAIR även för nästa generation av forskare.

Ett livscykelperspektiv på forskningsinformation

Ambitionen att behålla forskningsdata ”FAIR över tid” förutsätter en genomtänkt informationsförvaltning, där aktiva och genomtänkta vägval görs kontinuerligt. Det kallas för livscykelplanering, och den gäller både information i sig och förvaltningen av den. Livscykeln för forskningsdata innebär att de kommer att lagras på flera platser över tid, i olika format, med olika grad av tillgänglighet och med olika restriktioner. När en lagringsplats, till exempel ett system eller en plattform, ska tas i anspråk gäller det att från början göra nästa steg möjligt enligt den planerade livscykeln. Du som forskare har ansvar att haka på den livscykelplanering som gäller i din organisation.

Datahanteringsplanen ur ett livscykelperspektiv

En genomarbetad datahanteringsplan är tillsammans med forskningshuvudmannens styrdokument – som informationshanteringsplan och bevarandeplanering – en nyckel för att kunna säkerställa att forskningsdata är och förblir FAIR under hela sin livscykel, även efter avslutat forskningsprojekt. Där forskningshuvudmannens informationshanteringsplan och informationshanteringsstrategier ger en övergripande bild av forskningshuvudmannens långsiktiga strategier ger datahanteringsplanen den information som behövs för att kunna hitta, ta del av, förstå och eventuellt återanvända forskningsdata från det enskilda forskningsprojektet.

En datahanteringsplan ger också ett ovärderligt stöd till de arkivarier eller andra funktioner hos forskningshuvudmannen som genomför gallringsutredningar och ger stöd i bedömningen av hur länge forskningsdata ska finnas kvar. Det kan rent av vara så att data är så värdefulla att de ska bevaras för all framtid. 

Läs mer om konceptet FAIR över tid.