Bevara och tillgängliggöra data

Ett forskningsmaterial som görs tillgängligt blir sökbart och synligt både nationellt och internationellt samt möjligt för andra att återanvända och citera. Detta gagnar även samhället eftersom forskningsdata är en värdefull resurs som vanligtvis kräver mycket tid och pengar att producera.

Om data tillgängliggörs via ett datarepositorium blir det långtidsbevarat, beskrivet på ett sätt som möjliggör internationell sökbarhet och försett med en beständig identifierare (persistent identifierare/PID), ett unikt ID som pekar på ett eller flera digitala eller fysiska objekt, och som möjliggör citering av data. En PID är alltså en unik symbol som fastställer ett dokuments identitet och som i idealfallet finns kvar för evigt. När data publiceras och tillgängliggörs på ett standardiserat sätt öppnas möjligheter för att datamaterialet kommer att refereras till korrekt. Det finns olika typer av PID:ar baserat på ämnesområde och var datamaterialet deponeras, men data som tillgängliggörs via SND får en beständig identifierare i form av Digital Object Identifier (DOI). Du kan läsa mer om detta under PID-tjänst.

För forskningsdata som tillgängliggörs för andra rekommenderas en överenskommelse/licens om att data ska citeras vid återanvändning. Om forskningsmaterialet inkluderar material från en annan dataproducent är det viktigt att i ett avtal reglera ifall materialet kan göras tillgängligt i sin helhet.

Vad bör tas upp i en datahanteringsplan?

  • Förbereda data och dokumentation Inför bevarande och tillgängliggörande av data är det bra att gå igenom och förbereda materialet. Vilket/vilka filformat är lämpliga att använda för långtidsbevarande? Vilken dokumentation ska följa med materialet efter projektets slut? Finns det några etiska och juridiska restriktioner för materialet som medför att data behöver bearbetas innan det tillgängliggörs (t.ex. anonymiseras)? Om data ska lämnas till ett repositorium för långtidsbevaring och tillgängliggörande är det lämpligt att ta kontakt i god tid för att få råd om hur materialet kan förberedas.
  • Bevara och tillgängliggöra data Hur ska forskningsmaterialet bevaras? Ta reda på vilka regler som finns vid lärosätet avseende bevarande och gallring av forskningshandlingar, och bestäm vem i forskargruppen som ansvarar för att forskningsprojektets allmänna handlingar arkiveras. Vilka planer finns avseende tillgängliggörande av datamaterialet? Om tillgängliggörande är möjligt – var, när och för vem kommer datamaterialet att göras tillgängligt? Kommer data att tillgängliggöras via ett datarepositorium som t.ex. SND, en ämnesspecifik databas, universitetet eller via forskargruppen själv?
  • Kontakta datarepositorium Om data ska bevaras/tillgängliggöras vid ett datarepositorium (t.ex. SND), klargör vem som är kontaktperson gentemot repositoriet och ta kontakt i god tid för att få råd om hur datamaterialet kan förberedas.
  • Begränsningar på grund av riktlinjer eller juridiska/etiska skäl Kommer hela eller endast delar av datamaterialet att tillgängliggöras? Finns det begränsningar i form av riktlinjer och/eller juridiska/etiska orsaker som förhindrar att hela materialet tillgängliggörs? Innebär dessa begränsningar att åtgärder måste vidtas innan materialet kan tillgängliggöras?
  • Begränsningar på grund av verktyg eller mjukvara Behövs det någon särskild mjukvara eller särskilda verktyg för att datamaterialet ska kunna användas? Om ja, är det möjligt att bifoga mjukvaran eller verktyget till datamaterialet via t.ex. öppen källkod, och vilken information om mjukvaran eller verktyget behövs i sådana fall? Om det inte går att bifoga mjukvaran/verktyget, vad behövs för att kunna använda datamaterialet?
  • Förseningar Finns det risk för förseningar av publiceringen eller tillgängliggörandet av hela eller delar av datamängden? Att beskriva varför en försening av datapublicering uppstår är viktigt för att kunna planera för åtgärder som minimerar förseningstiden. I de fall publicering av data är tekniskt problematiskt och därigenom medför en möjlig försening bör detta också tas upp.
  • Tillgänglighetsnivå och/eller licens Vilken tillgänglighetsnivå/licens kommer att gälla för materialet vid publicering? Om materialet tillgängliggörs via SND, fundera på vilken av SND:s tillgänglighetsnivåer som kommer att gälla för materialet. Om Creative Commons ska sättas på materialet, vilken nivå och version?
  • Citering Finns det särskilda önskemål på hur datamaterialet ska citeras i samband med återanvändning? En citering till data bör inkludera tillräcklig information så att den korrekta versionen av data kan hittas. Citeringen rekommenderas att innehålla: primärforskare/organisation, titel, år [för publicering av dataset], version, datarepositorium/förmedlare, DOI.
  • Beständig identifierare (PID) Ange om möjligt ifall det tillgängliggjorda datamaterialet kommer att få en beständig identifierare. Då det finns olika typer av PID, bl.a. baserat på ämnesområde och var datamaterialet deponeras, är det bra att kolla upp vad som är lämpligt att använda.