Datahanteringsplan

Datahanteringsplan

En datahanteringsplan, eller data management plan (DMP), är ett dokument som samlar information om datahanteringen i ett forskningsprojekt. Planen täcker projektets alla faser, från planering och insamling, skapande, eller generering av data, till analys, publicering och arkivering. Tanken är att du börjar skriva på datahanteringsplanen i samband med att du söker forskningsmedel eller planerar projektet och sedan utvecklar den allt eftersom olika behov uppstår. Du kan även påbörja en plan för ett projekt som du är mitt inne i. Exakt vad planen innehåller beror på ditt forskningsämne och projektets natur. Tanken är att datahanteringsplanen är ett ”levande” dokument som hålls uppdaterat genom hela projektet.

Grundtanken med datahanteringsplaner är att olika intressenter ska hitta rätt information när de behöver den. En DMP kan även göra det lättare att uppfylla FAIR-principerna och hålla ordning på sina data under forskningsprocessen. Det finns därför flera syften med datahanteringsplanen, kopplade till de olika intressenterna:

  • Bevarande och framtida forskning: arkiv och datarepositorier ser planen som ett sätt att få forskare att planera för hur forskningsdata ska kunna långtidsbevaras, och att få data beskrivna på ett sådant sätt att andra forskare kan återanvända dem. Forskningsfinansiärer och i förlängningen samhället i stort ser återanvändning av data som ett sätt att få ut mesta möjliga av skattemedel som bekostar datainsamling och -skapande.
  • Förberedelse och juridiska krav: lärosätenas IT-avdelningar behöver få veta vilka behov projekt har vad gäller datalagring. De personer inom administrationen som ansvarar för att forskningsdata hanteras i enlighet med gällande regelverk (till exempel prefekter och dataskyddsombud) behöver veta vilka data som finns och hur de är planerade att hanteras.
  • Stöd och träning: flera intressenter upplever att det finns bristande kunskap om hur forskningsdata ska hanteras och dokumenteras på ett korrekt sätt. De ser datahanteringsplanen som en väg att stötta och träna forskare vad gäller detta.
  • Forskningseffektivitet: det förmodas också att en genomtänkt och planerad datahantering ger ordning och reda i projektets data. Detta skulle kunna leda till att färre tidskrävande misstag begås och mindre tid behövs för att hitta projektinformation och rätt versioner av data och dokument.

Krav på datahanteringsplaner kan komma från olika håll. Det vanligaste idag är att forskningsfinansiärer kräver att en datahanteringsplan antingen lämnas in tillsammans med ansökan eller skapas när ett finansierat projekt inleds (eller både och). Exempelvis kräver såväl Vetenskapsrådet som Formas att du har en DMP i ditt projekt. Planer som lämnas med ansökan är kortare och tänkta att utvecklas till fullständiga planer när projektet väl påbörjas. Lärosäten kan också ställa krav på datahanteringsplaner och inom vissa forskningsområden har det börjat etableras en praxis kring att man ska använda en datahanteringsplan och hur de ska se ut. Ofta har kravställaren en uppfattning om vad som ska ingå i planen, antingen i form av specifika instruktioner eller i form av hänvisningar till guider, mallar eller checklistor producerade av någon annan organisation. Längst ned på sidan finns länkar till några olika hjälpmedel för att skriva datahanteringsplaner.

SND:s checklista för datahanteringsplaner

SND har tagit fram en checklista som stöd till forskare som ska skriva en datahanteringsplan. Checklistan ser ganska omfattande ut. Det beror på att den delar upp områden som andra mallar har sammanslagna till en kategori, att vi valt att förklara ganska noggrant vilken information som behövs och varför, och att den är avsedd att kunna användas oavsett vilket område du forskar inom. (Det sista innebär att om det verkar som att viss information inte är relevant för ditt projekt så kan det mycket väl vara så.)

Datahanteringsplanen har sju huvudområden som är knutna till hur data hanteras i projekt:

  1. En översikt över projektet, till exempel vem som är primärforskare, vilket lärosäte som är forskningshuvudman och vem i projektet som är ansvarig för vad (inklusive att hålla datahanteringsplanen uppdaterad).
  2. Hantering av skyddsvärda data som exempelvis innehåller personuppgifter, information om arkeologiskt eller biologiskt känsliga lokaler, data om militära skyddsobjekt, med mera. Behöver du planera för hur dessa ska hanteras så att de inte hamnar i fel händer? Finns det data som omfattas av upphovsrätt och hur ska de i så fall hanteras?
  3. Planering inför datainsamling och -produktion, inklusive att undersöka om det redan finns dataset som andra har tagit fram och som kan användas i projektet
  4. Hur ska datamaterialet dokumenteras och enligt vilka rutiner? Vilka standardiserade möjligheter till beskrivningar finns och används inom det egna fältet?
  5. Hur ska data organiseras med lämpliga filnamn och i logiska mappstrukturer? Hur gör du med olika versioner av dataset? Tanken är att det ska vara lätt att hitta rätt. Hur ser du till att data lagras på ett vettigt sätt och säkerhetskopieras tillräckligt ofta och säkert?
  6. Det kostar att hantera data, i termer av personal/tid, lagring och eventuellt även för särskilda program eller speciell hårdvara. Om du budgeterar detta från början kan kostnaderna för datahantering tas med i en eventuell finansieringsansökan.
  7. Hur kan data bevaras och göras tillgängliga? Hur ska de beskrivas, vilka förutsättningar råder – finns det begränsningar för tillgängliggörande? Det kan vara en idé att redan tidigt i projektet kontakta det repositorium genom vilket du tänker göra projektets data tillgängliga och höra vad de kräver och rekommenderar.

Du kan ladda ned checklistan på engelska eller svenska, i såväl pdf- som redigerbara format.

Några stödresurser för att skriva datahanteringsplaner

Resurserna i listan nedan kan vara till hjälp för att utveckla en egen datahanteringsplan. Du kan även höra med ditt lokala datastöd om det finns specifika resurser på ditt lärosäte.