Dokumentera data

Dokumentation är väsentligt under hela forskningsprocessen och sker i olika steg och på olika nivåer. För att underlätta dokumentationsarbetet är det bra att skapa en tydlig struktur över vilka dokument som ska användas och vad de avser att innehålla.

Metadata är strukturerad information som beskriver data. För att sekundärforskare effektivt ska kunna hitta, förstå och återanvända materialet bör metadata vara så omfattande som möjligt. Detta innefattar exempelvis information om urvalsmetod, hur data produceras och samlas in (labbanteckningar, handhållna gps-enheter, automatiskt sparade filer i olika verktyg m.m.), bearbetning av data, osv.

Metadata kan med fördel anges med hjälp av en metadatastandard som strukturerar och organiserar informationen. En standard är en uppsättning regler som bestämmer vilken information som ska användas för att beskriva data och hur den informationen ska kategoriseras och formuleras. Detta gör det enklare att göra information sökbar och att utbyta metadata mellan olika parter. Det är en bra idé att tidigt i projektet ta reda på om det finns några särskilda metadatastandarder som är vanliga inom det aktuella ämnesområdet. Framför allt inom samhälls-, beteende- och hälsovetenskap rekommenderar SND Data Documentation Initiative (DDI), som ger stöd för att dokumentera forskningsprocessens olika steg, som exempelvis planering, insamling, bearbetning och arkivering.

Vad bör tas upp i en datahanteringsplan?

  • Dokumentation och metadata Uppskatta vilken typ av dokumentation som kommer att produceras under forskningsprojektet och hur all information ska struktureras (exempelvis med hjälp av projekt- eller analysloggbok, variabellista, analysplan, protokoll). Fundera även kring vilka metadata som behöver produceras för att säkerställa att såväl forskargruppen som framtida användare ska kunna förstå materialet, återskapa resultat eller använda data för nya analyser.
  • Metadatastandard Inom vissa forskningsområden är det vanligt att man använder en metadatastandard för att beskriva datamaterialet. Finns det någon standard som är lämplig att använda? Att använda en metadatastandard gör det enklare att utbyta metadata mellan olika parter och att göra informationen sökbar. Metadatastandarden anger vilka element som ingår i den specifika standarden och en förklaring till vilken information som ska skivas under respektive element.
  • Terminologier etc. Kommer några terminologier eller liknande användas för att beskriva och dokumentera materialet? Vilka? Inom många ämnesområden finns fastställda terminologier som kan användas för att kategorisera och dokumentera datamaterial. Om projektspecifika termlistor skapas kan det vara lämpligt att göra en ”mappning” där man visar vilka ord som betyder exakt eller nästan samma sak i jämförelse med andra existerande terminologier, men även vilka ord som är unika. Detta underlättar kommunikationen mellan personer som tillhör samma ämnesområde, men kan även användas för att lättare söka fram material i exempelvis tidskrifter.