Organisera data

Med organisering av data avses dels hur data som samlas in ska organiseras och struktureras, men även hur datafiler namnges och versioneras, vilka filformat som används och hur data lagras på ett säkert sätt.

Vad gäller lagring av digitalt forskningsmaterial finns en teknisk osäkerhet vilket kräver bra rutiner och noggrann säkerhetskopiering. Forskningsmaterialet kan även innehålla eller länka till känsliga personuppgifter och konfidentiella data, och bör därför vara väl skyddat under insamling, rensning och redigering. Detta skydd kan bestå av både tekniska och administrativa åtgärder.

En rad säkerhetsåtgärder kan vara aktuella för att garantera skyddet för känsliga personuppgifter i forskningsmaterialet. Det kan till exempel handla om fysisk säkerhet för datautrustning (stöldskydd, skydd mot förstörelse), behörighetskontroll, skydd i samband med elektronisk överföring och bearbetning (Internet, e-post) och säkerhetskopiering. Datainspektionen har mer detaljerad information kring informationssäkerhet.

Innan forskningsprojektet börjar är det viktigt att uppdatera sig gällande informationssäkerheten på lärosätet/myndigheten. Policyn för IT-säkerhet reglerar bland annat hur personuppgifter som behandlas i verksamheten skyddas, hur du som medarbetare får använda IT-resurserna och vilket ansvar du har för användandet.

Vad bör tas upp i en datahanteringsplan?

  • Mappstruktur Ange de riktlinjer som ska följas avseende mappstruktur och hänvisa gärna till en översikt av mappstrukturen. En genomtänkt mappstruktur, som t.ex. har begripliga mappnamn, är en förutsättning för ett välorganiserat forskningsmaterial. Detta gör att det blir enklare för olika medarbetare att hitta olika filer, vilket sparar tid under arbetets gång.
  • Organisering av data Hur kommer de datavärden (objekt/enheter/enkätsvar mm) som samlas in/används att organiseras? Kommer de exempelvis att organiseras som enkla filer eller i mer komplexa databaser? Hur kommer data att kontrolleras och rättas? Om mer komplexa system ska byggas upp kan det vara nödvändigt att ta hjälp av expertis inom området samt att budgetera för detta redan i ansökan om forskningsmedel. Det är också väsentligt att tänka igenom om och hur felkällor och kontroller av data kan göras på ett tillförlitligt sätt.
  • Filnamn Hur namnges filer på ett strukturerat sätt så att det är lätt att hitta vad som behövs? Eftersom det snabbt kan bli många filer i en studie är det bra att tidigt tänka igenom och bestämma sig för ett system för namngivning av filer, som sedan kan följas genom hela projektet.
  • Filformat Vilket/vilka filformat kommer att användas under projektet? Är det möjligt att redan från början välja ett format som är lämpligt för långtidsbevarande, dvs. som är vanligt förekommande, har en öppen teknisk specifikation och som inte är proprietärt? Då går processen lättare när data väl ska arkiveras och eventuellt göras tillgängliga. En annan fördel med att välja ett format som inte är proprietärt eller plattformsberoende är att man senare inte behöver konvertera filformatet – varje gång man konverterar en fil från ett format till ett annat riskerar man att information går förlorad. För att hitta ett lämpligt format kan du ta hjälp av SND:s lista över rekommenderade filformat.
  • Versionering Vilka regler för versionering av datafiler kommer att gälla under projektet? Vem ansvarar för att en ”masterfil” upprätthålls, dokumenteras och versioneras enligt de regler som sätts upp i projektet? Hur ska olika versioner av filerna kunna åtskiljas? Riktlinjer kring när och hur data- och dokumentationsfiler ska versioneras bör upprättas i ett tidigt skede av forskningsprocessen så att alla projektmedlemmar följer samma principer.
  • Lagring och backup Var lagras datamaterialet och hur säkerställs det att det lagras på ett säkert sätt? Kommer det att göras regelbunden backup på data? Det kan finnas behov av att kontakta lärosätets IT-säkerhetsavdelning om lagringsytor och backup innan datainsamling/projektet startar.
  • Informationssäkerhet och informationsklassning Relatera till de riktlinjer och policys som utarbetats vid lärosätet gällande informationssäkerhet och definiera vad detta innebär i praktiken och under projektets gång. Vilken informationsklassning har datamaterialet, och vilka säkerhetsåtgärder är nödvändiga för att skydda materialet? Tillgängligheten till datamaterialet behöver säkerställas så att de som ska ha tillgång till materialet får det, samtidigt som obehöriga förhindras åtkomst. Säkra arbets- och lagringsmiljöer kan t.ex. innefatta tillgänglighetsrestriktioner (exempelvis lösenord), kryptering, samt virus- och intrångsskydd. Det kan finnas behov av att kontakta lärosätets IT-säkerhetsavdelning för att säkerställa att eventuella oklarheter kring säkerhet är utredda innan datainsamlingen startar.

SÄKERHETSKOPIERING
Alla relevanta filer bör säkerhetskopieras regelbundet, gärna mer än en gång per dag. Detta är särskilt viktigt för datafiler som är under uppbyggnad, för att förhindra att data går förlorade eller behöver matas in på nytt.