Färdigställa och bevara data

När forskningsprojektet är i sitt slutskede behöver forskningsdata förberedas för långtidsbevarande. Långtidsbevarande innebär att man sparar filer i ett format som är förberett för att vara läsbart i framtiden och som inte kräver någon särskild datorutrustning eller programvara. Medan pappershandlingar normalt arkiveras vid ett tillfälle behöver digitala handlingar regelbundet konverteras (sparas om i ett nyare format) och migreras (överföras från ett medium till ett annat). Du bör därför regelbundet kontrollera att dina digitala filer är läsbara.

Forskningsmaterial ska alltid arkiveras vid det egna lärosätet i enlighet med Arkivlagen (SFS 1990:782). Arkiveras ska såväl rådatafiler och etiktillstånd, som forskningsdokumentation och publicerade resultat.

Om data ska vara tillgängliga för vidare forskning efter projektets slut behöver även detta förberedas. För forskningsdata som tillgängliggörs för andra rekommenderas en överenskommelse/licens om att data ska citeras vid återanvändning. Om forskningsmaterialet inkluderar material från en annan dataproducent eller -källa, är det viktigt att i ett avtal mellan parterna reglera om materialet kan göras tillgängligt i sin helhet.

Innan forskningsmaterial tillgängliggörs är det viktigt att åter kontrollera om det finns juridiska begränsningar för det specifika materialet. Forskningsmaterial kan t.ex. innehålla känsliga personuppgifter som kan bli föremål för sekretess i syfte att skydda människors integritet.

Personuppgifter i forskningsmaterial

Med personuppgift avses all slags information som direkt eller indirekt kan hänföras till en fysisk person som är i livet. Dataskyddsförordningen med kompletterande lagstiftning syftar till att skydda människor från att deras personliga integritet kränks vid behandling av de egna personuppgifterna, och reglerar om och hur personuppgifter får användas för forskningsändamål. Utgångspunkten är att var och en äger sina egna personuppgifter och har att själv ta ställning till hur dessa personuppgifter får behandlas och av vem. För att ett sådant ställningstagande ska vara möjligt måste vederbörande först ges information om vad personuppgifts­behandlingen innebär och därefter ges möjlighet till ett samtycke till behandlingen. Sådant samtycke benämns informerat samtycke. För att behandla känsliga personuppgifter krävs även godkänd etikprövning. Känsliga personuppgifter utgörs av:

  • ras eller etniskt ursprung
  • politiska åsikter
  • religiös eller filosofisk övertygelse
  • medlemskap i en fackförening
  • hälsa
  • en persons sexualliv eller sexuella läggning
  • genetiska uppgifter
  • biometriska uppgifter som entydigt identifierar en person.

Kodade och krypterade uppgifter

Uppgifter som är kodade eller krypterade är personuppgifter, så länge kod- eller krypteringsnyckel existerar någonstans, d.v.s. så länge som det är möjligt att identifiera personen bakom koden. Dataskyddsförordningen och den kompletterande lagstiftningen gäller således för data som är kodade eller krypterade.

Anonymiserade data

För att avidentifiera personuppgifter måste alla möjligheter till identifiering tas bort, så att uppgifter i data inte längre går att koppla till en nu levande fysisk person. Detta innebär att kod- och krypteringsnyckel måste förstöras, även hos primärforskaren, och att bakvägsidentifiering inte ska vara möjlig. Data som är anonymiserade omfattas inte av Dataskyddsförordningen.

Pseudonymiserade data

Ibland används termen pseudonymisering som synonym till avidentifiering, vilket är felaktigt för svenska förhållanden. För pseudonymiserade data är forskningspersonerna anonyma för den som behandlar uppgifterna, men möjligheten att koppla uppgifter till enskilda individer kvarstår, vilket innebär att lagstiftningen gäller.

 

Bakvägsidentifiering/Röjanderisk

Det är viktigt att kontrollera om data som ska tillgängliggöras innehåller information som kan innebära röjanderisk för de individer som deltagit i studien. Uppgifter som kan göra bakvägsidentifiering möjlig är uppgifter som i kombination med varandra kan användas för att identifiera en person, som uppgift om yrke, kommun och ålder. Det finns olika sätt att göra sådana uppgifter mindre känsliga, exempelvis genom att koda om så att kommun och inkomst anges i mer generella indelningar. Sådana indirekta identifierare är olika för olika projekt, då möjligheten för bakvägsidentifiering beror på vilka data som samlats in.

Personuppgifter i kvalitativa datamaterial

I kvalitativa datamaterial kan personuppgifter vara av stor betydelse för tolkningen (exempelvis dialektstudier eller djupintervjuer med personer i maktpositioner). Innan sådant datamaterial tillgängliggörs för vidare forskning är det viktigt att beakta Dataskyddsförordningen med kompletterande lagstiftning. För ljud- och videofiler finns det många aspekter att ta hänsyn till. En persons ansikte kan lätt användas för att identifiera personen och är därmed en personuppgift. En röst utgör en personuppgift förutsatt att det går att identifiera personen med hjälp av rösten, alltså så länge den inte förvrängs eller liknande. För denna typ av filer bör pseudonymisering genomföras förr eller senare, genom att exempelvis ersätta namn på personer, datum, platser och liknande information med ID-nummer, löpnummer, pseudonymer eller mer generella termer. Rådgör eventuellt med dataskyddsombud om du samlar in ljud- eller videodata.

Filformat för långtidsbevarande och tillgängliggörande

Alla digitala filformat riskerar att bli föråldrade och falla ur bruk. Om detta skulle hända kommer framtida program inte att kunna läsa och presentera informationen i filerna korrekt. Informationen skulle då gå förlorad. Det finns vissa åtgärder som man kan vidta för att förhindra att detta sker. En sådan åtgärd är att arkivera den programvara som kan läsa filen tillsammans med filen. En bättre lösning är att från början använda filformat som med stor sannolikhet går att använda även i framtiden. SND anser att de format som är lämpligast för långtidsbevarande och tillgängliggörande

  • är vanligt förekommande
  • har en öppen teknisk specifikation
  • är leverantörsoberoende.

Samtidigt är det inte alltid möjligt att välja ett format som uppfyller dessa kriterier. Standarder och traditioner inom olika discipliner kan avgöra vilka filformat som används. Specifika instrument, analysredskap eller egentillverkad programvara är sådant som kan vara avgörande för dataformaten. SND har utvärderat ett antal olika filformat som anses vara lämpliga för hantering, långtidsbevarande och tillgängliggörande av forskningsdata.


Källor:

  • Corti, Louise, Eynden, Veerle Van den, Bishop, Libby, Woollard, Matthew. (2014). Managing and sharing research data: a guide to good practice. Sage publications Ltd., s. 57-61.