Färdigställa och bevara data

När forskningsprojektet är i sitt slutskede behöver forskningsdata förberedas för långtidsbevarande. Att långtidsbevara data innebär att spara datafilerna i ett format som är förberett för att vara läsbart i framtiden utan att det kräver någon särskild datorutrustning eller programvara. Medan pappershandlingar normalt sett arkiveras vid ett enda tillfälle behöver digitala handlingar regelbundet konverteras (sparas om i ett nyare format) och migreras (överföras från ett medium till ett annat). Du bör därför då och då kontrollera att dina digitala filer är läsbara.

Forskningsmaterial ska alltid arkiveras vid det egna lärosätet i enlighet med Arkivlagen (SFS 1990:782). Det som ska arkiveras är såväl rådatafiler och etiktillstånd, som forskningsdokumentation och publicerade resultat.

Om data ska vara tillgängliga för vidare forskning efter projektets slut behöver även detta förberedas. För forskningsdata som tillgängliggörs för andra personer rekommenderas en överenskommelse/licens om att data ska citeras vid återanvändning. Om forskningsmaterialet inkluderar material från en annan dataproducent eller -källa är det viktigt att i ett avtal mellan parterna reglera om materialet får göras tillgängligt i sin helhet.

Innan forskningsmaterial tillgängliggörs är det viktigt att än en gång kontrollera om det finns juridiska begränsningar för det specifika materialet. Forskningsmaterial kan t.ex. innehålla känsliga personuppgifter som kan bli föremål för sekretess i syfte att skydda människors integritet.

Personuppgifter i forskningsmaterial

Med personuppgift avses all slags information som direkt eller indirekt kan hänföras till en fysisk person som är i livet. Dataskyddsförordningen med kompletterande lagstiftning syftar till att skydda människor från att deras personliga integritet kränks vid behandling av deras personuppgifter och reglerar om och hur personuppgifter får användas för forskningsändamål. Utgångspunkten är att var och en äger sina egna personuppgifter och har att själv ta ställning till hur dessa personuppgifter får behandlas och av vem. För att ett sådant ställningstagande ska vara möjligt måste vederbörande först ges information om vad personuppgifts­behandlingen innebär och därefter ges möjlighet till ett samtycke till behandlingen. Sådant samtycke benämns informerat samtycke. För att behandla känsliga personuppgifter krävs även en godkänd etikprövning. Känsliga personuppgifter berör:

 • ras eller etniskt ursprung
 • politiska åsikter
 • religiös eller filosofisk övertygelse
 • medlemskap i en fackförening
 • hälsa
 • en persons sexualliv eller sexuella läggning
 • genetiska uppgifter
 • biometriska uppgifter som entydigt identifierar en person.

Pseudonymiserade (kodade) personuppgifter

När data är pseudonymiserade är forskningspersonerna inte möjliga att identifiera för den som behandlar uppgifterna, men möjligheten att koppla uppgifter till enskilda individer kvarstår. Så länge det är möjligt att identifiera personen bakom koden med en kodnyckel gäller Dataskyddsförordningen och den kompletterande lagstiftningen.

Avidentifierade (anonymiserade) personuppgifter

När man avidentifierar personuppgifter tar man bort alla möjligheter till identifiering, så att uppgifter i data inte längre kan kopplas till en nu levande fysisk person. Detta innebär att kodnyckeln måste förstöras, även hos primärforskaren, och att bakvägsidentifiering inte ska vara möjlig. Data som är avidentifierade/anonymiserade omfattas inte av Dataskyddsförordningen.

Bakvägsidentifiering/röjanderisk

Det är viktigt att kontrollera om data som ska tillgängliggöras innehåller information som kan innebära röjanderisk för de individer som deltagit i studien. Uppgifter som kan göra bakvägsidentifiering möjlig är uppgifter som i kombination med varandra kan användas för att identifiera en person, som uppgift om yrke, kommun och ålder. Det finns olika sätt att göra sådana uppgifter mindre känsliga, exempelvis genom att koda om så att kommun och inkomst anges i mer generella indelningar. Sådana indirekta identifierare är olika för olika projekt, då möjligheten för bakvägsidentifiering beror på vilka data som samlats in.

Personuppgifter i kvalitativa datamaterial

I kvalitativa datamaterial kan personuppgifter vara av stor betydelse för tolkningen (exempelvis dialektstudier eller djupintervjuer med personer i maktpositioner). Innan sådant datamaterial tillgängliggörs för vidare forskning är det viktigt att beakta Dataskyddsförordningen med kompletterande lagstiftning. För ljud- och videofiler finns det många aspekter att ta hänsyn till. En persons ansikte kan lätt användas för att identifiera personen och är därmed en personuppgift. En röst utgör en personuppgift förutsatt att det går att identifiera personen med hjälp av rösten, alltså så länge den inte förvrängs eller liknande. För denna typ av filer bör pseudonymisering genomföras förr eller senare, genom att exempelvis ersätta namn på personer, datum, platser och liknande information med ID-nummer, löpnummer, pseudonymer eller mer generella termer. Rådgör eventuellt med dataskyddsombud om du samlar in ljud- eller videodata.

Filformat för långtidsbevarande och tillgängliggörande

Alla digitala filformat riskerar att bli föråldrade och falla ur bruk. Om detta skulle hända kommer framtida program inte att kunna läsa och presentera informationen i filerna korrekt. Informationen skulle då gå förlorad. Det finns vissa åtgärder som man kan vidta för att förhindra att detta sker. En sådan åtgärd är att arkivera den programvara som kan läsa filen tillsammans med filen. En bättre lösning är att från början använda filformat som med stor sannolikhet går att använda även i framtiden. SND anser att de format som är lämpligast för långtidsbevarande och tillgängliggörande

 • är vanligt förekommande
 • har en öppen teknisk specifikation
 • är leverantörsoberoende.

Samtidigt är det inte alltid möjligt att välja ett format som uppfyller dessa kriterier. Standarder och traditioner inom olika discipliner kan avgöra vilka filformat som används. Specifika instrument, analysredskap eller egentillverkad programvara är sådant som kan vara avgörande för dataformaten. SND har utvärderat ett antal filformat som anses vara lämpliga för hantering, långtidsbevarande och tillgängliggörande av forskningsdata.


Källor:

 • Corti, Louise, Eynden, Veerle Van den, Bishop, Libby, Woollard, Matthew. (2014). Managing and sharing research data: a guide to good practice. Sage publications Ltd., s. 57-61.