Datainsamlingsfasen

Vad som är centralt för datahanteringen beror i stor utsträckning på vilken typ av data projektet kommer att generera. En viktig distinktion är t.ex. den mellan primära (inom projektet insamlade) och sekundära (redan existerande) data. Men det finns vissa saker som är viktiga att tänka på oavsett datatyp.

Datakvalitet

Några riktmärken som är viktiga oberoende av vilken typ av data man hanterar är att de ska vara fullständiga, strukturerade och begripliga. Detta gör att dina data blir av en sådan kvalitet att de senare kan göras tillgängliga för andra.

  • För att data ska bli fullständiga är det viktigt att undvika felkällor och att kontrollera för fel i sina data på ett tillförlitligt sätt.
  • Du gör dina data strukturerade genom att organisera dem på ett enhetligt sätt. Brist på struktur gör arbetet med data mer tidskrävande, eftersom det inte går att förutse och automatisera arbetsflöden.
  • Begriplighet är inte bara viktigt för att andra ska kunna förstå dina data, utan också för att du själv ska kunna hitta i dina data även efter en paus.

Datasäkerhet

De flesta lärosäten har utarbetat riktlinjer gällande datasäkerhet, utifrån informationsklassning. Det innebär regler om hantering av data på stationära datorer, bärbara media och i molntjänster. Åtgärder som du själv kan se över är t.ex. att regelbundet byta lösenord, aldrig e-posta lösenord och alltid logga ut när du lämnar din dator. Vidare bör man vara försiktig med att spara data på mobila lagringsmedier som exempelvis CD-skiva eller USB-minne, då dessa är lätta att förlägga och inte säkra för långtidslagring. Förutom riktlinjer vid respektive lärosäte finns även råd om datasäkerhet att ta del av från Datainspektionen.

När personuppgifter hanteras i forskningsprojektet måste särskilda åtgärder vidtas så att de inte riskerar att bli felaktiga eller spridas oavsiktligt. Att spara data med personuppgifter i en molntjänst är till exempel inte att rekommendera, då det gör det svårare att kontrollera att man uppfyller dataskyddsförordningens och den kompletterande lagstiftningens krav. En bättre plats för lagring är t.ex. en säker, lösenordskyddad server. Kontakta dataskyddsombudet på ditt lärosäte för att avgöra hur sådana data kan lagras bäst hos er. Samlas personuppgifter in ska du dessutom alltid göra en anmälan till dataskyddsombudet. Mer om personuppgifter i forskningsmaterial finns att läsa under Färdigställa och bevara data.

Mappstruktur och filnamn

En genomtänkt mappstruktur är en grundförutsättning för ett välorganiserat forskningsmaterial. Det bör finnas en färdig mappstruktur redan när man börjar samla in data, med begripliga mappnamn och en transparent struktur, som ska finnas nedskriven. Behöver du ändra mappstrukturen bör även detta dokumenteras.

Minst lika viktigt som en god mappstruktur är att de filer som finns i mapparna har lämpliga namn. Det är en bra idé att skapa ett system för namngivning av filer, som kan följas genom hela projektet. Ett filnamn bör

  • vara unikt – inte bara i sin egen mapp utan helst i hela projektet
  • ge en uppfattning om innehållet
  • vara ganska kort.
  • ha versionsnumret direkt i namnet. Råd om versionering av datafiler, i samband med analysfasen, finns att läsa under Dataanalysfasen.

Dokumentation

Datainsamlingen bör dokumenteras på ett sätt som gör det möjligt för en själv och andra att senare förstå och återskapa forskningsprocessen i detalj. Även om det inte finns några direkta planer på att någon annan ska fortsätta arbeta med forskningsmaterialet, är det viktigt att, såväl för egen del som för granskare eller i samband med sekundäranalyser, kunna gå tillbaka i forskningens olika steg.

Vad som är aktuellt att dokumentera varierar mellan olika forskningsprojekt och discipliner. Det kan exempelvis handla om tidsperioder för utsända enkäter/undersökningar, datum för inkomna registerdata, viktiga korrespondenser, frågeställningar och problem som uppstår under datainsamlingen, samt olika beslut som tas. Det kan också handla om metodbeskrivningar, hur man hanterar bortfall och vad man gör med s.k. missing data m.m. I ett senare stadium kan det gälla vilka datafiler, koder och statistiska metoder som har använts.

Många ämnesområden har någon slags praxis för dokumentation, och inom vissa ämnesområden finns speciella program som stöd. Det viktiga är dock att från början klargöra hur forskningens olika processer och beslut ska dokumenteras och därefter hålla fast vid det i den utsträckning det går. Behöver någon dokumentationsmetod ändras – dokumentera ändringen!

 

Källor:

  • Inter-university Consortium for Political and Social Research (ICPSR). (2012). Guide to Social Science Data Preparation and Archiving: Best Practice Throughout the Data Life Cycle (5th ed.). Ann Arbor, MI. ICPSR Guide to Social Science Data Preparation and Archiving, s. 33-35
  • Eloranta S, Johansson AL, Kristinsson SY, Andersson TM. (2013). Att strukturera och dokumentera forskningsprojekt. Läkartidningen 110(8): 416-9.
  • Corti, Louise, Eynden, Veerle Van den, Bishop, Libby, Woollard, Matthew. (2014). Managing and sharing research data: a guide to good practice. Sage publications Ltd., s. 57-61