Dataanalysfasen

Under analysfasen är det viktigt att hålla reda på olika versioner av datafiler och att dokumentera förändringar och tillägg som görs.

Gemensamma arbetsfiler

Under den tid analysarbetet pågår kommer variabler att ändras, läggas till och tas bort i datamängden. Trots omfattande genomgång och rensning av data kommer troligtvis ytterligare fel att upptäckas. Det kan även uppstå behov av att konstruera nya variabler.

Inom en forskargrupp är det inte ovanligt att forskare arbetar med delmängder av data med specifika variabler och/eller enheter. Förvirring och eventuella felanalyser kan undvikas genom att man utgår från en gemensam version av data, som lagras skrivskyddad och med åtkomst för bara en eller några få i forskargruppen. Den eller dessa har ansvaret för att rätta till fel, lägga till nya variabler och dokumentera de versioner som skapas. På så vis ges bättre kontroll över vilken version av data som är i bruk vilket gör det enklare att i efterhand återskapa analyser som gjorts. Med en gemensam version av data blir det även smidigare när projektet senare ska förberedas för arkivering och eventuellt göras tillgängligt för sekundäranalyser.

Versionering av data och dokumentation

Ett sätt att hålla koll på förändringar är att skapa tydliga versioner av datafiler. Den första versionen av data är oftast resultatet från datainsamlingen, den andra versionen ett resultat efter att data har rensats, medan en tredje version skapas efter tillägg av konstruerade variabler. Under analysarbetet skapas därefter nya versioner i takt med att ändringar och tillägg görs. Varje ny sparad version av data bör alltid anges med nytt versionsnummer och gärna datum när filen skapades.

Redan i ett tidigt skede av forskningsprojektet startar arbetet med dokumentation, som sedan är en pågående process under hela den tid som projektet pågår. Under analysfasen, när data på olika sätt bearbetas, är det viktigt att dokumentera alla de ändringar och tillägg som görs för att kunna se vad som skiljer olika versioner av data från varandra. De analyser som utförs behöver också dokumenteras så att de kan återskapas vid senare tidpunkt.

Säkerhetskopiering av data och dokumentation

Alla relevanta filer bör säkerhetskopieras regelbundet, gärna mer än en gång per dag. Särskilt viktigt är det för datafiler som är under uppbyggnad, för att förhindra att data går förlorade eller behöver matas in på nytt. För datamiljöer inom universitet brukar det finnas stöd för säkerhetskopiering och lagring av data. Kolla upp vad som gäller på din arbetsplats, eller där forskningsmaterialet och datafilerna ska förvaras. Det är dessutom klokt att förvara en säkerhetskopia av data på annan plats, i händelse av en nödsituation eller katastrof som kan förstöra många års arbete.


Källor:

  • Inter-university Consortium for Political and Social Research (ICPSR). (2012). Guide to Social Science Data Preparation and Archiving: Best Practice Throughout the Data Life Cycle (5th ed.). Ann Arbor, MI. ICPSR Guide to Social Science Data Preparation and Archiving, s. 33-35
  • Eloranta S, Johansson AL, Kristinsson SY, Andersson TM. (2013). Att strukturera och dokumentera forskningsprojekt. Läkartidningen 110(8): 416-9.