Statistik över namn efter födelseland 2020

SND-ID: 2021-272-1. Version: 1. DOI: https://doi.org/10.5878/s91g-y391

Citering

Skapare/primärforskare

Peter M. Dahlgren - Göteborgs universitet, Institutionen för journalistik, medier och kommunikation (JMG) orcid

Forskningshuvudman

Göteborgs universitet - Institutionen för journalistik, medier och kommunikation (JMG) rorId

Beskrivning

Detta dataset innehåller statistik över namn (tilltalsnamn på kvinnor, tilltalsnamn på män, samt efternamn) efter födelseland. Totalt är det 231 505 namn uppdelade på 202 länder. Datan kommer från SCB:s befolkningsstatistik/namnregister och avser personer folkbokförda i Sverige 31 december 2020. Vissa namn är dock exkluderade på grund av sekretess, såsom namn med färre än fem bärare. Datan är licensierad med Creative Commons Attribution 4.0 International (CC BY 4.0) och får användas så länge SCB anges som källa. I detta dataset hittar du (förutom originaldatan från SCB) även bearbetningar där ISO-kod för varje land har lagts till samt data i så kallat wide format och long format för att underlätta vidare databehandling.

Datatsetet består av följande:
namn-efter-fodelseland-2020.xlsx (129 MB) är den obearbetade originalfilen levererad från SCB. Datan är i så kallat wide format med namn på raderna och länderna i kolumnerna. Totalt är det 202 länder plus kolumnen Ospecificerade länder längst till höger.

namn-minst-tva-barare-2020.xlsx (12 MB) innehåller namn med minst två bärare 31 december 202

... Visa mer..
Detta dataset innehåller statistik över namn (tilltalsnamn på kvinnor, tilltalsnamn på män, samt efternamn) efter födelseland. Totalt är det 231 505 namn uppdelade på 202 länder. Datan kommer från SCB:s befolkningsstatistik/namnregister och avser personer folkbokförda i Sverige 31 december 2020. Vissa namn är dock exkluderade på grund av sekretess, såsom namn med färre än fem bärare. Datan är licensierad med Creative Commons Attribution 4.0 International (CC BY 4.0) och får användas så länge SCB anges som källa. I detta dataset hittar du (förutom originaldatan från SCB) även bearbetningar där ISO-kod för varje land har lagts till samt data i så kallat wide format och long format för att underlätta vidare databehandling.

Datatsetet består av följande:
namn-efter-fodelseland-2020.xlsx (129 MB) är den obearbetade originalfilen levererad från SCB. Datan är i så kallat wide format med namn på raderna och länderna i kolumnerna. Totalt är det 202 länder plus kolumnen Ospecificerade länder längst till höger.

namn-minst-tva-barare-2020.xlsx (12 MB) innehåller namn med minst två bärare 31 december 2020 från SCB.

SCB-villkor (0,1 MB) beskriver SCB:s allmänna villkor för avtal och överenskommelser vad gäller användandet av datan.

Därtill finns det tre CSV-filer (3,5 MB) där originalfilen har bearbetats till CSV-filer i wide format som underlättar maskinläsning. Vid wide format har originalstrukturen bibehållits med namnen på raderna och länderna i kolumnen. Däremot har länderna ersatts med sina respektive ISO-koder för att undvika problemet med mellanslag och svenska tecken i kolumnnamnen.

Det finns även tre ytterligare CSV-filer (141 MB) där originalfilen har bearbetats till CSV-filer i long format som underlättar maskinläsning. Vid long format återupprepas namnet på varje rad för respektive land och det totala antalet bärare för namnet ifråga. Dessutom finns en landskod i ISO-format med varje land för att enkelt kunna integreras i andra typer av analyser. Visa mindre..

Data innefattar personuppgifter

Nej

Språk

Metod och utfall

Analysenhet

Population

Sverige

Tidsdimension

Tidsperiod(er) som undersökts

2020-12-31 – Pågående

Antal individer/objekt

231505

Dataformat / datastruktur

Datainsamling
  • Insamlingsmetod: Aggregation
  • Datainsamlare: Statistiska centralbyrån (SCB)
  • Datakälla: Register/handlingar/förteckningar, Befolkningsgrupp
Geografisk täckning

Geografisk utbredning

Geografisk plats: Sverige

Geografisk beskrivning: Sveriges befolkning efter födelseland.

Lägsta geografiska enhet

Land

Högsta geografiska enhet

Land

Administrativ information

Ansvarig institution/enhet

Institutionen för journalistik, medier och kommunikation (JMG)

Finansiering

  • Finansiär: Institutet för mediestudier
Ämnesområde och nyckelord

Forskningsområde

Samhällsvetenskap (Standard för svensk indelning av forskningsämnen 2011)

Språk och lingvistik (CESSDA Topic Classification)

Minoriteter (CESSDA Topic Classification)

Folkräkningar (CESSDA Topic Classification)

Publikationer

Dahlgren, P. M. (2021). Svenskar eller utrikesfödda i medierna? – att identifiera födelseland från namn. I: L.
Truedsson (red.) Vitt eller brett? – vilka får ta plats i medier och på redaktioner. Stockholm: Institutet för
mediestudier.
ISBN: 978-91-987098-0-3

Om du publicerat något baserat på det här datamaterialet, meddela gärna SND en referens till din(a) publikation(er). Är du ansvarig för katalogposten kan du själv uppdatera metadata/databeskrivningen via DORIS.

Publicerad: 2021-11-02