Texter från Migrationsverket

SND-ID: EXT 0329

Den här studien är en del av samlingen Parallella texter från myndigheter

Beskrivning Data och dokumentation

Skapare/primärforskare

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Institutet för språk och folkminnen, Språkrådet

Beskrivning

Parallella texter nedladdade med hjälp av "w3m -dump" från ett ubuntu-skal, ifrån Migrationsverkets webbplats.
Skyddsvärde och etikprövning
Metod

Urvalsmetod

Flerspråkigt parallellt material.
Språkresurser

Resurstyp

Korpus

Tänkt användning

Språkteknologiskt datorprogram

Text corpus

  • Antal språk

    Flerspråkig
  • Språk

    • Svenska (swe)

      Texter: 33

    • Amhariska (amh)

      Texter: 23

    • Arabiska (ara)

      Texter: 33

    • Azerbajdzjanska (aze)

      Texter: 27

    • Central Kurdish (ckb)

      Texter: 29

    • Engelska (eng)

      Texter: 33

    • Persiska (fas)

      Texter: 32

    • Kroatiska (hrv)

      Texter: 23

    • Armeniska (hye)

      Texter: 24

    • Georgiska (kat)

      Texter: 1

    • Northern Kurdish (kmr)

      Texter: 28

    • Mongoliska (mon)

      Texter: 25

    • Dari (prs)

      Texter: 28

    • Pashto (pus)

      Texter: 28

    • Romani (rom)

      Arli (dialekt)

      Texter: 24

    • Ryska (rus)

      Texter: 33

    • Somaliska (som)

      Texter: 29

    • Spanska (spa)

      Texter: 31

    • Albanska (sqi)

      Texter: 27

    • Thailändska (tha)

      Texter: 4

    • Tigrinja (tir)

      Texter: 29

    • Turkiska (tur)

      Texter: 2

    • Uzbekiska (uzb)

      Texter: 25

    • Kinesiska (zho)

      Texter: 3

    • Franska (fra)

      Texter: 31

    Mer..
  • Modalitet

    Skriftspråk
  • Storlek

    Ord: 29008 (swe)

    Texter: 33 (swe)

    Ord: 438614 (TOT)

    Texter: 580 (TOT)

  • Källa

    migrationsverket
    www.migrationsverket.se
Geografisk täckning

Geografisk utbredning

Geografisk plats: Sverige

Ämnesområde och nyckelord

Ämnesområde

Lagstiftning och rättssystem, Internationell politik och organisationer, Konflikter, säkerhet och fred, SOCIAL VÄLFÄRDSPOLITIK OCH VÄLFÄRDSSYSTEM, SAMHÄLLE OCH KULTUR (CESSDA Topic Classification)
Samhällsvetenskap, Språk och litteratur (Standard för svensk indelning av forskningsämnen 2011)

Publikationer
Dataset
Parallella texter från Migrationsverket

Beskrivning

Texterna har laddats ner med hjälp av kommando 'w3m -dump' ifrån ett ubuntu-skal, varpå resulterande textfiler har skalats av till att innehålla endast den intressanta texten (inga menyer och dylikt).

Dataformat / datastruktur

Text

Skapare/primärforskare

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Institutet för språk och folkminnen, Språkrådet

Datainsamling

  • Insamlingsmetod: Självadministrerad text och/eller dagböcker: webbaserat
  • Tidsperiod(er) för datainsamling: 2019-01-01–2019-01-31
Publicerad: 2020-03-30