Texter från Migrationsverket

Den här studien är en del av samlingen Parallella texter från myndigheter

Skapare/primärforskare

Institutet för språk och folkminnen, Språkrådet

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Beskrivning

Parallella texter nedladdade med hjälp av "w3m -dump" från ett ubuntu-skal, ifrån Migrationsverkets webbplats.

Ämnesområde

Lagstiftning och rättssystem, Internationell politik och organisationer, Konflikter, säkerhet och fred, SOCIAL VÄLFÄRDSPOLITIK OCH VÄLFÄRDSSYSTEM, SAMHÄLLE OCH KULTUR (CESSDA Topic Classification)
Samhällsvetenskap, Språk och litteratur (Standard för svensk indelning av forskningsämnen 2011)

Skapare/primärforskare

Institutet för språk och folkminnen, Språkrådet

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Medverkande

Institutet för språk och folkminnen, Språkrådet

Beskrivning

Parallella texter nedladdade med hjälp av "w3m -dump" från ett ubuntu-skal, ifrån Migrationsverkets webbplats.

Geografisk utbredning

Geografisk plats: Sverige

Urvalsmetod

Flerspråkigt parallellt material.

Ämnesområde

Lagstiftning och rättssystem, Internationell politik och organisationer, Konflikter, säkerhet och fred, SOCIAL VÄLFÄRDSPOLITIK OCH VÄLFÄRDSSYSTEM, SAMHÄLLE OCH KULTUR (CESSDA Topic Classification)
Samhällsvetenskap, Språk och litteratur (Standard för svensk indelning av forskningsämnen 2011)

Språkresurser

Resurstyp

Korpus

Tänkt användning

Språkteknologiskt datorprogram

Text corpus

  • Antal språk

    Flerspråkig
  • Språk

    • Svenska (swe)

      Texter: 33

    • Amhariska (amh)

      Texter: 23

    • Arabiska (ara)

      Texter: 33

    • Azerbajdzjanska (aze)

      Texter: 27

    • Central Kurdish (ckb)

      Texter: 29

    • Engelska (eng)

      Texter: 33

    • Persiska (fas)

      Texter: 32

    • Kroatiska (hrv)

      Texter: 23

    • Armeniska (hye)

      Texter: 24

    • Georgiska (kat)

      Texter: 1

    • Northern Kurdish (kmr)

      Texter: 28

    • Mongoliska (mon)

      Texter: 25

    • Dari (prs)

      Texter: 28

    • Pashto (pus)

      Texter: 28

    • Romani (rom)

      Arli (dialekt)

      Texter: 24

    • Ryska (rus)

      Texter: 33

    • Somaliska (som)

      Texter: 29

    • Spanska (spa)

      Texter: 31

    • Albanska (sqi)

      Texter: 27

    • Thailändska (tha)

      Texter: 4

    • Tigrinja (tir)

      Texter: 29

    • Turkiska (tur)

      Texter: 2

    • Uzbekiska (uzb)

      Texter: 25

    • Kinesiska (zho)

      Texter: 3

    • Franska (fra)

      Texter: 31

    Mer..
  • Modalitet

    Skriftspråk
  • Storlek

    Ord: 29008 (swe)

    Texter: 33 (swe)

    Ord: 438614 (TOT)

    Texter: 580 (TOT)

  • Källa

    migrationsverket
    www.migrationsverket.se

Parallella texter från Migrationsverket

Skapare/primärforskare

Institutet för språk och folkminnen, Språkrådet

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Beskrivning

Texterna har laddats ner med hjälp av kommando 'w3m -dump' ifrån ett ubuntu-skal, varpå resulterande textfiler har skalats av till att innehålla endast den intressanta texten (inga menyer och dylikt).

Dataformat / datastruktur

Text

Datainsamling

Insamlingsmetod: Självadministrerad text och/eller dagböcker: webbaserat

Tidsperiod(er) för datainsamling: 2019-01-01 — 2019-01-31

Publicerad: 2020-03-30