Texter från Migrationsverket

Den här studien är en del av samlingen Parallella texter från myndigheter

Skapare/primärforskare:

Institutet för språk och folkminnen, Språkrådet

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Beskrivning:

Parallella texter nedladdade med hjälp av "w3m -dump" från ett ubuntu-skal, ifrån Migrationsverkets webbplats.

Ämnesområde:

lagstiftning och rättssystem, internationell politik och organisationer, konflikter, säkerhet och fred, SOCIAL VÄLFÄRDSPOLITIK OCH VÄLFÄRDSSYSTEM, SAMHÄLLE OCH KULTUR (CESSDA Topic Classification)
Samhällsvetenskap, Språk och litteratur (Standard för svensk indelning av forskningsämnen 2011)

Ansvarig institution/enhet:

Institutet för språk och folkminnen, Språkrådet

Skapare/primärforskare:

Institutet för språk och folkminnen, Språkrådet

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Medverkande:

Institutet för språk och folkminnen, Språkrådet

Beskrivning:

Parallella texter nedladdade med hjälp av "w3m -dump" från ett ubuntu-skal, ifrån Migrationsverkets webbplats.

Geografisk utbredning:

Geografisk plats: Sverige

Ämnesområde:

lagstiftning och rättssystem, internationell politik och organisationer, konflikter, säkerhet och fred, SOCIAL VÄLFÄRDSPOLITIK OCH VÄLFÄRDSSYSTEM, SAMHÄLLE OCH KULTUR (CESSDA Topic Classification)
Samhällsvetenskap, Språk och litteratur (Standard för svensk indelning av forskningsämnen 2011)

Språkresurser

Resurstyp

Korpus

Tänkt användning

Språkteknologiskt datorprogram

Text corpus

  • Antal språk

    Flerspråkig
  • Språk

    • Svenska (swe)

      Texter: 33

    • Amhariska (amh)

      Texter: 23

    • Arabiska (ara)

      Texter: 33

    • Azerbajdzjanska (aze)

      Texter: 27

    • Central Kurdish (ckb)

      Texter: 29

    • Engelska (eng)

      Texter: 33

    • Persiska (fas)

      Texter: 32

    • Kroatiska (hrv)

      Texter: 23

    • Armeniska (hye)

      Texter: 24

    • Georgiska (kat)

      Texter: 1

    • Northern Kurdish (kmr)

      Texter: 28

    • Mongoliska (mon)

      Texter: 25

    • Dari (prs)

      Texter: 28

    • Pashto (pus)

      Texter: 28

    • Romani (rom)

      Arli (dialekt)

      Texter: 24

    • Ryska (rus)

      Texter: 33

    • Somaliska (som)

      Texter: 29

    • Spanska (spa)

      Texter: 31

    • Albanska (sqi)

      Texter: 27

    • Thailändska (tha)

      Texter: 4

    • Tigrinja (tir)

      Texter: 29

    • Turkiska (tur)

      Texter: 2

    • Uzbekiska (uzb)

      Texter: 25

    • Kinesiska (zho)

      Texter: 3

    • Franska (fra)

      Texter: 31

    Mer..
  • Modalitet

    Skriftspråk
  • Size

    Ord: 29008 (swe)

    Texter: 33 (swe)

    Ord: 438614 (TOT)

    Texter: 580 (TOT)

  • Källa

    migrationsverket
    www.migrationsverket.se

Parallella texter från Migrationsverket

Skapare/primärforskare:

Institutet för språk och folkminnen, Språkrådet

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Beskrivning:

Texterna har laddats ner med hjälp av kommando 'w3m -dump' ifrån ett ubuntu-skal, varpå resulterande textfiler har skalats av till att innehålla endast den intressanta texten (inga menyer och dylikt).

Dataformat / datastruktur:

Text

Datainsamling:

Insamlingsmetod: Självadministrerad text och/eller dagböcker: webbaserat

Tidsperiod(er) för datainsamling: 2019-01-01 — 2019-01-31

Publicerad: 2020-03-30