Texter från Arbetsmiljöverket

SND-ID: EXT 0332

Den här studien är en del av samlingen Parallella texter från myndigheter

Beskrivning Data och dokumentation

Skapare/primärforskare

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Institutet för språk och folkminnen, Språkrådet

Beskrivning

Parallella texter nedladdade från Arbetsmiljöverkets webbplats.

Språk

Engelska

Svenska

Skyddsvärde och etikprövning
Metod och tidsperiod

Urvalsmetod

Svenska texter med översättning till ett eller flera språk.
Språkresurser

Resurstyp

Korpus

Tänkt användning

Språkteknologiskt datorprogram

Text corpus

  • Antal språk

    Flerspråkig
  • Språk

    • (swe)

      Texter: 21

    • (eng)

      Texter: 19

    • (bul)

      Texter: 2

    • (ces)

      Texter: 2

    • (deu)

      Texter: 3

    • (est)

      Texter: 3

    • (fin)

      Texter: 1

    • (hun)

      Texter: 1

    • (lav)

      Texter: 3

    • (lit)

      Texter: 3

    • (pol)

      Texter: 4

    • (ron)

      Texter: 3

    • (spa)

      Texter: 2

    • (zho)

      Texter: 2

    • (rus)

      Texter: 3

    • (ara)

      Texter: 1

    • (tur)

      Texter: 2

    • (tha)

      Texter: 1

    • (hin)

      Texter: 1

    Mer..
  • Modalitet

    Skriftspråk
  • Storlek

    Ord: 166367 (swe)

    Texter: 21 (swe)

    Ord: 432133 (TOT)

    Texter: 78

  • Källa

    arbetsmiljöverket
    www.av.se
Geografisk täckning

Geografisk utbredning

Geografisk plats: Sverige

Ämnesområde och nyckelord

Forskningsområde

ARBETE OCH SYSSELSÄTTNING (CESSDA Topic Classification)
Samhällsvetenskap, Språk och litteratur (Standard för svensk indelning av forskningsämnen 2011)

Publikationer
Dataset
Parallella texter från Arbetsmiljöverket

Beskrivning

Parallella texter nedladdade från Arbetsmiljöverkets webbplats. De txt-filer som finns tillgängliga är resultat ur en körning av kommandot pdftotext i ubuntu-skal.

Dataformat / datastruktur

Text

Skapare/primärforskare

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Institutet för språk och folkminnen, Språkrådet

Datainsamling

  • Insamlingsmetod: Självadministrerad text och/eller dagböcker: webbaserat
  • Tidsperiod(er) för datainsamling: 2017-01-01–2017-01-31

Licens

Creative Commons  Erkännande-Icke kommersiell-Inga Bearbetningar 4.0 Internationell (CC BY-NC-ND 4.0)
Publicerad: 2020-03-30
Senast uppdaterad: 2020-05-15