Parallella texter från Arbetsmiljöverket

SND-ID: ext0332-1.

Ingår i samling hos SND: Parallella texter från myndigheter

Skapare/primärforskare

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Institutet för språk och folkminnen, Språkrådet

Forskningshuvudman

Institutet för språk och folkminnen - Språkrådet rorId

Beskrivning

Parallella texter nedladdade från Arbetsmiljöverkets webbplats. De txt-filer som finns tillgängliga är resultat ur en körning av kommandot pdftotext i ubuntu-skal.

Språk

Metod och utfall

Urvalsmetod

Svenska texter med översättning till ett eller flera språk.

Dataformat / datastruktur

Datainsamling
  • Insamlingsmetod: Självadministrerad text och/eller dagböcker: webbaserat
  • Tidsperiod(er) för datainsamling: 2017-01-01 – 2017-01-31
Språkresurser

Resurstyp

Korpus

Tänkt användning

Språkteknologiskt datorprogram

Text corpus

  • Antal språk

    Flerspråkig
  • Språk

    • Svenska (swe)

      Texter: 21

    • Engelska (eng)

      Texter: 19

    • Bulgariska (bul)

      Texter: 2

    • Tjeckiska (ces)

      Texter: 2

    • Tyska (deu)

      Texter: 3

    • Estniska (est)

      Texter: 3

    • Finska (fin)

      Texter: 1

    • Ungerska (hun)

      Texter: 1

    • Lettiska (lav)

      Texter: 3

    • Litauiska (lit)

      Texter: 3

    • Polska (pol)

      Texter: 4

    • Rumänska (ron)

      Texter: 3

    • Spanska (spa)

      Texter: 2

    • Kinesiska (zho)

      Texter: 2

    • Ryska (rus)

      Texter: 3

    • Arabiska (ara)

      Texter: 1

    • Turkiska (tur)

      Texter: 2

    • Thailändska (tha)

      Texter: 1

    • Hindi (hin)

      Texter: 1

    Mer..
  • Modalitet

    Skriftspråk
  • Storlek

    Ord: 166367 (swe)

    Texter: 21 (swe)

    Ord: 432133 (TOT)

    Texter: 78

  • Källa

    arbetsmiljöverket
    www.av.se
Geografisk täckning

Geografisk utbredning

Geografisk plats: Sverige

Administrativ information
Ämnesområde och nyckelord

Forskningsområde

Samhällsvetenskap (Standard för svensk indelning av forskningsämnen 2011)

Språk och litteratur (Standard för svensk indelning av forskningsämnen 2011)

Arbete och sysselsättning (CESSDA Topic Classification)

Publikationer

Kontakt för frågor om data

Denna resurs har följande relationer

Relaterade forskningsdata i SND:s katalog

Ingår i samling hos SND

CLARIN Virtual Collection Registry

Lägg till i samling

En virtuell samling är kopplad till ett specifikt forskningsändamål och innehåller länkar till dataresurser i olika digitala arkiv. Samlingen är lätt att skapa, få åtkomst till och citera.

Read more about virtual collections on the CLARIN website.