Texter från Konsumentverket

SND-ID: EXT 0327

Den här studien är en del av samlingen Parallella texter från myndigheter

Beskrivning Data och dokumentation

Skapare/primärforskare

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Institutet för språk och folkminnen, Språkrådet

Beskrivning

Parallella texter nedladdade från webbplatsen hallåkonsument.se som drivs av Konsumentverket.
Skyddsvärde och etikprövning
Metod

Urvalsmetod

Svenska texter som har en eller flera översättningar.
Språkresurser

Resurstyp

Korpus

Tänkt användning

Språkteknologiskt datorprogram

Text corpus

  • Antal språk

    Flerspråkig
  • Språk

    • (swe)

      Texter: 42

    • (eng)

      Texter: 42

    • (fra)

      Texter: 31

    • (spa)

      Texter: 31

    • (deu)

      Texter: 31

    • (pol)

      Texter: 31

    • (fin)

      Texter: 31

    • (ara)

      Texter: 42

    • (fas)

      Texter: 42

    • (som)

      Texter: 6

    • (sqi)

      Texter: 31

    • (tir)

      Texter: 6

    • (ckb)

      Texter: 37

    • (hrv)

      Texter: 31

    Mer..
  • Modalitet

    Skriftspråk
  • Storlek

    Ord: 190126 (TOT)

    Texter: 434 (TOT)

    Ord: 21535 (swe)

    Texter: 42 (swe)

  • Källa

    konsumentverket
    hallåkonsument.se
Geografisk täckning

Geografisk utbredning

Geografisk plats: Sverige

Ämnesområde och nyckelord

Forskningsområde

Konsumtion och konsumentbeteende, HANDEL, INDUSTRI OCH MARKNADER (CESSDA Topic Classification)
Ekonomi och näringsliv, Juridik och samhälle, Språk och litteratur (Standard för svensk indelning av forskningsämnen 2011)

Publikationer
Dataset
Texter från Konsumentverket

Beskrivning

Texterna har laddats ner med hjälp av kommando 'w3m -dump' ifrån ett ubuntu-skal, varpå resulterande textfiler har skalats av till att innehålla endast den intressanta texten (inga menyer och dylikt).

Dataformat / datastruktur

Text

Skapare/primärforskare

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Institutet för språk och folkminnen, Språkrådet

Datainsamling

  • Insamlingsmetod: Självadministrerad text och/eller dagböcker: webbaserat
  • Tidsperiod(er) för datainsamling: 2019-01-01–2019-01-31

Licens

Creative Commons  Erkännande-Inga Bearbetningar 4.0 Internationell (CC BY-ND 4.0)