Svensk text

SND-ID: EXT 0278

Beskrivning Data och dokumentation

Skapare/primärforskare

Peter Dahlgren - Göteborgs universitet orcid

Beskrivning

Samling med språkresurser på svenska speciellt anpassat för att snabbt och enkelt kunna läsas in av programspråk som Python, R eller dylikt. Bland språkresurserna finns namn på kvinnor (förnamn), män (förnamn), städer, kommuner, län, huvudstäder, länder, nationaliteter, yrken, myndigheter, massmedier med mera.

Syftet är att samla svenska resurser som är fria att använda, finns i flera öppna standardiserade format (exempelvis CSV och JSON), har en enkel datastruktur som enkelt kan maskinläsas, består av små filer utan onödigt krimskrams och har exempelkod (R och Python) för att snabbt kunna användas.

Materialet utökas och uppdateras kontinuerligt under öppna licenser.
Huvudman, medverkande och finansiering
Skyddsvärde och etikprövning
Metod
Geografisk täckning

Geografisk utbredning

Geografisk plats: Sverige

Publikationer

Åtkomst till data via

Hemsida

Dataset
Svensk text

Dataformat / datastruktur

Text

Skapare/primärforskare

Peter Dahlgren - Göteborgs universitet orcid

Upphovsrätt

Särskild upphovsrätt (t.ex. Creative Commons) för respektive material beskrivs på https://github.com/peterdalle/svensktext

Publicerad: 2018-12-20
Senast uppdaterad: 2021-11-11