Svensk text

SND-ID: EXT 0278

Skapare/primärforskare

Peter Dahlgren - Göteborgs universitet orcid

Beskrivning

Samling med språkresurser på svenska speciellt anpassat för att snabbt och enkelt kunna läsas in av programspråk som Python, R eller dylikt. Bland språkresurserna finns namn på kvinnor (förnamn), män (förnamn), städer, kommuner, län, huvudstäder, länder, nationaliteter, yrken, myndigheter, massmedier med mera.

Syftet är att samla svenska resurser som är fria att använda, finns i flera öppna standardiserade format (exempelvis CSV och JSON), har en enkel datastruktur som enkelt kan maskinläsas, består av små filer utan onödigt krimskrams och har exempelkod (R och Python) för att snabbt kunna användas.

Materialet utökas och uppdateras kontinuerligt under öppna licenser.
Huvudman, medverkande och finansiering

Forskningshuvudman

Göteborgs universitet

Ansvarig institution/enhet

Institutionen för journalistik, medier och kommunikation (JMG)

Skyddsvärde och etikprövning
Metod och tidsperiod
Geografisk täckning

Geografisk utbredning

Geografisk plats: Sverige

Publikationer

Åtkomst till data via

Hemsida

Dataset
Svensk text

Dataformat / datastruktur

Text

Skapare/primärforskare

Peter Dahlgren - Göteborgs universitet orcid

Upphovsrätt

Särskild upphovsrätt (t.ex. Creative Commons) för respektive material beskrivs på https://github.com/peterdalle/svensktext

Hemsida

CLARIN Virtual Collection Registry

Lägg till den här resursen i en virtuell samling

En virtuell samling är kopplad till ett specifikt forskningsändamål och innehåller länkar till dataresurser i olika digitala arkiv. Samlingen är lätt att skapa, få åtkomst till och citera.

Du kan läsa mer om virtuella samlingar på CLARIN:s webbplats

Publicerad: 2018-12-20
Senast uppdaterad: 2021-11-11