Dahlgren, Peter
Peter
Dahlgren
0000-0002-3509-3329
University of Gothenburg
Swedish text
Svensk text
University of Gothenburg
2018
politics
politik
languages
språk
nationality
nationalitet
Occupations
Yrken
Cities
Städer
Geography
Geografi
Names
Namn
Natural Language Processing
Datorhantering av naturligt språk
Programming Languages
Programmeringsspråk
Socioeconomic Factors
Socioekonomiska faktorer
Environment
Miljö
language
språkliga uttryck
Artificial Intelligence
Artificiell intelligens
Geographic Locations
Geografiska namn
Terminology as Topic
Terminologi som ämne
Software
Mjukvara
Earth Sciences
Geovetenskaper
Environment and Public Health
Miljö och folkhälsa
Population Characteristics
Befolkningskarakteristika
Algorithms
Algoritmer
Computing Methodologies
Dataanalys
Linguistics
Språkvetenskap
Natural Science Disciplines
Naturvetenskaper
Ecological and Environmental Phenomena
Fenomen inom ekologi och miljö
Sociological Factors
Sociologiska faktorer
Information Science
Informationsvetenskap
Sociology
Sociologi
Biological Phenomena
Biologiska fenomen
Language
Språk
Mathematical Concepts
Matematiska begrepp
Social Sciences
Samhällsvetenskap
Communication
Kommunikation
Behavior
Beteende
Behavioral Sciences
Beteendevetenskap
Behavior and Behavior Mechanisms
Beteende och beteendemekanismer
Behavioral Disciplines and Activities
Beteendevetenskapliga discipliner och aktiviteter
Language Technology (Computational Linguistics)
Språkteknologi (språkvetenskaplig databehandling)
Computer and Information Science
Data- och informationsvetenskap (Datateknik)
Natural Sciences
Naturvetenskap
2018-12-20
1
Copyright: Special copyright (eg Creative Commons) for each material is described at https://github.com/peterdalle/svensktext
Upphovsrätt: Särskild upphovsrätt (t.ex. Creative Commons) för respektive material beskrivs på https://github.com/peterdalle/svensktext
Swedish text resources (e.g., names of men, women, cities, municipalities, Swedish government agencies) for simple and efficient computer processing.
Samling med språkresurser på svenska speciellt anpassat för att snabbt och enkelt kunna läsas in av programspråk som Python, R eller dylikt. Bland språkresurserna finns namn på kvinnor (förnamn), män (förnamn), städer, kommuner, län, huvudstäder, länder, nationaliteter, yrken, myndigheter, massmedier med mera.
Syftet är att samla svenska resurser som är fria att använda, finns i flera öppna standardiserade format (exempelvis CSV och JSON), har en enkel datastruktur som enkelt kan maskinläsas, består av små filer utan onödigt krimskrams och har exempelkod (R och Python) för att snabbt kunna användas.
Materialet utökas och uppdateras kontinuerligt under öppna licenser.
Sweden