Swedish Treebank

Skapare/primärforskare

Joakim Nivre - Uppsala universitet

Beáta Megyesi - Uppsala universitet

Bengt Dahlqvist - Uppsala universitet

Anna Sågvall Hein - Uppsala universitet, Institutionen för lingvistik och filologi

Johan Hall - Uppsala universitet

Jens Nilsson - Växjö universitet

Sofia Gustafson-Capková - Stockholms universitet orcid

Beskrivning

Swedish Treebank är en syntaktiskt annoterad korpus. Annoteringen innebär ord- och meningsgränser, morfologisk information (ordklass m.m.), samt syntaktisk information (fraser och grammatiska funktioner, dependensstruktur). Swedish Treebank bygger på två redan befintliga korpusar, Talbanken och SUC, som har blivit harmoniserade. Swedish Treebank består av drygt 350.000 tokens.

Ansvarig institution/enhet

Uppsala universitet, Institutionen för lingvistik och filologi

Skapare/primärforskare

Joakim Nivre - Uppsala universitet

Beáta Megyesi - Uppsala universitet

Bengt Dahlqvist - Uppsala universitet

Anna Sågvall Hein - Uppsala universitet, Institutionen för lingvistik och filologi

Johan Hall - Uppsala universitet

Jens Nilsson - Växjö universitet

Sofia Gustafson-Capková - Stockholms universitet orcid

Medverkande

Filip Salomonsson - SolarWinds, Pingdom

Identifierare

SND-ID: EXT 0368

Beskrivning

Swedish Treebank är en syntaktiskt annoterad korpus. Annoteringen innebär ord- och meningsgränser, morfologisk information (ordklass m.m.), samt syntaktisk information (fraser och grammatiska funktioner, dependensstruktur). Swedish Treebank bygger på två redan befintliga korpusar, Talbanken och SUC, som har blivit harmoniserade. Swedish Treebank består av drygt 350.000 tokens.

Språk

Svenska

Geografisk utbredning

Geografisk plats: Sverige

Språkresurser

Resurstyp

Korpus

Kontakt för frågor om data

Eva Pettersson

Swedish Treebank

Beskrivning

Swedish Treebank är en syntaktiskt annoterad korpus. Annoteringen innebär ord- och meningsgränser, morfologisk information (ordklass m.m.), samt syntaktisk information (fraser och grammatiska funktioner, dependensstruktur). Swedish Treebank bygger på två redan befintliga korpusar, Talbanken och SUC, som har blivit harmoniserade. Swedish Treebank består av drygt 350.000 tokens.

Dataformat / datastruktur

Text

Publicerad: 2020-10-14