Swedish Treebank

Skapare/primärforskare:

Joakim Nivre - Uppsala universitet

Beáta Megyesi - Uppsala universitet

Bengt Dahlqvist - Uppsala universitet

Anna Sågvall Hein - Uppsala universitet, Institutionen för lingvistik och filologi

Johan Hall - Uppsala universitet

Jens Nilsson - Växjö universitet

Sofia Gustafson-Capková - Stockholms universitet orcid

Beskrivning:

Swedish Treebank är en syntaktiskt annoterad korpus. Annoteringen innebär ord- och meningsgränser, morfologisk information (ordklass m.m.), samt syntaktisk information (fraser och grammatiska funktioner, dependensstruktur). Swedish Treebank bygger på två redan befintliga korpusar, Talbanken och SUC, som har blivit harmoniserade. Swedish Treebank består av drygt 350.000 tokens.

Ansvarig institution/enhet:

Uppsala universitet, Institutionen för lingvistik och filologi

Skapare/primärforskare:

Joakim Nivre - Uppsala universitet

Beáta Megyesi - Uppsala universitet

Bengt Dahlqvist - Uppsala universitet

Anna Sågvall Hein - Uppsala universitet, Institutionen för lingvistik och filologi

Johan Hall - Uppsala universitet

Jens Nilsson - Växjö universitet

Sofia Gustafson-Capková - Stockholms universitet orcid

Medverkande:

Filip Salomonsson - SolarWinds, Pingdom

Identifierare:

SND-ID: EXT 0368

Beskrivning:

Swedish Treebank är en syntaktiskt annoterad korpus. Annoteringen innebär ord- och meningsgränser, morfologisk information (ordklass m.m.), samt syntaktisk information (fraser och grammatiska funktioner, dependensstruktur). Swedish Treebank bygger på två redan befintliga korpusar, Talbanken och SUC, som har blivit harmoniserade. Swedish Treebank består av drygt 350.000 tokens.

Språk:

Svenska

Geografisk utbredning:

Geografisk plats: Sverige

Språkresurser

Resurstyp

Korpus

Kontakt för frågor om data:

Eva Pettersson

Swedish Treebank

Beskrivning:

Swedish Treebank är en syntaktiskt annoterad korpus. Annoteringen innebär ord- och meningsgränser, morfologisk information (ordklass m.m.), samt syntaktisk information (fraser och grammatiska funktioner, dependensstruktur). Swedish Treebank bygger på två redan befintliga korpusar, Talbanken och SUC, som har blivit harmoniserade. Swedish Treebank består av drygt 350.000 tokens.

Dataformat / datastruktur:

Text

Publicerad: 2020-10-14