The Uppsala Russian Corpus

SND-ID: EXT 0071

Beskrivning Data och dokumentation

Skapare/primärforskare

Lennart Lönngren - Universitetet i Tromsö, Institutionen för språkvetenskap

Uppsala universitet, Institutionen för moderna språk

Beskrivning

Uppsalakorpusen består av runt 600 ryskspråkiga texter med sammanlagt en miljon ord (token), jämnt fördelade på informativ och skönlitterär prosa. De informativa texterna är skrivna 1985-1989 medan de skönlitterära texterna, vars vokabulär inte föråldras lika snabbt, hänför sig till en längre tidsperiod, från 1960-1988. Korpusen omfattar inte poesi eller drama.

Ett omfattande arbete har lagts på att säkerställa att korpusen blir så representativ och varierad som möjligt inom de givna ramarna. De informativa texterna är hämtade från 25 olika ämnesområden: ekonomi, utrikes nyheter/utrikespolitik, ideologi/inrikespolitik, partiangelägenheter, det sovjetiska samhället, sociala frågor, försvar, utbildning, lagstiftning, historia, kultur, lingvistik, medicin/hälsovård, psykologi, miljö/ekologi, jordbruk, ingenjörskonst, informationsteknologi, rymdforskning, energi, biologi, geologi/geografi, fysik, kemi och idrott. Vissa områden som ansågs vara viktigare representeras av en större textmängd.

Den skönlitterära hälften av korpusen omfattar verk av följande 40 författare: Abramov, Ajtmatov, Astaf'ev

... Visa mer..
Huvudman, medverkande och finansiering
Skyddsvärde och etikprövning

Data innefattar personuppgifter

Nej

Metod
Språkresurser

Resurstyp

Korpus
Geografisk täckning
Ämnesområde och nyckelord

Ämnesområde

Språk och lingvistik (CESSDA Topic Classification)
Språk och litteratur (Standard för svensk indelning av forskningsämnen 2011)

Nyckelord

korpus, ryska

Publikationer

Lönngren, Lennart (ed.), 1993. Частотный словарь современногo русского языка. [Chastotnyj slovar' sovremennogo russkogo jazyka.] (A Frequency Dictionary of Modern Russian. With a Summary in English.) Acta Universitatis Upsaliensis, Studia Slavica Upsaliensia 32. 188 pp. Uppsala
ISBN: 91-554-3134-8

Om du publicerat något baserat på det här datamaterialet, meddela gärna SND en referens till din(a) publikation(er). Är du ansvarig för katalogposten kan du själv uppdatera metadata/databeskrivningen via DORIS.

Åtkomst till data via

Dataset
The Uppsala Russian Corpus

Dataformat / datastruktur

Text

Skapare/primärforskare

Uppsala universitet, Institutionen för moderna språk

Tidsperiod(er) som undersökts

1960–1988

1985–1989

Publicerad: 2020-11-25