Gold standard for English-Swedish Europarl data (GES)

SND-ID: EXT 0283

Skapare/primärforskare

Lars Ahrenberg - Linköpings universitet, Institutionen för datavetenskap

Maria Holmqvist - Linköpings universitet, Institutionen för datavetenskap

Beskrivning

En referenskorpus för ordlänkning uppdelad på tränings- och testdata. Meningarna är hämtade från Europarl engelska respektive svenska delar.
Huvudman, medverkande och finansiering

Forskningshuvudman

Linköpings universitet

Ansvarig institution/enhet

Institutionen för datavetenskap

Skyddsvärde och etikprövning
Metod och tidsperiod
Språkresurser

Resurstyp

Korpus

Tänkt användning

Språkteknologiskt datorprogram
Geografisk täckning
Publikationer

Maria Holmqvist and Lars Ahrenberg (2011). A Gold Standard for English-Swedish Word Alignment. In Proceedings of the 18th Nordic Conference on Computational Linguistics, Riga, Latvia, May 11-13, 2011.

Om du publicerat något baserat på det här datamaterialet, meddela gärna SND en referens till din(a) publikation(er). Är du ansvarig för katalogposten kan du själv uppdatera metadata/databeskrivningen via DORIS.

Åtkomst till data via

Kontakt

Dataset
Engelsk-svensk guldstandard för ordlänkning (GES)

Beskrivning

Data är skapade från den engelsk-svenska delen av den parallella korpusen Europarl och utgörs, för varje meningspar, av par av tokenidentifierare på formen n-m där n och m är heltal.

Dataformat / datastruktur

Numeriska

Text

Skapare/primärforskare

Lars Ahrenberg - Linköpings universitet, Institutionen för datavetenskap

Maria Holmqvist - Linköpings universitet, Institutionen för datavetenskap

Licens

Creative Commons  Erkännande 4.0 Internationell (CC BY 4.0)

Kontakt för frågor om data

CLARIN Virtual Collection Registry

Lägg till den här resursen i en virtuell samling

En virtuell samling är kopplad till ett specifikt forskningsändamål och innehåller länkar till dataresurser i olika digitala arkiv. Samlingen är lätt att skapa, få åtkomst till och citera.

Du kan läsa mer om virtuella samlingar på CLARIN:s webbplats