Gold standard for English-Swedish Europarl data (GES)

Skapare/primärforskare:

Lars Ahrenberg - Linköpings universitet, Institutionen för datavetenskap

Maria Holmqvist - Linköpings universitet, Institutionen för datavetenskap

Beskrivning:

En referenskorpus för ordlänkning uppdelad på tränings- och testdata. Meningarna är hämtade från Europarl engelska respektive svenska delar.

Skapare/primärforskare:

Lars Ahrenberg - Linköpings universitet, Institutionen för datavetenskap

Maria Holmqvist - Linköpings universitet, Institutionen för datavetenskap

Identifierare:

SND-ID: EXT 0283

Beskrivning:

En referenskorpus för ordlänkning uppdelad på tränings- och testdata. Meningarna är hämtade från Europarl engelska respektive svenska delar.

Språkresurser

Resurstyp

Korpus

Tänkt användning

Språkteknologiskt datorprogram

Text corpus

  • Antal språk

    Tvåspråkig
  • Språk

    • Engelska (eng)

    • Svenska (swe)

      Meningar: 1164

    Mer..
  • Modalitet

    Skriftspråk
  • Size

    Meningar: 1164

  • Uppmärkning

    • Länkning

      Manuell uppmärkning

Kontaktperson för frågor om data:

Lars Ahrenberg

Publikationer

Sortera på namn | Sortera efter år

Maria Holmqvist and Lars Ahrenberg (2011). A Gold Standard for English-Swedish Word Alignment. In Proceedings of the 18th Nordic Conference on Computational Linguistics, Riga, Latvia, May 11-13, 2011.

Om du publicerat något baserat på det här datamaterialet, meddela gärna SND en referens till din(a) publikation(er).

Licens:

Creative Commons License

Engelsk-svensk guldstandard för ordlänkning (GES)

Beskrivning:

Data är skapade från den engelsk-svenska delen av den parallella korpusen Europarl och utgörs, för varje meningspar, av par av tokenidentifierare på formen n-m där n och m är heltal.

Dataformat / datastruktur:

Numeriska

Text