Affordable Access

Dependency Parsing of Code-Switching Data with Cross-Lingual Feature Representations

Authors
  • Partanen, Niko
  • Lim, KyungTae
  • Rießler, Michael
  • Poibeau, Thierry
Publication Date
Aug 01, 2018
Source
Kaleidoscope Open Archive
Keywords
Language
English
License
Unknown
External links

Abstract

This paper describes the test of a dependency parsing method which is based on bidirectional LSTM feature representations and multilingual word embedding, and evaluates the results on mono-and multilingual data. The results are similar in all cases, with a slightly better results achieved using multilingual data. The languages under investigation are Komi-Zyrian and Russian. Examination of the results by relation type shows that some language specific constructions are correctly recognized even when they appear in naturally occurring code-switching data. Tiivistelmä Tutkimus arvioi dependenssianalyysin menetelmää, joka perustuu kaksisuun-taiseen LSTM-piirrerepresentaatioon ja monikieliseen 'word embedding'-malliin, sekä arvioi tuloksia yksi-ja monikielisissä aineistoissa. Tulokset ovat samanta-paisia, mutta hieman korkeampia moni-kuin yksikielisissä aineistoissa. Tutkitut kielet ovat komisyrjääni ja venäjä. Tulosten yksityiskohtaisempi analyysi riippu-vuuksien mukaan osoittaa, että tietyt kielikohtaiset suhteet on tunnistettu oikein jopa niiden esiintyessä luonnollisissa koodinvaihtoa sisältävissä lauseissa. This work is licensed under a Creative Commons Attribution 4.0 International Licence. Licence details:

Report this publication

Statistics

Seen <100 times