Affordable Access

Un exemple de corpus annoté en diachronie longue : le corpus Democrat, enjeux et exploitations

Authors
  • Glikman, Julie
  • Landragin, Frédéric
  • Todirascu, Amalia
  • Schnedecker, Catherine
Publication Date
Oct 13, 2022
Source
HAL-Descartes
Keywords
Language
French
License
Unknown
External links

Abstract

Le corpus DEMOCRAT, constitué dans le cadre du projet ANR de même nom , dont il constitue l’un des livrables, est un corpus de textes annotés en chaînes de référence. Chaque élément référentiel (un ‘maillon’) est indiqué par un identifiant rapportant à son référent, ce qui permet la création d’une chaîne rassemblant toutes les mentions d’un même référent. En outre, le corpus bénéficie également d’une annotation en partie du discours. Ce corpus a déjà fait l’objet de plusieurs exploitations. À l’occasion de ce colloque, nous souhaitons mettre en avant les défis méthodologiques en jeu lors de la constitution d’un tel corpus. Nous montrerons ainsi que, malgré les difficultés inhérentes à un tel projet, les exploitations du corpus Democrat en diachronie longue permettent d’obtenir des résultats convaincants.

Report this publication

Statistics

Seen <100 times