Un exemple de corpus annoté en diachronie longue : le corpus Democrat, enjeux et exploitations
- Authors
- Publication Date
- Oct 13, 2022
- Source
- HAL-Descartes
- Keywords
- Language
- French
- License
- Unknown
- External links
Abstract
Le corpus DEMOCRAT, constitué dans le cadre du projet ANR de même nom , dont il constitue l’un des livrables, est un corpus de textes annotés en chaînes de référence. Chaque élément référentiel (un ‘maillon’) est indiqué par un identifiant rapportant à son référent, ce qui permet la création d’une chaîne rassemblant toutes les mentions d’un même référent. En outre, le corpus bénéficie également d’une annotation en partie du discours. Ce corpus a déjà fait l’objet de plusieurs exploitations. À l’occasion de ce colloque, nous souhaitons mettre en avant les défis méthodologiques en jeu lors de la constitution d’un tel corpus. Nous montrerons ainsi que, malgré les difficultés inhérentes à un tel projet, les exploitations du corpus Democrat en diachronie longue permettent d’obtenir des résultats convaincants.