Affordable Access

deepdyve-link
Publisher Website

Recherche improbable d'une homogène diversité : le débat sur l'identité nationale

Authors
  • Ratinaud, Pierre
  • Marchand, Pascal
Publication Date
Jan 01, 2012
Identifiers
DOI: 10.3917/lang.187.0093
OAI: oai:cairn.info:LANG_187_0093
Source
Cairn
Keywords
Language
French
License
Unknown
External links

Abstract

Dans cet article, nous comparons les effets de deux méthodes de correction morphologique d’un corpus issu du web sur des classifications de type ALCESTE avec le logiciel IRAMUTEQ. À partir des 18 240 contributions au débat sur l’identité nationale, nous comparons le corpus initial avec un corpus corrigé manuellement et un corpus corrigé par une méthode semi-automatique reposant sur une utilisation particulière du correcteur Hunspell. Les trois corpus obtenus (initial, automatique et manuel) sont soumis à deux classifications hiérarchiques descendantes : l’une conserve les 1 500 formes pleines les plus fréquentes, l’autre les 3 000 formes pleines les plus fréquentes. La comparaison deux à deux des résultats obtenus sur chacun des corpus montre que la correction automatique que nous proposons permet de se rapprocher significativement d’une correction manuelle.

Report this publication

Statistics

Seen <100 times