Boulanger, Hugo Hiebel, Nicolas Ferret, Olivier Fort, Karën Névéol, Aurélie
La génération de texte ouvre des perspectives pour pallier l'absence de corpus librement partageables dans des domaines contraints par la confidentialité, comme le domaine médical. Dans cette étude, nous comparons les performances de modèles encodeurs-décodeurs et décodeurs seuls pour la génération conditionnée de cas cliniques en français. Nous af...
Ducel, Fanny Névéol, Aurélie Fort, Karën
Nous proposons un outil pour mesurer automatiquement les biais de genre dans des textes générés par des grands modèles de langue dans des langues flexionnelles. Nous évaluons sept modèles à l’aide de52 000 textes en français et 2 500 textes en italien, pour la rédaction de lettres de motivation. Notre outil s’appuie sur la détection de marqueurs mo...
Louradour, Jérôme Hunter, Julie Harrando, Ismaïl Shang, Guokan Rennard, Virgile Lorré, Jean-Pierre
Nous présentons la famille de modèles Claire, une collection de modèles de langage conçus pour améliorer les tâches nécessitant la compréhension des conversations parlées, tel que le résumé de réunions. Nos modèles résultent de la poursuite du pré-entraînement de deux modèles de base exclusivement sur des transcriptions de conversations et des pièc...
Richard, D. Valentin Fruchard, Emmanuel Gatien-Baron, Valentin
Published in
SHS Web of Conferences
L’orthographe du français est très complexe, mais il n’y a pas de consensus sur les conséquences à en tirer. Beaucoup de francophones sont très réticents à une réforme radicale de l’orthographe, mais sont plus favorables à simplifier des difficultés spécifiques (Réforme de l’orthographe française - Craintes, attentes et réactions des citoyens, A. D...
Jatteau, Adèle Audibert, Nicolas Adda-Decker, Martine Lamel, Lori Bilinski, Eric
Published in
SHS Web of Conferences
Les mots à « h aspiré » ou « disjonctifs » en français forment un phénomène multifactoriel difficile à décrire : ils sont rares dans le discours, et sont associés à une charge prescriptive qui influence les locuteurs testés en laboratoire. Cette étude propose d’étudier la disjonctivité dans de grands corpus de parole naturelle, à l’aide des outils ...
Houij, Sirine
Published in
SHS Web of Conferences
La présence, dans le lexique du dialecte tunisien – langue parlée par les Tunisiens – d’un nombre important d’emprunts lexicaux issus de la langue française, emprunts qui par ailleurs manifestent différents changements par rapport au modèle de la langue prêteuse, nous a amené à nous interroger sur les différentes stratégies déployées par les locute...
Skandalis, Maximos Moot, Richard Retoré, Christian Robillard, Simon
This paper introduces DACCORD, an original dataset in French for automatic detection of contradictions between sentences. It also presents new, manually translated versions of two datasets, namely the well known dataset RTE3 and the recent dataset GQNLI, from English to French, for the task of natural language inference / recognising textual entail...
Caillouette, Jacques Lapierre, Judith
This article defines community support for social and community housing in Québec as relating to both individual and collective support practices. It analyzes the comments of stakeholders and managers from six group interviews carried out in 2020 and 2021 as part of broader research on the needs and practices for community support in Québec. The hy...
Piron, Léonor MacLeod, Andrea A.N. Maillart, Christelle
10. Reduced inequalities / 3. Good health and well-being
Doumbia, Mahamadou Siaka
La thèse a pour objectif d'analyser le phénomène des reformulations en contexte d'interactions bilingues français-bamanankan dans les classes de l'enseignement fondamental (premier cycle) au Mali. L'étude prend appui sur un corpus de 39h 35min d'enregistrements vidéo et audio constitués de séquences de classes et d'entretiens. Les séquences, filmée...