Hansen, Damien
Cet atelier interactif donnera l'occasion aux participants et participantes de se familiariser avec l'entraînement d'un système de traduction neuronal, en parcourant un cahier d'exercices illustrant sa mise au point de bout en bout. Cet exercice de groupe permettra non seulement de voir concrètement comment fonctionnent ces outils en pratique et d'...
Langbach, Valérie Divoux, Anouchka
International audience
Gaillat, Thomas Mallart, Cyrielle Simpkin, Andrew J. Venant, Rémi Ballier, Nicolas Li, Jen-Yu Stearns, Bernardo
Modern approaches to quantitative linguistics rely on large datasets. These datasets are representations of linguistic observations made up of features of various dimensions. Analyses rely on these data representations. As a result, the question of their construction is essential. In the case of quantitative research methods, datasets are built ato...
Zhang, Jingwei Ma, Huijia
Published in
Global Chinese
近年来香港地区粤式中文的使用呈上升趋势。澳门和香港一样都是多言多语的社会, 有特殊的语言政策, 粤语是两地社会流通的强势口语, 因此有必要监测澳门粤式中文的使用状况。 本文自建澳门粤式中文的即时消息语料库和报纸标题语料库。即时消息语料库由三个年龄段的31名澳门本地居民近一个月与常用联系人的即时信息组成; 报纸标题库由澳门10家中文报纸2015至2019年本地新闻及娱乐新闻版块的新闻标题样本组成。统计结果发现, 粤式中文在澳门的使用也呈上升趋势, 是一项正在进行中的变化。年龄、身份认同和语体对粤式中文的使用影响显著。越年轻、本地认同越强的澳门居民使用粤式中文的比例越高。即时消息中使用粤式中文的比例高于报纸标题。娱乐新闻版块中使用粤式中文的比例高于本地新闻。比较港澳两地粤式中文的使用, 两地都是...
Maës, Eliot Legou, Thierry Becerra-Bonache, Leonor Blache, Philippe
La quantité croissante de corpus multimodaux collectés permet de développer de nouvelles méthodes d’analyse de la conversation. Dans la très grande majorité des cas, ces corpus ne comprennent cependant que les enregistrements audio et vidéo, laissant de côté d’autres modalités plus difficiles à récupérer mais apportant un point de vue complémentair...
Gerald, Thomas Tamames, Louis Ettayeb, Sofiane Paroubek, Patrick Vilnat, Anne
Dans cet article nous présentons un nouveau corpus de question-réponse en français pour le domaine de l'éducation. Ce corpus à été construit dans le but de créer un système d'assistant virtuel pour répondre à des questions sur des documents ou du matériel de cours. Afin d'être utile autant aux enseignants qu'au étudiants, il est important de consid...
Decker, Amandine Amblard, Maxime
La structure thématique d'une conversation représente la manière dont l'interaction est organisée à un niveau plus global que le strict enchaînement des interventions. Elle permet de comprendre comment la cohérence est maintenue sur le temps de l'échange. La création d'une mesure de similarité thématique qui donne un score de similarité à deux énon...
Guembour, Sami Dong, Chuanming Dominguès, Catherine
Ce résumé présente le travail de recherche détaillé dans l’article (Guembour et al., 2023). Ce travail s’intègre au projet PARoles de VIlleS (PARVIS, https://parvis.hypotheses.org/) ; il se concentre sur la caractérisation de la ville du futur dans un corpus de romans de science-fiction et de fictions climatiques constitué par l’équipe PARVIS, en u...
Cardon, Rémi Tran Hanh Pham, Trang Zakhia Doueihi, Julien François, Thomas
Ce travail étudie la contribution de la structure de tours à l'identification automatique de genres textuels. Ce concept − bien connu dansle domaine de l'analyse de genre − semble être peu exploité dans l'identification automatique du genre. Nous décrivons la collecte d'un corpus de sites web francophones relevant du domaine du tourisme et le proce...
Magnani, Eliana