Affordable Access

Inicios de una gramática para el español en ALEP, un formalismo de unificació

Authors
Publisher
Sociedad Española para el Procesamiento del Lenguaje Natural
Source
Legacy

Abstract

sepln09.pdf Una grama´tica de dependencias basada en patrones de etiquetas∗ A Dependency Grammar Based on Patterns of Tags Pablo Gamallo Otero Dept. de L´ıngua Espanhola Univ. de Santiago de Compostela [email protected] Isaac Gonza´lez Sa´nchez Univ. de Santiago de Compostela [email protected] Resumen: Este art´ıculo describe un formalismo gramatical, DepPattern, concebido para escribir grama´ticas de dependencias a partir de patrones de PoS tags enrique- cidos con informacio´n le´xica y morfolo´gica. El formalismo retoma ideas de Sinclair y de la Grama´tica de Patrones. A partir de las grama´ticas escritas con este formalismo, un compilador genera analizadores sinta´cticos robustos basados en expresiones regu- lares para 5 lenguas: espan˜ol, ingle´s, gallego, portugue´s y france´s. Los analizadores as´ı generados identifican dependencias que, posteriormente, servira´n para mejorar aplicaciones de PLN tales como la extraccio´n de informacio´n tesa´urica. Palabras clave: grama´tica de dependencias, ana´lisis sinta´ctico, extraccio´n de in- formacio´n Abstract: This paper describes a grammatical formalism, DepPattern, to write de- pendency grammars using Patterns of PoS tags augmented with lexical and morp- hological information. The formalism inherits ideas from Sinclair’s work and Pattern Grammar. In addition, a compiler was implemented so as to generate robust parsers from DepPattern grammars for 5 languages: Spanish, English, Galician, Portuguese, and French. These parsers identify dependencies which can be used to improve NLP applications such as extration of similar words. Keywords: dependency grammar, parsing, information extraction 1. Introduccio´n En este art´ıculo, presentamos un formalismo basado en reglas, llamado DepPattern, pen- sado para que lingu¨istas puedan escribir fa´cil- mente grama´ticas de dependencias. Este for- malismo viene acompan˜ado de un compilador de grama´ticas que genera analizadores (par- sers) de dependencias robustos para 5 len-

There are no comments yet on this publication. Be the first to share your thoughts.