Affordable Access

Inicios de una gramática para el español en ALEP, un formalismo de unificació

Authors
Publisher
Sociedad Española para el Procesamiento del Lenguaje Natural

Abstract

sepln09.pdf Una grama´tica de dependencias basada en patrones de etiquetas∗ A Dependency Grammar Based on Patterns of Tags Pablo Gamallo Otero Dept. de L´ıngua Espanhola Univ. de Santiago de Compostela [email protected] Isaac Gonza´lez Sa´nchez Univ. de Santiago de Compostela [email protected] Resumen: Este art´ıculo describe un formalismo gramatical, DepPattern, concebido para escribir grama´ticas de dependencias a partir de patrones de PoS tags enrique- cidos con informacio´n le´xica y morfolo´gica. El formalismo retoma ideas de Sinclair y de la Grama´tica de Patrones. A partir de las grama´ticas escritas con este formalismo, un compilador genera analizadores sinta´cticos robustos basados en expresiones regu- lares para 5 lenguas: espan˜ol, ingle´s, gallego, portugue´s y france´s. Los analizadores as´ı generados identifican dependencias que, posteriormente, servira´n para mejorar aplicaciones de PLN tales como la extraccio´n de informacio´n tesa´urica. Palabras clave: grama´tica de dependencias, ana´lisis sinta´ctico, extraccio´n de in- formacio´n Abstract: This paper describes a grammatical formalism, DepPattern, to write de- pendency grammars using Patterns of PoS tags augmented with lexical and morp- hological information. The formalism inherits ideas from Sinclair’s work and Pattern Grammar. In addition, a compiler was implemented so as to generate robust parsers from DepPattern grammars for 5 languages: Spanish, English, Galician, Portuguese, and French. These parsers identify dependencies which can be used to improve NLP applications such as extration of similar words. Keywords: dependency grammar, parsing, information extraction 1. Introduccio´n En este art´ıculo, presentamos un formalismo basado en reglas, llamado DepPattern, pen- sado para que lingu¨istas puedan escribir fa´cil- mente grama´ticas de dependencias. Este for- malismo viene acompan˜ado de un compilador de grama´ticas que genera analizadores (par- sers) de dependencias robustos para 5 len-

There are no comments yet on this publication. Be the first to share your thoughts.