Affordable Access

Un Modelo Robusto y Eficiente para el Análisis Sintáctico de Lenguajes Naturales mediante Árboles Múltiples Virtuales

Authors
Publisher
Sociedad Española para el Procesamiento del Lenguaje Natural

Abstract

sepln09.pdf Construcción de un sistema PLN usando el framework UIMA ∗ Building a NLP system using the UIMA framework Fermín Cruz, José A. Troyano, Fernando Enríquez, Víctor J. Díaz Dep. de Lenguajes y Sistemas Informáticos Universidad de Sevilla Avda. Reina Mercedes s/n 41012 Sevilla [email protected] Resumen: Este trabajo resume una experiencia de uso de UIMA (Unstructured Information Management Architecture), una plataforma que permite la creación e integración de aplicaciones que procesen información no estructurada como textos en lenguaje natural, audio o vídeo. La característica más importante de UIMA es la interoperabilidad ya que permite la integración de distintas herramientas y recursos. Presentamos un sistema que realiza diversas tareas PLN como el análisis morfosin- táctico, el reconocimiento de entidades o el análisis de dependencias. En este caso, UIMA nos ha permitido integrar de forma muy cómoda cinco herramientas distintas (OpenNLP, TnT, FreeLing, Yamcha y Minipar). Palabras clave: Información no estructurada, multimodalidad, herramienta de de- sarrollo, integración de componentes Abstract: This paper describes our experience in using UIMA (Unstructured Infor- mation Management Architecture), a framework to create and integrate applications to process unstructured information like natural language texts, audio and video. The most important feature of UIMA is its interoperability, allowing the integration of diverse tools and resources. We present a system that performs several NLP tasks like POS tagging, named entity recognition or dependency parsing. In this system, we have been able to easily integrate five different tools with the support of UIMA (OpenNLP, TnT, Freeling, Yamcha and Minipar). Keywords: Unstructured information, multimodality, develpment tool, component integration 1. Introducción El artículo en el que se presentó la arquitec- tura UIMA (Ferrucci, 2004) comienza su ar- gumentación comentando que IBM dispone de un grupo de unas 200 personas a

There are no comments yet on this publication. Be the first to share your thoughts.