Affordable Access

[email protected]: Sistema de Recuperación y Extracción de Información Notarial.

Authors
Publisher
Sociedad Española para el Procesamiento del Lenguaje Natural
Publication Date

Abstract

[email protected]: Sistema de Recuperacio´n y Extraccio´n de Informacio´n Notarial Rafael Mun˜oz, Fernando Llopis, Ruben Izquierdo y M. Carmen Bellido Grupo de Procesamiento del Lenguaje y Sistemas de Informacio´n Universidad de Alicante Carretera San Vicente del Raspeig s/n - 03690 San Vicente del Raspeig - Alicante {rafael,[email protected] Resumen: El sistema [email protected] realiza tareas de recuperacio´n y extraccio´n de in- formacio´n. Las tareas de extraccio´n de informacio´n se realizan en el dominio notarial y ma´s concretamente en la de las escrituras de compraventa. El sistema selecciona los documentos relacionados con escrituras de compraventa de una coleccio´n de tex- tos heteroge´nea y posteriormente aplica las te´cnicas de extraccio´n de informacio´n para identificar la informacio´n relevante. Palabras clave: Recuperacio´n de informacio´n, extraccio´n de informacio´n, re- conocimiento de entidades Abstract: [email protected] system solves information retrieval and information extrac- tion tasks. The information extraction tasks have been developed in deed domain. The system selects a subset of document related to deed documents. After thats, the information extraction techniques selects the relevant information. Keywords: Information retrieval, information extraction, named entity recognition 1. Introduccio´n En general, la acumulacio´n de documentos en formato electro´nico es un pra´ctica habit- ual en la Sociedad de la Informacio´n actual y en particular en los a´mbitos empresariales. Por tanto, la utilizacio´n de herramientas que manejen grandes volu´menes de informacio´n se hace necesaria. En este trabajo se presen- ta un sistema que integra dos herramientas, la primera de ellas es un sistema de recu- peracio´n de informacio´n que ayuda a discrim- inar entre los documentos relevantes y los no relevantes a la consulta realizada por un usuario, y la segunda es un sistema de extrac- cio´n de informacio´n que identifica la informa- cio´n que se considera relevante dentro de los documentos

There are no comments yet on this publication. Be the first to share your thoughts.