Affordable Access

UK National Programmers in Natural Language Research

Authors
Publisher
Sociedad Española para el Procesamiento del Lenguaje Natural

Abstract

sepln09.pdf On the Relevance of Search Space Reduction in Automatic Plagiarism Detection ∗ Sobre la importancia de la reduccio´n del espacio de bu´squeda en la deteccio´n automa´tica de plagio Alberto Barro´n-Ceden˜o and Paolo Rosso Natural Language Engineering Lab. - ELiRF Dpto. Sistemas Informa´ticos y Computacio´n Universidad Polite´cnica de Valencia DSIC, edificio 1F Campus de Vera Camino de Vera s/n, 46022 Valencia, Spain [lbarron | prosso]@dsic.upv.es Resumen: En la deteccio´n automa´tica de plagio con referencia, los fragmentos de texto de un documento sospechoso son buscados de manera exhaustiva en un conjunto de documentos originales (de referencia) con el objetivo de determinar si han sido plagiados o no. Uno de los factores ma´s importantes para el e´xito de este tipo de aplicaciones es el taman˜o del corpus de referencia el cual, al mismo tiempo, puede representar un problema al considerar el desempen˜o y la precisio´n. En este art´ıculo, abordamos la deteccio´n automa´tica de plagio con referencia analizando el impacto de una etapa previa de reduccio´n del espacio de bu´squeda (conformado por los documentos originales en el corpus de referencia). Nuestros experimentos sobre el corpus METER muestran una mejora en la Precisio´n y Cobertura de los resultados obtenidos cuando la reduccio´n del espacio de bu´squeda es realizada al principio del proceso de deteccio´n de plagio. Palabras clave: deteccio´n de plagio, reduccio´n del espacio de bu´squeda, similitud de texto Abstract: In automatic plagiarism detection with reference, the text fragments in a suspicious document are exhaustively searched in a set of original (reference) documents in order to determine whether they have been plagiarised or not. One of the most important factors for the success of this kind of applications is the size of the reference corpus that, at the same time, may represent a problem when we con- sider performance and precision. In this paper, we approach automatic plagiarism detection

There are no comments yet on this publication. Be the first to share your thoughts.

Statistics

Seen <100 times
0 Comments

More articles like this

What non-programmers know about programming: Natur...

on International Journal of Man-M... Jan 01, 1985

Evaluating UK research in speech and language ther...

on International journal of langu... 2003

The UK National Institute for Health Research.

on European heart journal August 2012
More articles like this..