Un método eficaz de indexación para la recuperación de imágenes en archivos en formato pdf

Mata Vázquez, Jacinto; Crespo Azcárate, Mariano; Maña López, Manuel Jesús

An efficient method of indexing for image retrieval from pdf files

Autoría

Mata Vázquez, Jacinto ; Crespo Azcárate, Mariano; Maña López, Manuel Jesús
Fecha de publicación

2010
Editorial

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)
Cita bibliográfica

Mata Vázquez, J., Crespo Azcárate, M., Maña López, M.J.: "Un método eficaz de indexación para la recuperación de imágenes en archivos en formato pdf". Procesamiento del Lenguaje Natural. Nº 45, págs. 21-29, (2010). ISSN 1135-5948
Resumen

Una de las áreas que más interés está despertando actualmente entre los investigadores y usuarios de sistemas de Recuperación de Información es la recuperación de documentos que contengan imágenes relevantes a una necesidad de información. En este caso, el principal objetivo no es la recuperación de los documentos relevantes a la necesidad de información del usuario sino la obtención de las imágenes relevantes a dicha necesidad. En la actualidad, las colecciones de documentos se pueden encontrar en diversos formatos (html, xml, pdf, etc.). En este artículo presentamos un método eficaz para indexar una colección de documentos en formato pdf para mejorar la recuperación de imágenes contenidas en los documentos. Los experimentos realizados prueban que el método presentado obtiene mejores resultados que si se realizara una indexación del texto completo.

One of the areas which is presently awakening more interest among researchers and users of Information Retrieval systems is the retrieval of documents containing images which are relevant to a need for information. In this case, the main objective is not the retrieval of the documents relevant to the user’s need for information, but the achievement of the images relevant to that need for information. At present, document collections can be found in a variety of formats (html, xml, pdf, etc). In this paper we present an efficient method to index a collection of documents in pdf format to improve the retrieval of images contained in documents. The experiments we carried out prove that the method presented here achieves better results than indexing the full text.
URI

http://hdl.handle.net/10272/11255

Fichero	Tamaño	Formato	Ver	Descripción
Un_metodo_eficaz.pdf	1.018Mb	PDF	Ver/Abrir	versión editor

Fichero	Tamaño	Formato	Ver	Descripción
Un_metodo_eficaz.pdf	1.018Mb	PDF	Ver/Abrir	versión editor

Este ítem aparece en la(s) siguiente(s) colección(ones)

DTI - Artículos

Estadísticas

Ver Estadísticas de uso

Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España

Un método eficaz de indexación para la recuperación de imágenes en archivos en formato pdf

An efficient method of indexing for image retrieval from pdf files

Autoría

Mata Vázquez, Jacinto Autor Universidad de Huelva

; Crespo Azcárate, Mariano; Maña López, Manuel Jesús Autor Universidad de Huelva

Fecha de publicación

2010

Editorial

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)

Cita bibliográfica

Mata Vázquez, J., Crespo Azcárate, M., Maña López, M.J.: "Un método eficaz de indexación para la recuperación de imágenes en archivos en formato pdf". Procesamiento del Lenguaje Natural. Nº 45, págs. 21-29, (2010). ISSN 1135-5948

Resumen

Una de las áreas que más interés está despertando actualmente entre los investigadores y usuarios de sistemas de Recuperación de Información es la recuperación de documentos que contengan imágenes relevantes a una necesidad de información. En este caso, el principal objetivo no es la recuperación de los documentos relevantes a la necesidad de información del usuario sino la obtención de las imágenes relevantes a dicha necesidad. En la actualidad, las colecciones de documentos se pueden encontrar en diversos formatos (html, xml, pdf, etc.). En este artículo presentamos un método eficaz para indexar una colección de documentos en formato pdf para mejorar la recuperación de imágenes contenidas en los documentos. Los experimentos realizados prueban que el método presentado obtiene mejores resultados que si se realizara una indexación del texto completo.

One of the areas which is presently awakening more interest among researchers and users of Information Retrieval systems is the retrieval of documents containing images which are relevant to a need for information. In this case, the main objective is not the retrieval of the documents relevant to the user’s need for information, but the achievement of the images relevant to that need for information. At present, document collections can be found in a variety of formats (html, xml, pdf, etc). In this paper we present an efficient method to index a collection of documents in pdf format to improve the retrieval of images contained in documents. The experiments we carried out prove that the method presented here achieves better results than indexing the full text.

URI

http://hdl.handle.net/10272/11255

Fichero	Tamaño	Formato	Ver	Descripción
Un_metodo_eficaz.pdf	1.018Mb	PDF	Ver/Abrir	versión editor

Fichero	Tamaño	Formato	Ver	Descripción
Un_metodo_eficaz.pdf	1.018Mb	PDF	Ver/Abrir	versión editor

Este ítem aparece en la(s) siguiente(s) colección(ones)

DTI - Artículos