Optimización de búsquedas en grandes conjuntos de datos mediante la utilización de algoritmos de clustering con preservación de la topología

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/28507
Información del item - Informació de l'item - Item information
Título: Optimización de búsquedas en grandes conjuntos de datos mediante la utilización de algoritmos de clustering con preservación de la topología
Autor/es: Quintana Pacheco, Yuri
Director de la investigación: Ruiz Fernández, Daniel
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Tecnología Informática y Computación
Palabras clave: Búsquedas en grandes conjuntos de datos | Optimización | Grafos | Clustering
Área/s de conocimiento: Arquitectura y Tecnología de Computadores
Fecha de creación: 2013
Fecha de publicación: 2013
Fecha de lectura: 25-feb-2013
Editor: Universidad de Alicante
Resumen: En la presente investigación se propone un método para realizar búsquedas en grandes conjuntos de datos con características similares a los grafos. El método está dividido en dos etapas: una etapa de organización del conjunto de datos y una etapa donde se puede realizar la búsqueda de elementos que minimicen una función objetivo según el modelo organizativo obtenido. Para la organización del conjunto de datos se propone el empleo del algoritmo growing neural gas, al que se le han incorporado modificaciones que facilitan su empleo en el contexto de la investigación. El método de grafos embebidos en espacios vectoriales se utiliza para obtener representaciones de los elementos del conjunto de datos apropiadas para la aplicación del algoritmo de clustering. Como resultado del proceso de organización cada elemento del conjunto de datos es asociado a un nodo del modelo obtenido de la aplicación del algoritmo de clustering. Para la etapa de búsqueda se propone un algoritmo basado en la heurística simulated annealing. El algoritmo realiza estimaciones de la calidad de los elementos asociados a cada nodo del modelo mediante evaluaciones de la función objetivo que realiza mientras se recorre el modelo. Estas estimaciones son empleadas para orientar la búsqueda. El funcionamiento de cada etapa de la propuesta de solución es validada de forma empírica mediante el empleo de conjuntos de datos y funciones objetivo seleccionados con este fin. Los resultados de la aplicación del método general propuesto muestran que la obtención de soluciones requiere la evaluación de un pequeño porcentaje de los elementos del conjunto de datos, de modo que se reducen los tiempos asociados al proceso de búsqueda.
URI: http://hdl.handle.net/10045/28507
Idioma: spa
Tipo: info:eu-repo/semantics/doctoralThesis
Aparece en las colecciones:Tesis doctorales

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailTesis_Quintana_Pacheco.pdf5,6 MBAdobe PDFAbrir Vista previa


Este ítem está licenciado bajo Licencia Creative Commons Creative Commons