Tesis "Método de agrupamiento basado en funciones kernel dirigido por índices de validez"
Sustentante: Iván Daniel Méndez Álvarez.
Directores: Dr. Edwyn Javier Aldana Bobadilla y Dr. Iván López Arévalo, investigadores Cinvestav Tamaulipas.
Sinodales: Dr. José Luis González Compeán, Cinvestav Unidad Tamaulipas;Dr. Alejandro Molina Villegas, Centro Geo.
Resumen:
La agrupación es una tarea fundamental en el análisis de datos que permite agrupar objetos que comparten propiedades en común con base en un criterio de similitud. A pesar de que existen métodos que determinan particiones de un conjunto de datos, un problema latente en tareas de agrupamiento es poder representar el tipo de estructura que presentan los conjuntos de datos. Estructuras de grupos no linealmente separables son especialmente difíciles de representar por métodos de agrupamiento tradicionales. En esta tesis se propone un método de agrupamiento de datos que puede tratar con estructuras de grupos no linealmente separables a través de la transformación del espacio del conjunto de datos original mediante una función kernel y la incorporación de un índice de validez basado en densidad como criterio de calidad. El agrupamiento se propone como un problema de optimización combinatorio en el que una meta-heurística busca la mejor partición con base en una función objetivo en términos de un índice de validez. La finalidad de la meta-heurística es encontrar los parámetros de las funciones kernel que inducen un agrupamiento que maximiza dicho criterio de calidad. Los resultados muestran que la combinación de los enfoques de densidad y las funciones kernel mejoran los resultados de agrupamiento.