Tesis "Selección de modelos en el agrupamiento evolutivo multiobjetivo como un problema de aprendizaje automático"
Sustentante: Aarón Leonardo Sánchez Martínez
Director: Dr. Mario Garza Fabre, Cinvestav Unidad Tamaulipas
Sinodales: Dr. Mario Garza Fabre, Cinvestav Unidad Tamaulipas; Dr. Gregorio Toscano Pulido, Cinvestav Unidad Tamaulipas; Dr. Edwyn Javier Aldana Bobadilla, Conacyt - Cinvestav Unidad Tamaulipas.
Resumen:
El agrupamiento (clustering) es una de las tareas fundamentales para el análisis de datos. Esta tarea consiste en identificar grupos (clusters) que permiten dividir el conjunto de elementos analizados de acuerdo con las similitudes que presentan. Esta tarea es comúnmente planteada como un problema de optimización, donde se busca encontrar aquel agrupamiento que satisface de la mejor manera un criterio de agrupamiento específico. Recientemente, se ha popularizado la idea de plantear esta tarea como un problema multiobjetivo, reconociéndose el hecho de que un único criterio de agrupamiento resulta insuficiente para considerar todas las características que se buscan en una solución. El planteamiento multiobjetivo de este problema, así como el uso de algoritmos evolutivos multiobjetivo para abordarlo, han permitido el diseño de técnicas capaces de producir, en una única ejecución, una aproximación al frente de Pareto (AFP) formada por un conjunto de soluciones compromiso.
Sin embargo, generar esta AFP representa solamente la etapa inicial del agrupamiento evolutivo multiobjetivo (AEMO). La etapa complementaria consiste en seleccionar la solución más prometedora de este conjunto; a esta tarea se le conoce como selección de modelos, o como toma de decisiones en el contexto general de la optimización multiobjetivo. Este proceso de toma de decisiones, que representa la meta final en muchas aplicaciones, ha recibido poca atención en el área de AEMO, y los enfoques de solución existentes exhiben algunas desventajas o limitaciones ante escenarios particulares. Por lo tanto, en este trabajo de tesis se reconoce la importancia de explorar enfoques de solución alternativos y con ello avanzar el estado del arte en este tema.
En particular, en este trabajo se explora, por primera vez (de acuerdo con nuestro conocimiento de la literatura), el planteamiento de la tarea de selección de modelos en el contexto de AEMO como un problema de aprendizaje automático. Más específicamente, se propone un enfoque supervisado, en el que se construye un modelo predictivo de la calidad de las soluciones a partir de un proceso de caracterización de las AFPs y de un conjunto de escenarios de entrenamiento. La meta es que este modelo pueda ser empleado para estimar la calidad de las soluciones candidatas al aplicarse a nuevos escenarios, y de esta manera guiar la selección de las mejores alternativas disponibles.
Con la finalidad de validar la viabilidad y efectividad de esta propuesta, se realizaron una serie de experimentos en los que se evaluó el enfoque propuesto en diferentes escenarios y se analizaron los resultados desde diferentes perspectivas. En estos experimentos se consideró un conjunto diverso de problemas de prueba y se realizaron comparaciones con respecto a una variedad de técnicas representativas de la literatura. Los resultados de nuestros experimentos son prometedores: nuestra propuesta reporta un desempeño competitivo, que en la mayoría de los casos supera los resultados obtenidos por los diferentes enfoques considerados como referencia.