Tesis "Estudio Comparativo de Técnicas de Selección de Características para la Clasificación de Lesiones de Mama en Ultrasonografía"
Alumno: Cristhian Muñoz Meza
Asesores: Dr. Wilfrido Gómez Flores
Sinodales: Dr. Wilfrido Gómez Flores, Dr. Iván López Arévalo, Dr. César Torres Huitzil
En este trabajo se propone una metodología para la selección de características en la clasificación de lesiones de mama en ultrasonografía (USM) basada en un estudio comparativo entre las técnicas de análisis de componentes principales (PCA) e información mutua (MI). Para ello se implementaron diversas técnicas de descripción morfológica y de textura propuestas en la literatura especializada, a partir de las cuales se construyeron tres espacios de características M-dimensionales: morfología (M=22), textura (M=502) y una combinación de ambos (M=524). Cada uno de estos conjuntos fue normalizado en el rango [-1,1] y, posteriormente, las características fueron ordenadas de acuerdo a su relevancia mediante las técnicas de PCA y MI.
Para cada espacio M-dimensional se determinó el mejor subconjunto de características mediante la minimización del error bootstrap.632+ en un proceso de clasificación incremental, es decir, agregando una a una cada característica ordenada hasta que se haya considerado el conjunto completo. Una vez determinado el conjunto reducido de características para cada espacio probado, se evaluó el desempeño de cada uno de ellos mediante la métrica de área bajo la curva ROC (Az). Posteriormente, se realizó la prueba de Shapiro-Wilk (α = 0.05) para determinar la normalidad de los datos, donde se observó que algunos grupos presentaron distribución asimétrica, por lo que se optó utilizar estadísticos robustos como la mediana (MD) y el estimador Qn.
Finalmente, se comparó la capacidad de discriminación del conjunto de características completo, con M atributos, y los subconjuntos determinados por PCA y MI, con m atributos (donde m < M) mediante la prueba estadística de Kruskal-Wallis (α = 0.05). Para las características de textura se mejoró la mediana de Az de 0.588 para el conjunto completo (M=502) a 0.840 para PCA (m=65) y 0.820 para MI (m=24), de igual manera para los conjuntos combinados se mejoró el desempeño de 0.657 para el conjunto completo (M=524) a 0.941 para PCA (m=69) y 0.951 para MI (m=13). Por otro lado para las características morfológicas se mantuvo la mediana de Az de 0.948 (M=22) a 0.946 para PCA (m=13) y 0.943 para MI (m=3).