Tesis "Desarrollo de una Metodología Computacional para la Captura Automática de Imágenes 4D del Rostro Usando un Escáner 3D"
Alumno: Javier Montenegro Jimenez
Asesor: Dr. Wilfrido Gómez Flores
Sinodales: Dr. José Juan García Hernández, Dr. Yahir Hernández Mier, Dr. Wilfrido Gómez Flores, Dr. Pedro Luis Sánchez Orellana
Este trabajo de investigación tiene como objetivo el desarrollo de una metodología computacional para la generación automática de secuencias 3D del rostro a partir de un escáner 3D. Dicha solución requirió un estudio sistemático para determinar las propiedades de las técnicas que intervienen en el proceso de segmentación, con el fin de incrementar el desempeño y disminuir el tiempo de cómputo de esta tarea. La metodología de solución contempla seis etapas: (i) construcción del entorno de grabación, (ii) adquisición de secuencias 3D, (iii) detección del rostro, (iv) detección de la piel, (v) segmentación automática del rostro y (vi) generación y segmentación de la nube de puntos.
Para cumplir con la primera etapa se describe el diseño y construcción de una cabina de grabación, la cual cuenta con luz LED y fondo homogéneo con el fin de facilitar la detección de la piel. En la etapa dos se realiza la construcción de un módulo de captura. En la tercera etapa se realiza el estudio comparativo de dos de algoritmos ampliamente utilizados para la detección de rostros, Viola-Jones y MB-LBP (Bloque Multi-escala de Patrón Binario Local). En la cuarta etapa, se realiza un análisis estadístico en el que se comparan cinco espacios de color (RGB, YCbCr, HSV, CIE L*a*b y CIE Luv) y dos clasificadores Bayesianos para determinar cuál combinación provee el mejor desempeño de detección de piel. Posteriormente, la etapa cinco se enfoca en la segmentación automática del rostro, realizando un análisis estadístico de varias técnicas de procesamiento de imágenes utilizadas para aumentar el desempeño de la segmentación del rostro. Por último, en la etapa seis, se genera la nube de puntos a partir de la imagen e profundidad y se segmenta por medio de la máscara binaria obtenida de la etapa de segmentación automática. El proceso finaliza con un estudio del desempeño del sistema de segmentación 3D mediante la métrica Normalized Probability Rand Index (NPRI), la cual mide la correspondencia entre la segmentación 3D computarizada del rostro y una referencia determinada manualmente. Este índice debe tender a +1 para indicar un desempeño adecuado. Los resultados muestran que se obtuvo un valor de NPRI=0.950, lo que indica que la segmentación automática se aproxima a la segmentación manual. Por otro lado, el sistema es relativamente rápido, con un tiempo de cómputo de 35.18 ms por cuadro de video.