Tesis "Obtención de axiomas en el aprendizaje de ontologías"
Alumno: Ana Bertha Ríos Alvarado
Asesor: Dr. Iván López Arévalo
Sinodales: Dra. Maricela Claudia Bravo Contreras, Dra. Xiaoou Li Zhang, Dra. Sonia G. Mendoza Chapa, Dr. José Guadalupe Rodríguez García, Dr. Iván López Arévalo
Los recursos textuales no-estructurados, es decir, sin metadatos, asociados, constituyen una fuente de conocimiento importante, su crecimiento dentro de la Web e incluso dentro de organizaciones ha hecho necesario contar con mecanismos eficientes para el acceso y reutilización de tales recursos. Es por ello que la representación del conocimiento a través de una estructura conceptual como una ontología se ha vuelto un elemento clave para la gestión de tal información.
Diferentes propuestas de metodologías han sido diseñadas para construir ontologías, pero éstas logran construir ontologías carentes de expresividad. El nivel de expresividad dado por axiomas se vuelve un elemento clave para el aprovechamiento de la ontología como modelo de representación del conocimiento.
En esta tesis se presenta un trabajo de investigación para la generación de ontologías que incluyan axiomas de clases e instancias de manera no supervisada a partir de recursos textuales en idioma Inglés. La metodología propuesta requiere la integración de diversas técnicas que incluyan procesamiento del lenguaje natural para la obtención de un vocabulario representativo de la colección de documentos, un algoritmo de agrupamiento para la identificación de temas, así como búsqueda web para la obtención de relaciones taxonómicas (hiperónimos/hipónimos) y reconocimiento de entidades nombradas para la identificación de axiomas a partir del texto.
El uso e integración de tales técnicas hace posible obtener ontologías que incluyen conceptos del dominio, relaciones jerárquicas y axiomas del tipo instanceOf, sameIndividualAs, subClassOf, disjointWith y equivalentClass definidos entre las clases e individuos de la ontología. La evaluación general de la metodología propuesta sigue las métricas de evaluación basada en una ontología de referencia llamada gold standard. La calidad de las ontologías construidas se evalúa comparando las ontologías construidas manualmente contra las generadas en los dominios de Turismo, Biología, Deportes y Java. Los resultados obtenidos muestran una buena calidad en las ontologías generadas. Tales ontologías generadas incluyen un mayor nivel de expresividad, útil en el desarrollo de aplicaciones inteligentes.