Tesis "Método de orquestación para servicios de fusión de datos definidos por variables espacio-temporales"
Sustentante: José Carlos Morín García
Directores: Dr. José Luis González Compeán, Cinvestav Unidad Tamaulipas; Dr. Iván López Arévalo, Cinvestav Unidad Tamaulipas.
Sinodales: Dr. Iván López Arévalo, Cinvestav Unidad Tamaulipas; Dr. Hiram Galeana Zapién, Cinvestav Unidad Tamaulipas; Dr. José Luis González Compeán, Cinvestav Unidad Tamaulipas; José Juan García Hernández, Cinvestav Unidad Tamaulipas.
Resumen:
En diversos dominios de la vida cotidiana los procesos de toma de decisiones se basan en información obtenida a partir de cúmulos de datos. No obstante, debido al incremento que han mostrado en últimos años estos cúmulos en un mismo dominio, desde la perspectiva de cómputo en la nube, recientemente se han incorporado servicios de fusión de datos para conformar conjuntos de datos que integren una o más fuentes de datos estructuradas. Esto se hace con el objetivo de tener en un mismo lugar todas las variables y valores de un problema, y así conservar la idea integrada de las fuentes en la toma de decisiones. Desde la perspectiva tecnológica, en cómputo en la nube, la creación de un servicio de fusión de datos no es una tarea fácil porque estos servicios, generalmente, están asociados a las restricciones del proveedor de servicios, lo que genera una dependencia usuario-proveedor, ya que el usuario sólo puede usar lo que el proveedor le proporcione. Asimismo, los servicios de fusión de datos dependen del método de orquestación de datos del proveedor, lo que genera una dependencia fusión-orquestación, ya que el usuario debe aceptar el método de orquestación proporcionado por el proveedor.
En este trabajo de investigación se propone, en el dominio de cómputo en la nube, un método de orquestación para servicios de fusión de datos. Este método incluye un esquema para el despliegue y acoplamiento de servicios. Estos servicios son agnósticos a la infraestructura y que pueden ser enlazados con otros servicios distintos desplegados dentro de una misma nube o fuera de ésta reduciendo la dependencia usuario-proveedor. Mediante un modelo de construcción basado en cubos de datos, el método propuesto permite desacoplar las tareas de fusión de datos de las tareas de orquestación, lo cual habilita a los usuarios a crear servicios de fusión de datos evitando la dependencia fusión-orquestación. Para la creación de estos servicios se propone un conjunto de cláusulas que definen el proceso de construcción, comunicación y consumo de los componentes que realizarán la fusión de datos. A partir del método propuesto se desarrolló un prototipo que se probó en entornos reales de análisis de datos (dominios de climatología y poblacional), además que se probó con datos sintéticos. El desempeño de este prototipo se comparó con el desempeño de la implementación de un método base de la literatura. Los resultados de ambos métodos se contrastaron usando las métricas tiempos de servicio y tiempo de respuesta. Los resultados obtenidos por el prototipo que implementa el método propuesto son prometedores.