Metaheurísticas de optimización multiobjetivo aplicadas a la inferencia filogenética y al alineamiento múltiple de secuencias

  1. ZAMBRANO VEGA, CRISTIAN
Dirigida por:
  1. José Francisco Aldana Montes Director/a
  2. Antonio Jesús Nebro Urbaneja Director/a

Universidad de defensa: Universidad de Málaga

Fecha de defensa: 03 de julio de 2017

Tribunal:
  1. Óscar Cordón García Presidente/a
  2. Ismael Navas Delgado Secretario/a
  3. Bernabé Dorronsoro Díaz Vocal

Tipo: Tesis

Teseo: 482496 DIALNET lock_openRIUMA editor

Resumen

La temática sobre la que ha girado esta tesis doctoral ha sido la optimización de dos problemas del campo de la Bioinformática: la Inferencia Filogenética y al Alineamiento Múltiple de Secuencias usando metaheurísticas multiobjetivo. Se ha partido de una revisión inicial de los trabajos publicados sobre ambas temáticas, que nos ha permitido introducirnos en los temas biológicos específicos de cada problema. Una vez estudiado los detalles de ambos problemas, se desarrollaron dos frameworks de optimización para hacer frente a ambos problemas: MO-Phylogenetics para la Inferencia Filogenética y jMetalMSA para el Alineamiento Múltiple de Secuencias. Con ayuda de sus funcionalidades se realizaron estudios comparativos entre metaheurísticas multiobjetivo clásicas y modernas del estado del arte sobre formulaciones de dos y tres objetivos de ambos problemas, con el objetivo de conocer su rendimiento y capacidad de desarrollo. A partir de estos resultados se logró definir dos propuestas algorítmicas para cada problema, las cuales fueron implementados en ambos frameworks. Para la Inferencia Filogenética se implementó el algoritmo MORPHY, el cual provee funcionalidades únicas en el estado del arte, ya que además de inferir arboles filogenéticos multiobjetivo a partir de secuencias de ADN (nucleótidos), provee soporte para secuencias de proteínas (amino-ácidos). Para el problema del Alineamiento Múltiple de Secuencias se implementó M2Align, un algoritmo multiobjetivo que optimiza simultáneamente tres métricas de calidad en los alineamientos: información estructural de las proteínas, porcentaje de columnas totalmente alineadas y porcentaje de residuos; además reduce los tiempos y esfuerzos computacionales requeridos por otros optimizadores multiobjetivo, gracias a la explotación de las capacidades que ofrecen las arquitecturas modernas basadas en clúster de procesadores multi-núcleo y; en comparación con otras 9 herramientas clásicas y comúnmente usadas por los biólogos actualmente, permite obtener una mejor calidad de los alineamientos basada en las tres métricas definidas. Todas las implementaciones realizadas en esta investigación se encuentran disponibles en el repositorio público Github para su libre acceso y distribución. Estos trabajos han dado lugar a las siguientes publicaciones: tres artículos en revistas internacionales indexadas en el JCR, la primera, Methods in Ecology and Evolution de primer cuartil, en la que se publicó el framework MO-Phylogenetics, la segunda, International Journal of Intelligent Systems de segundo cuartil, en la que se publicó el análisis comparativo biobjetivo de algoritmos sobre el Alineamiento Múltiple de Secuencias, y la tercera en la revista Bioinformatics, en la que se publicó la propuesta algorítmica M2Align; un artículo en una revista internacional no indexada en el JCR llamada Progress in Artificial Intelligence, en el que se publicó el análisis algorítmico de una formulación de tres objetivos al problema del Alineamiento Múltiple de Secuencias y dos participaciones en congresos internacionales, la primera en el 5th International Work-Conference on Bioinformatics and Biomedical Engineering iWBBIO 2017 en la que se presentó el framework jMetalMSA y la segunda en el 7th European Symposium on Computational Intelligence and Mathematics ESCIM 2015 donde se presentó un estudio inicial de metaheurísticas multiobjetivo aplicadas al Alineamiento Múltiple de Secuencias.