Desarrollo de módulo de aplicación para sistemas open source PACSSistema de recuperación de imágenes de contenido (CBIR), para diagnosis y tratamiento en el área de atención primaria usando imágenes de resonancia magnética cerebral

  1. Rodríguez Méndez, Iván Ariel
Dirigida por:
  1. Enrique Herrera Viedma Director/a

Universidad de defensa: Universidad de Granada

Fecha de defensa: 20 de febrero de 2019

Tribunal:
  1. Juan Manuel Corchado Rodríguez Presidente/a
  2. Julia García Cabello Secretario/a
  3. Manuel Jesús Cobo Vocal
  4. Carlos Gustavo Porcel Gallego Vocal
  5. Ana M. Muñoz Muñoz Vocal

Tipo: Tesis

Resumen

Título de la Tesis Doctoral Desarrollo de módulo de aplicación para Sistemas Open Source PACS: Sistema de recuperación de imágenes de contenido (CBIR) para diagnosis y tratamiento en el área de Atención Primaria usando imágenes de Resonancia Magnética cerebral. 1. Antecedentes: Es todo un reto desarrollar sistemas automáticos que consigan simular de forma eficiente y precisa las tareas de interpretación de datos proveniente de la percepción de un entorno real, y los sistemas que consideran este paradigma son de especial interés en el ámbito de la Inteligencia Artificial. En adelante, nos centraremos en la percepción e interpretación de la imagen en estos sistemas de inteligencia computacional, concepto que se denomina visión artificial o visión por computador. A su vez, este campo engloba multitud de técnicas relacionadas con el procesado de imágenes, entre las que se encuentran la extracción de características, el reconocimiento de patrones, la normalización espacial, el filtrado, la regularización, y la segmentación [6]. Una de las tareas más importantes en el análisis de imágenes médicas es la segmentación, entendiéndose como tal, al proceso de particionarlas según sus componentes estructurales más importantes en regiones homogéneas con respecto a alguna de sus características, como textura o intensidad [9]. Si bien la idea es presentar un marco de trabajo general, esta tesis se ha desarrollado fundamentalmente para Imágenes de Resonancia Magnética cerebrales (IRM). Ya que en teoría, si se introduce toda esta información en un sistema automático, y se diseña la forma de procesar toda esta información, deberíamos poder ser capaces de conseguir segmentaciones correctas de los tejidos, órganos, lesiones, tumores y regiones de interés anómalas [3]. Debido a esta creciente necesidad de manejo y procesado de datos, existe un gran número de laboratorios dedicados a desarrollar herramientas capaces de procesar, clasificar e interpretar todo este volumen de información que sería imposible de procesar sin la ayuda de éstos sistemas automáticos, como por ejemplo los de Recuperación de Imágenes Basada en Contenido CBIR (Content-Based Image Retrieval), que usa una técnica de búsqueda de imágenes que complementa la extracción convencional basada en texto de las imágenes mediante el uso de elementos visuales como el color, la textura la forma y la disposición espacial de Regiones de Interés ROI (Region Of Interest), como criterio de búsqueda [4]. Luego se establece la similitud entre imágenes basándose en un criterio del usuario donde el “qué” es esencialmente, el conjunto de imágenes recuperadas y el “por qué” es la diferencia en las características específicas de la imagen entre la consulta y los resultados obtenidos [1]. Todo esto adquiere aún mayor sentido gracias a la tecnología disponible actualmente. Disponemos de procesadores cada vez más rápidos, de sistemas de almacenamiento con mayor capacidad, y de sistemas de intercambio de información y comunicaciones como los PACS (Picture Archiving and Communications Systems), cada vez más rápidos y fiables [2]. En cuanto al marco de implementación de metodologías para el tratamiento de las imágenes médicas se utilizaron argumentos basados en el conocimiento de los expertos en la interpretación misma de las imágenes a identificar, por ejemplo, un tejido atribuido a una clasificación específica (materia blanca, materia gris, líquido céfalo raquídeo, tumor y fondo), así como componentes de carácter dimensional (hipo-intenso, híper-intenso), junto con argumentos de cuantificación de valores imprecisos como “cerca del tumor ó cerca de los tejidos que rodean un tumor”; todos ellos esencialmente subjetivos e imprecisos que generan en la adopción de sistemas basados en metodologías de Inteligencia Computacional, y en particular la Lógica Difusa como la herramienta principal a usar [10]. 2. Hipótesis y justificación: Los Sistemas de Inteligencia Computacional denominados “Híbridos”, de dos o más técnicas ofrecen un mejor desempeño que las técnicas aisladas [7]. Por esta razón serán tomados en cuenta para su adopción en el marco de esta investigación, dado que los conceptos involucrados mencionados anteriormente (“hipo-intenso”, “cerca del tumor”, etc.) como son subjetivos e imprecisos, plantea una novedad y relevancia como paradigma a estudiar. Surge la pregunta que genera la siguiente hipótesis: ¿Puede un Sistema Híbrido, a partir de una segmentación previa de imágenes de resonancia magnética cerebral, preservar la información discriminante de tejido anómalo en regiones de interés (ROI) de un tumor, tanto como la mejora de contraste en la visibilidad de detalle en esa misma área de interés? Es importante destacar que para la justificación en la implementación y desarrollo de nuestra propuesta, la arquitectura del Sistema prototipo debe enfocarse en la optimización de un solo módulo dentro de la estructura del sistema. Este enfoque debe dejar abierta la posibilidad de mejorar la globalidad de los módulos que constituyen la especialización en tareas particulares como: la interfaz, la extracción de características, la clasificación y la recuperación. De esta manera se podrá estructurar una arquitectura que explote la ventaja de varios resultados en diferentes módulos, maximizando la eficiencia y precisión de la información elegida, y poder dar apoyo a las decisiones médicas en un área específica de salud como la Atención Primaria. 3. Objetivos: El objetivo principal de esta tesis es estructurar, desarrollar y validar un prototipo de Sistema de segmentación de distintos tejidos anómalos en una región de interés ROI, preservando el contraste en la visibilidad de detalle en imágenes de Resonancia Magnética cerebral. Esta iniciativa se apoyará con herramientas de desarrollo de software para generar códigos de programación que sirvan de prototipo ejecutable, usando datos reales y sintéticos, y sobre la base en la implementación de Algoritmos Híbridos de Agrupamiento difuso y Genéticos que: • incorporen el conocimiento de los expertos y que este pueda ser expresado con información convincente asignado a un clúster al que se le asignen etiquetas de predicados difusos que representen a la estructura en estudio. • incorporen un nuevo enfoque que permita una sub-segmentación de imágenes RM, particularmente basado en el Algoritmo de Agrupamiento difuso de C-medias y Genético, con el propósito de determinar sub-grupos de datos de interés que puedan ser caracterizados en típicos o atípicos, y así poder aplicarlos particularmente al diagnóstico clínico. • incorporen un enfoque modificable para futuras re-asignaciones de clústeres de datos para asignar etiquetas externas que proporcionen una mejor validez en la partición, con el fin de mantener constante e invariable el nº de clústeres. • incorporen la adaptación de una metodología subyacente en los Algoritmos Genéticos para la optimización de la función multiobjetivo como el algoritmo NSGA-II, que genere un factor de mejora en el dominio de los datos resultantes de las IRM en las áreas ROI, específicamente en el contraste y en la visibilidad de detalle de dicha región luego de haberse segmentado la imagen 4. Metodologías y desarrollo: En este trabajo de investigación se han implementado dos enfoques metodológicos relevantes y novedosos fundamentados en los objetivos planteados anteriormente. Para el primer caso de la segmentación de la imagen médica de Resonancia Magnética, se propone una modificación de mejora al algoritmo de agrupamiento, fundamentado en el hecho de que a partir de la segmentación realizada, todos los píxeles pertenecientes a la región de Interés (ROI) sean numéricamente similares y que su Compactación espacial también lo sea. Para lo cual se propone incorporar al experimento el argumento de la Adyacencia difusa en la función de pertenencia. De manera que dicho argumento represente la probabilidad de que el píxel ubicado, pertenezca a la i-ésima agrupación en estudio (clúster) [8]. Para el segundo caso donde es necesario preservar el contraste de la visibilidad de detalle de la misma área de interés (ROI) previamente segmentada, se ha adoptado el novedoso esquema de agrupamiento Difuso Multiobjetivo Genético. La técnica es capaz de forma automática de codificar los centroides de cada clúster y al mismo tiempo optimizar, tanto la compactación global difusa como a la Separación global difusa entre los clústeres [5]. 5. Planificación, experimentación, y evaluación: El plan de trabajo se ha dividido en tres fases experimentales con los aspectos y objetivos intrínsecos necesarios para llevar a cabo su estudio, a lo largo de cada fase, definidas de la siguiente manera: Establecer el paradigma básico necesario para solventar el problema de la forma inicial de los conjuntos (clústeres) que representen una imagen dimensional, teniendo en cuenta: • Definición de un índice como coeficiente de la partición que determine o mida lo difuso que pueda ser una partición. • Definición de una función distancia entre dos o más conjuntos difusos (clústeres). • Definición de un coeficiente de validez cuyo valor sea lo más estricto posible sin ser el mejor como argumento restrictivo. Considerar el efecto del grado de automatización que se producen de las operaciones de cómputo al clasificar y discriminar valores en el proceso de la segmentación de las imágenes de resonancia Magnética cerebral, teniendo en cuenta: • Definición de la compactación espacial con un coeficiente de vecindad que determine el conglomerado (clúster). • Definición de la separación espacial con un coeficiente de precisión para el mismo conglomerado (clúster) . • Automatización de la evolución o generación del número de clústeres junto con el número de resultado de los clústeres encontrados. • Definición de los criterios para la elección del centroide validado para que sea el valor inicial desde donde parta la iteración y se produzcan nuevas generaciones de clústeres. Explorar posibles factores de optimización que incorporen la selección definitiva de clústeres, preservando las soluciones denominadas dominantes, teniendo en cuenta: • Definición de un coeficiente que resuelva la situación de solución óptima. • Utilización de estrategias de asignación de un coeficiente fitness que caracterice una optimización global. • Selección del tipo de estrategia o técnica que genere una estructura lógica de optimización con múltiples objetivos. 6. Conclusión: Presentamos en este trabajo de investigación una propuesta de carácter híbrida para dar respuesta a una tarea descriptiva del estudio realizado a un caso particular de segmentación de imágenes médicas de resonancia magnética cerebral con tumor, y de acuerdo a planteamientos que consideran el argumento de extracción de información y conocimiento imagenológico; esta propuesta permite estructurar una modificación de mejora a un primer algoritmo (basado en el agrupamiento difuso de c-medias-MFCM) , cuyos resultados sirven como argumentos de entrada para otra estructura lógica algorítmica (basada en técnicas genéticas de agrupamiento difuso multiobjetivo), y así desarrollar un novedoso prototipo de sistema automática que permite una “sub-segmentación” que descubre nuevos conjuntos de datos. Esta sub-segmentación tiene la ventaja de identificar los datos atípicos ( píxeles relacionados con el tumor), que si bien son localizados casi uno a uno, mejoran la descripción de una dimensión sin degradar la otra y genera resultados de una manera simple. 7. Medios y financiación: Entidad financiadora: Secretaría Nacional de Ciencia Tecnología e Innovación (SENACYT) de Panamá, Instituto para la Formación y Aprovechamiento de Recursos Humanos (IFHARU), Panamá Contraloría General de la República de Panamá, Documento CN-2070-2013-052. Universidad Autónoma de Chiriquí, Panamá.- Licencia remunerada para investigación. Investigador: Iván Ariel Rodríguez Méndez, Cédula de identidad personal 4-132-2771, Pasaporte nº PA0158785 (. 8. Referencias bibliográficas: Reference List [1] G. Bucci, S. Cagnoni, D.R. De, Integrating content-based retrieval in a medical image reference database, Comput.Med.Imaging Graph. 20(1996) 231-241. [2] A.A. Bui, C. Morioka, J.D. Dionisio, D.B. Johnson, U. Sinha, S. Ardekani, R.K. Taira, D.R. Aberle, S. El-Saden, H. Kangarloo, Open Source PACS: An Extensible Infrastructure for Medical Image Management., IEEE Comp.vision.and.Patt.Recog. 11 Issue:1(2007) 94-109. [3] H. Bulu, A. Alpkoçak, Comparison of 3D Segmentation Algorithms for Medical Imaging., IEEE Trans.Image Process.(2007) 269-274. [4] J.J. Caban, A. Joshi, P. Nagy, Rapid development of medical imaging tools with open-source libraries, J.Digit.Imaging. 20 Suppl 1(2007) 83-93. [5] J. Canny, A computational approach to edge detection, IEEE Trans.Pattern.Anal.Mach.Intell. 8(1986) 679-698. [6] K.C. Im, I.S. Choi, J.S. Ryu, G.S. Eo, J.S. Kim, D.H. Moon, PET/CT fusion viewing software for use with picture archiving and communication systems, J.Digit.Imaging. 23(2010) 732-743. [7] O. Limam, F. Ben Abdelaziz, Multicriteria Fuzzy Clustering for brain image segmentation., IEEE Trans.Image Process.(2013) 1-5. [8] S.A. Naimpally, A. Di Consilio, B.D. Warrak, Proximity spaces- Proximal convergence., Mh.Math. 103(1987) 93-102. [9] D.L. Pham, J.L. Prince, Adaptive fuzzy segmentation of magnetic resonance images, IEEE Trans.Med.Imaging. 18(1999) 737-752. [10] X. Yang, B. Fei, A multiscale and multiblock fuzzy C-means classification method for brain MR images, Med.Phys. 38(2011) 2879-2891.