Aplicación de técnicas de clustering para la estimación del esfuerzo en la construcción de proyectos software

Garre Rubio, Miguel

Aplicación de técnicas de clustering para la estimación del esfuerzo en la construcción de proyectos software

Garre Rubio, Miguel

Dirigida por:

Juan José Cuadrado Gallego Director/a
Miguel Ángel Sicilia Urbán Director/a

Universidad de defensa: Universidad de Alcalá

Fecha de defensa: 19 de septiembre de 2006

Tribunal:

Daniel Rodríguez García Presidente/a
María Elena García Barriocanal Secretario/a
Francisco Ruiz González Vocal
José Ramón Hilera González Vocal
Mercedes Ruiz Carreira Vocal

Tipo: Tesis

Teseo: 163062 DIALNET

Resumen

Los modelos paramétricos de estimación de coste del software basados en la utilización de una única ecuación que representa a toda una base de datos de proyectos, ofrecen resultados poco satisfactorios, Esto se debe a diversas razones, una de las cuales reside en el heterogeneidad de los proyectos utilizados en la obtención de dicha ecuación. Se trata entonces de procurar salvar este inconveniente. Para conseguir esto, surgel a idea de dividir esta base de datos de proyectos en grupos de ellos, de manera que los proyectos integrantes sean más homogéneos entre sí. Para realizar esta división de una forma automática y de manera que, efectivamente, proyectos similares se encuentren en el mismo grupo, se recurre a técnicas de Inteligencia Artificial, en concreto a algoritmos de agrupamiento automático o clustering. De ello surge un nuevo modelo, al que se le denomina modelo de estimación paramétrico segmentado. Consiste en la obtención de un conjunto de clusters, o grupos de proyectos, tras la aplicación de un algoritmo de clustering sobre la totalidad de la base de datos de proyectos. Los clusters así obtenidos ofrecen unas características más homogéneas que las que presentaban por separado los proyectos que los constituyen. Para cada uno de los grupos de proyectos obtenidos de esta manera se obtendría, mediante análisis de regresión, su propia ecuación paramétrica. Estas ecuaciones ofrecen, en término medio, después de las pruebas realizadas, mejores resultados que el uso exclusivo de una única ecuación para todos los proyectos de la base de datos. Este proceso se puede repetir de forma recursiva, si se considera conveniente, de manera que sucesivamente se proceda al refinamiento de los clusters que se van constituyendo. Dividir directamente los proyectos de la base de datos, no aprovecha el conocimiento previo que se pueda tener por parte de expertos sobre el comportamiento de los mismos. Con el fin de analizar este aspecto, se han realizado diferentes experimentos, que antes de llevar a cabo el proceso de clusterización, realizan un particionado previo de los proyectos, utilizando el conocimiento que personas expertas tiene sobre la influencia que tienen ciertos conductores de coste sobre el esfuerzo que requiere la realización de un proyecto. De esta manera, a la hora de aplicar el algoritmo de agrupamiento, se partirá de la experiencia y conocimiento ofrecido por estos expertos, que se utilizará para realizar un particionado previo de los datos. La forma en la que se ha llevado a cabo la evaluación del nuevo modelo paramétrico segmentado ha consistido en la comparación del modelo paramétrico clásico, mediante la utilización de los índices MMRE (Mean Magnitude of Relative Error) y PRED(/) (Prediction Level). Estos índices han mostrado unos resultados más satisfactorios utilizando el modelo aquí expuesto que utilizando el tradicional.