Razonamiento basado en casos aplicado a problemas de clasificación

  1. LAGUÍA BONILLO, MANUEL
Dirixida por:
  1. Juan Luis Castro Peña Director

Universidade de defensa: Universidad de Granada

Fecha de defensa: 14 de novembro de 2003

Tribunal:
  1. Miguel Delgado Calvo-Flores Presidente/a
  2. José Manuel Benítez Sánchez Secretario/a
  3. José Jesús Castro Sánchez Vogal
  4. Pedro Luis Galindo Riaño Vogal
  5. Pablo Carmona del Barco Vogal

Tipo: Tese

Teseo: 101001 DIALNET

Resumo

Se pretende analizar la adecuación y aplicación del Razonamiento Basado en Casos (R.B.C.) a problemas de clasificación. La noción de similitud entre casos se suelen definir mediante distancias, por lo que se emplean diferentes distancias clásicas de la Geometría y algunas de sus variantes. Para comparar los diferentes métodos de clasificación se han realizado pruebas con 68 Bases de Casos: 19 bases del UCI- Repository (Iris, Pima, Led7 y 24, Wave Form 21 y 40, Letter-Recognition, ..) y 49 bases sintéticas con diferentes densidades de puntos y formas de las clases. Además de calcular el porcentaje de cierto medio se ha realizado una prueba de contraste de hipótesis t-Student con un nivel de significación del 95%. Se proponen nuevos métodos de clasificación basados en distancias mediante la adicción de hasta 3 características sobre el método clásico k-NN: *-entornos, *-entornosk-NN (y *-entornos1-NN), y una Heurística para seleccionar la medida de distancia. Tenemos 6 combinaciones posibles según se añadan o no estas características: k-NN (sirve como referencia), *-entornos, k-NN Heur, *-entornosk-NN, *-entornos Heur, *-entornosk-NN Heur. Se comprueba experimentalmente que todos los métodos propuestos mejoran a k-NN y que la principal fuente de mejora proviene del uso de la Heurística para seleccionar la distancia. En algunos problemas las medidas de distancia clásicas de la Geometría no resultan adecuadas. Se estudia un tipo de estos problemas y se propone una nueva medida de distancia: la distancia basada en bandas o Hiperplanos. Siguiendo con las ideas del R.B.C., se realiza un cambio de enfoque: cada punto va a tener asociada una banda o medida de distancia local que recoge la información de lo que sucede en los alrededores del punto. Cada punto elegirá su banda intentando apuntar hacia direcciones donde se encuentran puntos cercanos de su misma clase y alejándose de direcciones donde hay puntos de otras