Algunas aportaciones al análisis multivariante mediante el concepto de self-consistencia

PERALTA SAEZ, JUAN LUIS

Algunas aportaciones al análisis multivariante mediante el concepto de self-consistencia

PERALTA SAEZ, JUAN LUIS

Dirigida por:

Juan Luis González Caballero Director

Universidad de defensa: Universidad de Cádiz

Fecha de defensa: 10 de septiembre de 2004

Tribunal:

Mariano José Valderrama Bonnet Presidente/a
Héctor Manuel Ramos Romero Secretario
Juan Luis Moreno Rebollo Vocal
Carmelo Rodríguez Torreblanca Vocal
Jorge Elías Ollero Hinojosa Vocal

Departamento:

Estadistica e Investigación Operativa

Tipo: Tesis

Teseo: 100506 DIALNET

Resumen

Los k puntos principales de una distribución de probabilidad se definen como los k puntos que mejor representan la distribución en términos de error cuadrático medio. Este concepto es propuesto por B. Flury (1990) para tratar de generalizar la media de una variable de 1 a k puntos, consiguiendo una mejor representación de la distribución y al mismo tiempo introduciendo una clasificación de sus elementos en función del punto principal más cercano. Una propiedad de los puntos principales de una distribución establece que cada punto principal es el centro de masa de su dominio de atracción, constituido por los puntos del soporte de la distribución que están más cerca de dicho punto principal que del resto. Los conjuntos de puntos que verifican esta propiedad, que no es exclusiva de los puntos principales, se denominan self-consistentes y su determinación puede realizarse a través del método de k-medias. Esta tesis incluye un estudio donde se determina que los conjuntos de puntos self-consistentes son generadores de particiones centradas de Voronoi (PCV), lo que hace posible la utilización de algoritmos generadores de PCV como instrumentos válidos para localizar conjuntos de puntos self-consistentes y principales. A modo de ejemplo, se calculan los conjuntos de puntos principales de la distribución normal univariante y multivariante, exponencial, binomial y Poisson. Otra de las aportaciones relevantes que se incluyen en esta tesis está relacionada con el planteamiento de un problema nuevo: encontrar el conjunto de puntos situado sobre un subespacio de dimensión dada, que mejor representa a la distribución en términos de error cuadrático medio, es decir, encontrar el conjunto de puntos principales para una distribución, con la restricción de que dicho conjunto de puntos debe situarse sobre un subespacio lineal cuya dimensión está determinada a priori. El problema planteado se resuelve inicialmente desde una per