Algunas aportaciones al análisis multivariante mediante el concepto de self-consistencia

PERALTA SAEZ, JUAN LUIS

Algunas aportaciones al análisis multivariante mediante el concepto de self-consistencia

PERALTA SAEZ, JUAN LUIS

Zuzendaria:

Juan Luis González Caballero Zuzendaria

Defentsa unibertsitatea: Universidad de Cádiz

Fecha de defensa: 2004(e)ko iraila-(a)k 10

Epaimahaia:

Mariano José Valderrama Bonnet Presidentea
Héctor Manuel Ramos Romero Idazkaria
Juan Luis Moreno Rebollo Kidea
Carmelo Rodríguez Torreblanca Kidea
Jorge Elías Ollero Hinojosa Kidea

Saila:

Estadistica e Investigación Operativa

Mota: Tesia

Teseo: 100506 DIALNET

Laburpena

Los k puntos principales de una distribución de probabilidad se definen como los k puntos que mejor representan la distribución en términos de error cuadrático medio. Este concepto es propuesto por B. Flury (1990) para tratar de generalizar la media de una variable de 1 a k puntos, consiguiendo una mejor representación de la distribución y al mismo tiempo introduciendo una clasificación de sus elementos en función del punto principal más cercano. Una propiedad de los puntos principales de una distribución establece que cada punto principal es el centro de masa de su dominio de atracción, constituido por los puntos del soporte de la distribución que están más cerca de dicho punto principal que del resto. Los conjuntos de puntos que verifican esta propiedad, que no es exclusiva de los puntos principales, se denominan self-consistentes y su determinación puede realizarse a través del método de k-medias. Esta tesis incluye un estudio donde se determina que los conjuntos de puntos self-consistentes son generadores de particiones centradas de Voronoi (PCV), lo que hace posible la utilización de algoritmos generadores de PCV como instrumentos válidos para localizar conjuntos de puntos self-consistentes y principales. A modo de ejemplo, se calculan los conjuntos de puntos principales de la distribución normal univariante y multivariante, exponencial, binomial y Poisson. Otra de las aportaciones relevantes que se incluyen en esta tesis está relacionada con el planteamiento de un problema nuevo: encontrar el conjunto de puntos situado sobre un subespacio de dimensión dada, que mejor representa a la distribución en términos de error cuadrático medio, es decir, encontrar el conjunto de puntos principales para una distribución, con la restricción de que dicho conjunto de puntos debe situarse sobre un subespacio lineal cuya dimensión está determinada a priori. El problema planteado se resuelve inicialmente desde una per