Aplicaciones en fiabilidad del orden transformado convexoestudio de la forma y asimetría de distribuciones de probabilidad

  1. Arriaza Gómez, Antonio Jesús
Dirigida por:
  1. Miguel Angel Sordo Díaz Director
  2. Alfonso Suárez Llorens Director

Universidad de defensa: Universidad de Cádiz

Fecha de defensa: 16 de diciembre de 2016

Tribunal:
  1. Jorge Luis Navarro Camacho Presidente/a
  2. Antonia Castaño Martínez Secretaria
  3. Antonio Di Crescenzo Vocal
Departamento:
  1. Estadistica e Investigación Operativa

Tipo: Tesis

Teseo: 446018 DIALNET

Resumen

En su afán por entender el mundo, el ser humano ha desarrollado toda clase de teorías (algunas más acertadas que otras) para explicar todo lo que le rodea. En general, cualquier teoría científica trata de diseñar modelos que permitan explicar o predecir la realidad que modela. Los modelos generados por dichas teorías pueden ser clasificados en deterministas o estocásticos, siendo los del primer grupo los más atractivos a la hora de realizar predicciones. En estos modelos, siempre se obtiene el mismo resultado final para unas condiciones iniciales determinadas. Desgraciadamente, no siem- pre es posible obtener un modelo determinista, bien porque el azar forma una parte intrínseca del fenómeno a modelar o bien porque no es posible controlar todos los procesos que intervienen en dicho fenómeno. En ese caso, recurrimos a los modelos estocásticos, cuyos resultados se expresan en función de una medida de probabilidad. La Teoría de Probabilidad permite tratar de una manera formal los as- pectos relativos al azar. De esta forma, aparecen los conceptos de variable aleatoria, distribución de probabilidad, función de distribución, función de densidad, etc. Todos estos conceptos nos ayudan a entender los fenómenos aleatorios para poder tomar decisiones en presencia de incertidumbre. Por otro lado, y con el mismo objetivo, se han definido medidas que resuman la información que contiene una variable aleatoria que sigue una distribución de probabilidad, estas medidas se clasifican en tres grandes grupos: medidas de localización (media, moda, percentiles, etc), de dispersión (desviación típica, rango intercuartílico, etc) o de forma (coeficientes de curtosis, coeficientes de asimetría). Las variables aleatorias son usadas en campos tan dispares como en Teoría de la Fiabilidad (donde las variables modelan tiempos de vida de sistemas o componentes de dichos sistemas) o en las finanzas y los seguros (donde las variables modelan pérdidas o ganancias de una empresa o un activo financiero) entre otros campos. Un problema que aparece de forma natural en estos campos es la comparación entre variables aleatorias, las denominadas ordenaciones estocásticas. Por ejemplo, supongamos que dos equipos de i+D+I han desarrollado paralelamente dos motores de idénticas características, es decir, que generan la misma potencia y tienen el mismo consumo. ¿Cómo podríamos averiguar cuál de ellos tiene una mayor fiabilidad? En este caso, las variables aleatorias que modelan los tiempos de vidas de ambos motores son no negativas y nos planteamos la comparación de ambas variables mediante alguna condición estocástica. Una primera idea es comparar los tiempos medios de vida de ambas distribuciones mediante un contraste paramétrico. Sin embargo, la comparación a través de un único coeficiente numérico (que resume la información de toda la distribución en un único dato) puede no ser suficiente a la hora de tomar una decisión. De esta forma, los órdenes estocásticos constituyen una herramienta mu- cho más potente que permite la comparación entre variables aleatorias bajo diferentes criterios. Por ejemplo, si los tiempos de vida de ambas variables están ordenadas según el orden estocástico usual (en el siguiente capítulo veremos su definición formal) significará que no sólo las medias de ambas variables aleatorias están ordenadas sino que también lo están todos los cuantiles, lo cuál supone una dominancia fuerte, en magnitud, de una variable respecto de la otra. Por otro lado, la comparación estocástica de las colas de dos distribuciones de probabilidad se ha convertido en un tema de gran importancia en el terreno financiero y actuarial, ver por ejemplo Wang (1998), Embrechts et al. (2013) y Sordo et al. (2015). Se entiende por colas de una distribución a aquellos sucesos de la variable aleatoria, asociados a los valores más pequeños o grandes (según sea la cola izquierda o derecha) de una distribución. Estos valores suelen tener una probabilidad baja de que ocurran, pero su aparición puede dar lugar a situaciones no deseadas, como por ejemplo grandes pérdidas de una empresa de seguros o incluso su bancarrota. En función del criterio de comparación, algunos órdenes estocásticos pueden ser clasificados en órdenes en magnitud (como el orden estocástico usual, el orden hazard rate, el orden likelihood ratio, etc), órdenes de dis- persión (como el orden convexo, el orden dispersivo, el orden excess wealth, etc) y órdenes de forma (el orden convexo transformado, el orden starshaped, el order superaditivo, etc). Los órdenes estocásticos tienen su origen formal en el trabajo de Mann and Whitney (1947) y ha sido un campo en constante desarrollo que aún hoy día constituye un inmenso potencial teórico. Trabajos como Müler y Stoyan (2002) o Shaked y Shanthikumar (2007) son considerados referentes de lectura recomendada para cualquier persona que desee iniciarse en este campo. A continuación se expondrán las contribuciones realizadas en esta tesis en los campos de teoría de riesgo y teoría de la fiabilidad: Como hemos comentado anteriormente, en las comparaciones estocásticas realizadas en el ámbito de las finanzas, seguros o riesgo, las colas de las distribuciones juegan un papel muy importante. En este contexto, el orden convexo transformado resulta de especial utilidad, ya que permite la ordenación en términos de peso en la cola de la distribución. Sin embargo, el criterio de comparación usado en este orden es considerado una condición fuerte, es decir, existen variables con distinto peso en sus colas que no son comparables según el orden convexo transformado. A partir de la necesidad de nuevos criterios de comparación que permitan ordenar un mayor número de variables aleatorias en función del peso de sus colas, se propone en esta memoria, una medida basada en el orden convexo transformado que debilita el criterio de comparación y es consistente con dicho orden. Por otro lado, al usar dicha medida como criterio de comparación entre las colas de una misma distribución, obtenemos una nueva medida de asimetría basada en el peso de las colas. En el campo de la fiabilidad, algunos órdenes estocásticos dan lugar a una clasificación entre las variables que modelan tiempos de vida, conocida como nociones de envejecimiento. Entendemos por envejecimiento “el fenómeno por el cual un sistema (o componente) tiene una vida residual más corta, en algún sentido estocástico, que otro sistema (o componente) más joven” (ver Bryson y Siddiqui (1969)). Las nociones de envejecimiento nos ayudan establecer cotas de fiabilidad en función de la distribución de pro- babilidad que siga el sistema o el componente analizado, una monografía sobre este tema puede ser consultada en Marshall y Olkin (2007). En este sentido, el presente trabajo aporta nuevas nociones de envejecimiento tanto en el caso unidimensional como en caso multivariante, que permiten la comparación de dos sistemas o componentes en términos de fiabilidad. A continuación, describiremos de forma detallada cada uno de los siguientes capítulos. En el capítulo 1, se establecen los fundamentos teóricos en los que se basarán los capítulos posteriores. Comenzamos con las definiciones básicas (variable aleatoria, función de distribución, función cuantil, etc) que nos permitirán establecer unos cimientos fuertes sobre los que construir todos los conceptos posteriores. El siguiente paso es definir los órdenes estocásticos que se utilizarán a lo largo de esta memoria, estudiando sus propiedades y las relaciones existentes entre ellos. En concreto, repasamos en este capítulo los siguientes órdenes: estocástico usual, convexo transformado, starshaped, superaditivo, dmrl, nbue y algunos otros que juegan un papel importante en teoría de la fiabilidad. Por otro lado, se definen las nociones de envejecimiento: IFR, IFRA, NBU, DMRL y NBUE, estableciendo las relaciones conocidas entre estas nociones de envejecimiento y los órdenes antes mencionados. Finalizamos este capítulo haciendo una revisión de los mismos conceptos anteriores en su versión multivariante. En el capítulo 2, repasamos el significado de la forma de una distribución de probabilidad y definimos, a partir del concepto de forma dado por MacGillivray y Balanda (1988), la clase de equivalencia de todas las variables aleatorias con la misma forma. En la sección 2.2, definimos dos nuevas medidas de forma basadas en el orden convexo transformado dado por van Zwet (1964). Estas medidas nos permiten caracterizar aquellas distribuciones que pertenecen a la misma clase de forma. Además, probamos que ambas medidas preservan el order convexo transformado y el order de kurtosis propuesto por van Zwet. En la sección 2.3, definimos una nueva medida de asimetría basada en las medidas de formas definidas en la sección anterior y demostramos que esta medida satisface las propiedades propuestas por Oja (1981) para medidas de asimetría. De hecho, esta medida permite caracterizar la simetría de una distribución. Por otro lado, en esta sección se dan algunos resultados que aseguran la no negatividad de esta medida. En la sección 2.4 presentamos algunos ejemplos y aplicaciones de la medida de asimetría. Finalmente, terminamos este capítulo con las conclusiones y futuras lineas de investigación recogidas en la sección 2.5. En el capítulo 3, reinterpretamos la familia de órdenes estocásticos, co- nocida como órdenes transformados, en términos de comparación estocástica entre las vidas residuales y los tiempos de inactividad en los cuantiles. Son varias las motivaciones que nos llevan a interpretar estos órdenes usan- do un enfoque basado en cuantiles. En primer lugar, las funciones cuantiles nos permiten estudiar los tiempos de vida en el caso donde no existe una expresión cerrada para las funciones de distribución de las variables de tiempo de vida residual, ver por ejemplo Nair et al. (2013). En segundo lugar, las ordenaciones estocásticas basadas en las funciones de distribución no tienen por qué implicar (ni son implicadas por) las ordenaciones basadas en cuantiles (ver Nair y Vineshkumar (2011)), lo que proporciona una perspectiva nueva a la hora de interpretar estas ordenaciones. Por otro lado, varias de las nociones de envejecimiento, usadas en el campo de la fiabilidad, pueden ser caracterizadas a partir de la comparación estocásti- ca de las vidas residuales (o de los tiempos de inactividad) en términos de cuantiles, de esta forma, se obtiene un mejor entendimiento de las mismas. Algunos ejemplos pueden verse en Muñoz-Pérez (1990), Belzunce (1999) y Belzunce et al. (2003). En la sección 3.2 establecemos dos caracterizaciones para el orden convexo transformado: en función de las vidas residuales y en función de los tiempos de inactividad en los cuantiles. Por otro lado, damos una nueva caracterización del orden dmrl usando las vidas residuales evaluadas en los cuantiles. Estos resultados nos permiten comparar la fiabilidad de dos sistemas que tienen la misma política de eliminación de fa- llos prematuros, antes de un mismo cuantil, en términos del orden convexo o del orden dmrl. En la sección 3.3, se define un nuevo orden estocástico, denominado qmit, que ocupa una posición intermedia entre el orden con- vexo transformado y el orden starshaped. De la misma forma que el orden convexo transformado define la noción de envejecimiento IFR y el orden starshaped la noción IFRA, el orden qmit induce una nueva noción de en- vejecimiento denominada IFRWA. Una aplicación de esta nueva noción de envejecimiento aparece en la sección 3.4 a la hora de comparar dos siste- mas que tienen la propiedad IFRA pero no son IFR. En esta misma sección se incluyen las conclusiones de este capítulo. En el capítulo 4, estudiamos la noción de envejecimiento IFR y las posi- bles generalizaciones al caso multivariante. En general, existen diferentes enfoques a la hora de extender la propiedad IFR a vectores multivarian- tes. Por un lado, la noción IFR indica el crecimiento de la función razón de fallo de una variable aleatoria, definida como el cociente de la función de densidad entre la función de supervivencia de esa variable. La generaliza- ción natural de la noción IFR, surge al extender la función razón de fallo al caso multivariante, de esta forma se dice que un vector aleatorio es IFR si la función razón de fallo multivariante es creciente. Este enfoque ha sido utilizado, entre otros, por Block y Savits (1981), Johnson y Kotz (1975), Rüschendorf (1981) y Savits (1985). Por otro lado, la propiedad IFR puede ser caracterizada a partir de la comparación estocástica de las vidas residua- les de una variable en el order dispersivo. En este sentido, en Arias-Nicolás et al. (2009) se generaliza la noción IFR mediante la comparación esto- cástica de las vidas residuales multivariantes de un vector aleatorio en el orden dispersivo multivariante introducido por Fernández-Ponce y Suárez- Llorens (2003). Un tercer enfoque surge al considerar la siguiente caracterización: una variable aleatoria se dice que posee la propiedad IFR cuando dicha variable está ordenada con respecto a cualquier variable aleatoria ex- ponencialmente distribuida, en términos del orden convexo transformado. En este capítulo, introducimos una nueva generalización de la noción IFR usando este último enfoque. Para ello nos basaremos en el orden convexo transformado multivariante definido en Belzunce et al. (2014). En la sección 4.2 incluimos su definición y recordamos algunas de sus propieda- des más interesantes. En la sección 4.3 se define una familia adecuada de vectores aleatorios exponencialmente distribuidos que nos permite definir la noción IFR multivariante, además estudiaremos en esta misma sección su interpretación y propiedades principales. En la sección 4.4 estudiamos algunos ejemplos de modelos probabilísticos bien conocidos. En la sección 4.5 estudiamos la noción IFR bivariante en algunos casos particulares. Finalizamos este capítulo con una serie de conclusiones recogidas en la sección 4.6.