Teoría de cópulas y ordenaciones estocásticas para la comparación de riesgos

  1. Bello Espina, Alfonso José
Dirigida por:
  1. Miguel Angel Sordo Díaz Director
  2. Alfonso Suárez Llorens Codirector

Universidad de defensa: Universidad de Cádiz

Fecha de defensa: 12 de septiembre de 2017

Tribunal:
  1. Félix Belzunce Torregrosa Presidente/a
  2. Antonia Castaño Martínez Secretaria
  3. José María Fernández Ponce Vocal
Departamento:
  1. Estadistica e Investigación Operativa

Tipo: Tesis

Teseo: 495187 DIALNET

Resumen

Frecuentemente, las magnitudes económicas y financieras que determinan la solvencia o el riesgo que afronta una compañía, ya sea financiera o de seguros, no suele depender de un único factor. Un caso, que resulta ser un claro ejemplo de lo anterior, sería el riesgo asociado a una cartera de valores, el cual dependería de los distintos factores compuestos por cada uno de los activos que constituyen la cartera. Otro ejemplo sería el del capital económico que necesita un grupo financiero para no incurrir en insolvencia, capital que dependería de las necesidades generadas por las distintas líneas de negocio en las que interviene dicho grupo financiero. De forma general, los factores que intervienen en los procesos económicos y financieros tienen un componente aleatorio, por lo que éstas y otras situaciones similares pueden modelarse analíticamente mediante vectores aleatorios, es decir, vectores cuyas componentes son variables aleatorias que describen el comportamiento de los distintos factores que intervienen en el proceso. Durante muchos años, el estudio de los vectores aleatorios se limitó al caso de vectores con componentes independientes. Dicha hipótesis de independencia suele facilitar significativamente todos los cálculos, ya que posibilita el uso del Teorema Central del Límite y el cálculo de características agregadas. Así, por ejemplo, bajo esta hipótesis, la varianza del riesgo asociado a una cartera de valores, entendido como la varianza de la suma de riesgos individuales (riesgos agregados), se reduciría a la suma de las varianzas individuales. El inconveniente de la hipótesis de independencia es que, generalmente, está muy alejada de la realidad. Los activos de una misma cartera de valores (o de riesgos), por ejemplo, podrían evolucionar de forma similar ante una misma coyuntura económica, lo cual descarta la independencia como hipótesis de partida. Abandonada la hipótesis de independencia, los investigadores se centraron en el estudio de vectores bajo un modelo normal multivariante, que no es más que la generalización de la distribución normal en el campo de los vectores aleatorios. Con esta alternativa, también se obtienen resultados analíticamente interesantes, pues el estudio de la dependencia entre las componentes del vector se reduciría al estudio de sus coeficientes de correlación. A pesar de ello, el modelo normal no resulta adecuado en muchas situaciones (mercado de valores, ciencia actuarial, fiabilidad de sistemas...), ya que presupone un comportamiento simétrico de las componentes, y dicha asunción resulta poco realista en lo general. Hay que tener en cuenta que tanto la asunción de independencia cuando realmente existe alguna relación de dependencia, como una equivocada interpretación de la estructura de dependencia existente, son errores que pueden resultar catastróficos a la hora de modelar. Para ilustrar lo anterior, imagínese las posibles consecuencias producidas por usar un modelo para la predicción de movimientos sísmicos en una región, de forma que este no capturase correctamente la estructura de dependencia existente entre las distintas variables sísmicas. Por tanto, a la hora de ser aplicado, un modelo estadístico o probabilístico debería ser consistente, al mismo tiempo de adecuarse lo mejor posible a la estructura de dependencia existente en la situación de estudio. Por tanto, el estudio de la dependencia existente entre las variables aleatorias ha resultado ser un importante campo de estudio para la construcción de la teoría matemática de la probabilidad y la estadística. Se podría considerar como estado de dependencia entre variables aleatorias aquel, que por algún tipo de relación o conexión existente entre estas, hace imposible la hipótesis de independencia. Sin embargo, no se debe considerar el concepto de dependencia como el concepto antitético del de independencia. El tipo de dependencia mas extendido es el de la dependencia lineal, y dicho tipo de dependencia es habitualmente medido mediante el coeficiente de correlación de Pearson. Sin embargo, hay que tener cuidado, pues la inexistencia de dependencia lineal (variables incorreladas) no se tiene por que corresponder con una situación de independencia, ya que puede existir una fuerte relación de dependencia de alguna otra naturaleza (que no sea la lineal), hasta el punto de incluso mantener una relación de dependencia extrema. El número de distintas estructuras de dependencia puede resultar ser tan extenso que, probablemente, a día de hoy solo se hayan tratado una pequeña parte de ellas. Han aparecido una gran cantidad de conceptos de dependencia entre las variables aleatorias. Se han desarrollado tanto conceptos de dependencia positiva, como de dependencia negativa. Inicialmente los conceptos anteriores se desarrollaron para estudiar la dependencia entre dos variables unidimensionales, pero rápidamente se continuó con el estudio de la dependencia entre vectores aleatorios de dimensión 2 y seguidamente con las generalizaciones n-dimensionales. El desarrollo de los conceptos de dependencia ha ido acompañado del desarrollo de las medidas de dependencia. Las medidas de dependencia han permitido tener información sobre el tipo de estructura de dependencia que existe entre las variables aleatorias, además del grado que mantienen las variables aleatorias con respecto a la estructura de dependencia considerada. Ahora bien, cuantificar con un solo número el grado de dependencia entre dos (o más) variables aleatorias podría estar condensando demasiado la información. En la literatura se han considerado medidas de dependencia global que son nulas cuando las variables no son independientes entre sí. Por tanto, tener medidas de dependencia que indiquen el grado de esta a lo largo del recorrido de las variables pueden ser de utilidad. Dichas medidas pueden indicarnos dónde y cómo se desarrolla la dependencia a lo largo de las variables. En la práctica, ha incrementado la importancia de estudiar los riesgos localizados en alguna zona determinada de la distribución. Un ejemplo destacado es el del riesgo de cola, debido a que la cola de una distribución se corresponde con sucesos que aunque ocurren con poca frecuencia, pueden suponer un impacto elevado. Por tanto, considerar medidas de dependencia que sean sensibles en la zona de la cola pueden ser útiles a la hora de garantizar la consideración de dichos impactos elevados. Las medidas de dependencia local están dotadas de mayor flexibilidad, e incluso podrían adaptarse a más de un tipo de dependencia a la vez. Autores como Rényi (1959), Bell (1962), Embrechts et al. (2002)..., han considerado que una característica deseable para una medida de dependencia es que la medida debe ser lo mas libre posible de las distribuciones marginales. Pero, sin embargo, el uso de medidas de dependencia que consideran tanto la estructura de dependencia, como el comportamiento de las componentes marginales, pueden resultar útiles cuando se tiene algún interés en mantener la atención en las distribuciones marginales. Un ejemplo puede ser cuando el analista de riesgos con intención de incrementar su cartera, al añadir nuevos riesgos, tiene el especial interés de mantener la atención en su cartera inicial. Actualmente, el modelado de vectores aleatorios busca modelos más realistas, pero necesariamente resultan ser más complejos. En este camino, una de las formas mas extendida y desarrollada para abordar el estudio de la dependencia de los vectores aleatorios es mediante el análisis de las funciones cópulas. La Teoría de Cópulas es un tema de máxima actualidad, sobre el que existen numerosas líneas de investigación abiertas, habiéndose sistematizado y desarrollado su estudio en la última década. Las funciones cópulas están relacionadas con el estudio de las distribuciones multivariantes con distribuciones marginales dadas, y por ende, con las relaciones que existen entre estas últimas. Cada función de distribución conjunta contiene implícitamente una descripción del comportamiento marginal y de la estructura de dependencia que mantienen las marginales. Si se conoce la función de distribución conjunta, automáticamente quedarían determinadas de forma única las funciones de distribuciones marginales. Sin embargo, si se conocen las funciones de distribuciones marginales relativas al vector aleatorio, estas no determinarían de forma única la correspondiente función de distribución conjunta, y por ello surge el interés de estudiar la estructura de dependencia entre las marginales. La palabra cópula significa “atadura, ligamiento de algo con otra cosa” (según la R.A.E.), y fue usada por primera vez en el sentido matemático=estadístico por Sklar (1959) en el teorema que lleva su nombre. Como se mostrará en el capítulo de conceptos y resultados previos de esta memoria, en dicho teorema se describen las funciones que ligan funciones de distribuciones unidimensionales para formar funciones de distribuciones multivariantes. Sklar (1996) expuso cómo, a partir del trabajo de Féron (1956) para 3 dimensiones, ideó generalizarlo para toda dimensión superior a 2. A las funciones las llamó funciones cópula por lo apropiado de su significado y, tras la ayuda de Fréchet para realizar algunas correcciones, consiguió publicar su artículo en 1959 (en el Instituto de Estadística de la Universidad de París). Las funciones cópula ya habían sido usadas antes, aunque con distinto nombre, en trabajos de Fréchet, DallÁglio, Féron, y por muchos otros autores que han trabajado en distribuciones multivariantes con distribuciones univariantes dadas. Hoeffding (1940, 1941) aporta muchos de los resultados básicos para funciones cópulas, entre ellos están sus famosas cotas para estas funciones y el estudio de las medidas de dependencia que resultan invariante bajo transformaciones estrictamente crecientes. Fréchet llegó paralelamente a muchos de los resultados de Hoeffding, razón por la cual se le da también su nombre a muchas de las propiedades. Incluso después de Sklar se presentaron trabajos, como Kimeldorf y Sampson (1975), Galambos (1978) y Deheuvels (1978), donde se usaron otros sustantivos para el mismo concepto. El primer artículo que usa las funciones cópulas para el estudio de la dependencia entre variables aleatorias parece ser el de Schweizer y Wolff (1981). Tras el anterior artículo mencionado, han sido muchos los autores que han trabajado en el tema, pero dos de los mas importantes podrían ser Hoeffding (1940, 1941) y Deheuvels (1979, 1981). El primero trabajó con medidas de asociación no paramétricas y el segundo con la función cópula empírica. Entre las monografías sobre cópulas, caben destacar los trabajos de Joe (1997), Drouet y Kotz (2001) y Nelsen (2006). Joe proporciona un análisis muy completo sobre los modelos multivariantes y los conceptos de dependencia, Drouet y Kotz y Nelsen se centran en las distintas funciones cópulas y las medidas de asociación. Frees y Valdez (1998) ofrecen una introducción para los actuarios que resume las propiedades estadísticas y algunas aplicaciones. Denuit et al. (2005) presentan un trabajo mas completo, y también orientado para actuarios. Georges et al. (2001) presentan algunas cópulas para el análisis de supervivencia multivariante. Cherubini et al. (2004) se centran en aplicaciones financieras. Embrechts et al. (2002) tratan el modelado de la dependencia usando cópulas. Otro campo de estudio que continuamente esta demostrando su gran importancia en el desarrollo de la teoría matemática de la probabilidad y la estadística es el de las ordenaciones estocásticas. Las ordenaciones estocásticas llevan siendo objeto de multitud de investigaciones desde hace mas de 50 años. Actualmente, sigue siendo un tema candente para los investigadores y mantiene una gran cantidad de problemas abiertos en estudio. En la teoría de las ordenaciones estocásticas se estudian los diversos criterios que permiten comparar u ordenar las variables aleatorias o, en su caso multivariante, los vectores aleatorios. Las ordenaciones estocásticas pueden ser una importante herramienta que puede proporcionar valiosa información sobre el comportamiento de modelos estocásticos complejos. La forma más simple de comparar dos distribuciones sería la de hacerlo mediante la comparación de una medida asociada a la distribución (media, mediana, varianza...). Sin embargo, la comparación a partir de solo dos números, condensaría demasiado la información y, a menudo, resultaría poco informativo. Otro problema al comparar en función de dichas medidas es que estas podrían ser coincidentes, o incluso podrían no existir. Podríamos comparar en función de más de una referencia, pero aunque se extendería el abanico de posibilidades, seguiríamos con el mismo problema comentado. Por tanto, ha sido necesario desarrollar toda una variedad de criterios para realizar las ordenaciones que se adapten mejor a cada necesidad, y estos pueden ser de naturaleza distinta: la distribución total de la probabilidad, la distribución de la probabilidad de forma local, la variabilidad, la localización, la simetría de la distribución, etc. De igual modo, existe una gran cantidad de aplicaciones donde las ordenaciones estocásticas toman protagonismo, y resultan ser de naturaleza tan diversa como la fiabilidad de sistemas en ingeniería, la teoría de colas, el análisis de superviviencia, la biología, gestión de carteras financieras, gestión de carteras de seguros, gestión de capital económico... El primer trabajo que considera formalmente las ordenaciones estocásticas es el de Mann y Whitney (1947). Desde entonces, se han ido publicando nuevos trabajos constantemente. Existen muchas monografías sobre las ordenaciones estocásticas que resultan ser de gran utilidad para los investigadores que quieran adentrarse en este campo, como la de Shaked y Shanthikumar (1994) (y en su versión posterior extendida de 2007), la de Müller y Stoyan (2002) y la de Belzunce, Riquelme y Mulero (2015). Otros libros sobre ordenaciones estocásticas interesantes son: Stoyan (1983), Kaas et al. (1994), Denuit et al. (2005), Levy (2006) y Sriboonchitta et al. (2010). El estudio de la consistencia de las medidas de riesgo con respecto a órdenes estocásticos, es un tópico que ha tomado importancia en la teoría actuarial. En la literatura sobre riesgos univariantes existen muchos resultados que, partiendo de dos riesgos ordenados por algún orden inducido por algún principio de comparación de distribuciones, demuestran que estos conservan el orden en sus medidas de riesgo, siendo las medidas pertenecientes a cierta clase. Este tipo de resultados son importantes, por ejemplo, para el estudio de familias paramétricas de distribuciones de riesgos. Debido a que estas familias a menudo quedan ordenadas respecto a diferentes órdenes estocásticos en función de sus parámetros, dichos resultados proporcionan una forma de saber cómo los cambios en los parámetros afectan al riesgo de pérdidas, independientemente de la elección de la medida, siempre que pertenezca a la clase determinada. Así, estos resultados, que implican a diferentes órdenes estocásticos univariantes y a diferentes medidas de riesgo, nos permiten evaluar los riesgos por separado, sin tener en cuenta cómo se relacionan entre sí. Como hemos comentado, cuando analizamos el riesgo de una cartera, no debemos ignorar la interacción existente entre los riesgos que la componen. En este contexto, las medidas de riesgo no se utilizan solo para evaluar los riesgos marginales y agregados, sino también, lo que es más importante desde la reciente crisis financiera mundial, para evaluar el riesgo sistémico, el cual está relacionado con el riesgo de que el fracaso o pérdida de una componente i se extienda a otra componente j, o incluso a toda la cartera. Para abordar la cuestión anterior, en la literatura se ofrecen, básicamente, dos tipos de medidas: las medidas de co-riesgo y las medidas de contribución de riesgo. Por un lado, las medidas de co-riesgo pueden interpretarse como versiones de dependencia-ajustada de las medidas usualmente utilizadas para evaluar los riesgos aislados. La idea general que subyace de estas medidas es la de usar la distribución condicionada de una componente de riesgo en particular, o de incluso el riesgo agregado de toda una cartera, dado que otra componente de riesgo se encuentra en situación de estrés. Algunos ejemplos de este tipo de medidas son los conceptos de valor en riesgo condicional (CoVaR), introducido por Adrian y Brunnermeier (2016) y Girardi y Ergün (2013), el expected shartfall condicional (CoES), introducido por Mainik y Shaanning (2014), y el expected shortfall marginal (MES), introducido por Acharya et al. (2010). Por otro lado, las medidas de contribución de riesgo cuantifican cómo una situación de estrés en una componente de riesgo afecta a otra componente de riesgo distinta, o incluso a toda la cartera. Podemos encontrar ejemplos de medidas de contribución de riesgo en Adrian y Brunnermeier (2016), Mainik y Shaaning (2014) y Girardi y Ergün (2013). En el Capítulo 1 de esta tesis incluiremos los principales conceptos, definiciones y resultados sobre Teoría de Probabilidades, dependencia, medidas de dependencia, medidas de riesgo, Teoría de Cópulas y Teoría de Ordenaciones Estocásticas, que ayudarán al seguimiento de esta memoria y que serán utilizados a lo largo de la misma. En el desarrollo de los próximos capítulos, las definiciones y resultados se volverán a presentar de forma conveniente, puesto que la intención del Capítulo 1 es la de incluir inicialmente en la memoria una colección de partida que permita al lector estar sobradamente preparado para su seguimiento. En el Capítulo 2, dada una cartera de riesgos, estudiamos el comportamiento marginal del riesgo i-ésimo cuando es sometido a un evento extremo, como podría ser una pérdida inusualmente alta de la cartera o, en el caso de una cartera con una estructura de dependencia positiva, grandes pérdidas de otro riesgo. Para ello, consideramos y estudiamos las correspondientes variables aleatorias condicionadas. También escribimos dichas variables condicionadas como distorsiones de las respectivas variables aleatorias marginales y presentamos algunas propiedades de las distribuciones condicionadas anteriores. Al considerar dicha serie de particulares distribuciones condicionadas de riesgos, de diversas formas, formalizamos la intuición de que la i-ésima componente de la cartera es más arriesgada cuando forma parte de un vector aleatorio con dependencia positiva, que cuando esta es considerada de forma independiente. Obtenemos bandas de distribuciones para las distribuciones condicionadas, cuando provienen de un vector aleatorio con una estructura de dependencia positiva CI. Ilustramos lo anterior mediante dos ejemplos donde consideramos particulares distribuciones para los riesgos marginales, eligiendo en el primero una distribución de Pareto y en el segundo una distribución exponencial. También simulamos dos vectores aleatorios de dimensión 5, mostrando la posición de las funciones de superviviencia de las variables condicionadas. Dados dos vectores aleatorios con estructura de dependencia fija, también estudiamos las circunstancias bajo las cuales la existencia de algunas ordenaciones estocásticas entre sus marginales implica ordenaciones estocásticas entre las correspondientes distribuciones condicionadas de riesgos. En este capítulo, también presentamos los resultados desde un punto de vista aplicado a la gestión de capitales. Entonces, desde el punto de vista anterior, vemos las cotas estocásticas para las distribuciones de los riesgos individuales de una cartera, condicionadas a que el riesgo agregado exceda su valor en riesgo (VaR). Las esperanzas de estas distribuciones condicionadas pueden ser interpretadas como las contribuciones de los riesgos marginales en el riesgo total agregado, medido por el tail conditional expectation (o expected shortfall), que es una de las medidas con mayor influencia en la literatura. Por tanto, escribimos los resultados traspasados a esperanzas y en términos del tail conditional expectation. Proporcionamos también las cotas estocásticas inferiores y superiores para el caso general. Además, proporcionamos cotas mejoradas para los casos donde la cartera esta formada por riesgos dependientes positivamente, y derivamos nuevas caracterizaciones para vectores aleatorios comonótonos. Ilustramos los resultados a partir de datos reales del sector multirriesgo español, extraídos de la base de datos suministrada por la Dirección General de Seguros y Fondos de Pensiones. En el Capítulo 3, vamos a estudiar la consistencia de algunas medidas de co-riesgo y de algunas medidas de contribución de riesgo en términos de ordenaciones estocásticas de las componentes marginales bajo distintas suposiciones de dependencia positiva. Partiendo de algunos resultados sobre la consistencia, dados por Mainik y Shaanning (2014), para algunas medidas de co-riesgo con respecto a la dependencia estocástica de las carteras, vamos a mejorarlos bajo la suposición de que las estructuras de dependencia comparadas son positivas (que es una suposición razonable cuando consideramos carteras de seguros). También extendemos nuestra investigación estudiando resultados similares sobre la consistencia de medidas de contribución de riesgo, que es una cuestión que no ha sido abordada con anterioridad. En dicho contexto, ofrecemos condiciones, en términos de algunas nociones de dependencia positiva, bajo las cuales las medidas de contribución de riesgo son consistentes con respecto al orden en dispersión y al orden excess wealth de los riesgos marginales. También consideramos la familia de riesgos DFR, la cual vamos a caracterizar en términos de medidas de contribución de riesgo. Ilustramos los resultados presentados con diversos ejemplos y, a partir de simulaciones realizadas con ayuda de programas computacionales estadísticos, presentamos gráficas de casos particulares de los ejemplos anteriores. En el siguiente capítulo, presentamos dos nuevos índices de dependencia local para vectores aleatorios bivariantes. Estas nuevas medidas difieren de otras en que se centran en los riesgos condicionados a que los otros riesgos excedan cierto cuantil, en vez de centrarse únicamente en la función de distribución conjunta. Primero presentamos una sección introductoria del capítulo. En la segunda sección presentamos el primer índice de dependencia local bivariante, que llamamos Ip, el cual conserva parte de la información de la distribución de la primera variable del vector. Veremos la normalización del índice, cuándo el índice toma los valores extremos, el caso de independencia, la simetría sobre la primera marginal en el índice, su expresión para una familia de distribuciones muy influyente en la literatura (distribuciones elípticas) y para su principal representante (distribución normal), el comportamiento del índice con dependencia positiva (SI y RT I) entre las marginales y ante conceptos de dependencia extrema parcial, el comportamiento ante trasformaciones lineales de las variables, la simetría del índice, la estabilidad y la dominancia en cópula (y en distorsión) y propiedades del índice relacionadas con algunas ordenaciones estocásticas. En la tercera sección presentamos el segundo índice de dependencia local bivariante, que llamamos Ip, el cual solo es dependiente de la función cópula. Veremos la normalización del índice, cuándo el índice toma los valores extremos, el caso de independencia, diferentes expresiones útiles y expresiones al considerar diversas funciones cópula del índice, su comportamiento cuando existe dependencia positiva entre las marginales y ante conceptos de dependencia extrema parcial, la relación del indice con los coeficientes en cola inferior y superior, el comportamiento ante trasformaciones crecientes/decrecientes de las variables, la simetría del índice, la estabilidad y la dominancia en cópula (y en distorsión) del índice, y propiedades del índice relacionadas con algunas ordenaciones estocásticas. También presentamos un nuevo índice de dependencia global para vectores aleatorios bivariantes y una nueva familia de índices de dependencia global que generaliza el anterior, y otras medidas conocidas. Primero presentamos una sección introductoria del capítulo. En la segunda sección presentamos un nuevo índice de dependencia global bivariante, que llamamos I, el cual también solo es dependiente de la función cópula. Veremos distintas expresiones útiles del índice, la normalización del índice y cuándo toma los valores extremos, el caso de independencia, la expresión del índice para algunas cópulas, su comportamiento cuando existe dependencia positiva entre las marginales y ante conceptos de dependencia extrema parcial, la invarianza del índice frente a transformaciones estrictamente crecientes de las variables, la simetría del índice, la propiedad de convergencia uniforme, la estabilidad y la dominancia en cópula (y en distorsión), una propiedad del índice ante el orden convexo y su relación con el coeficiente de correlación de Spearman . En la última sección de este capítulo presentamos una familia de índices de dependencia global, que llamamos MW(p), la cual generaliza el índice I y S, veremos su expresión para diversas funciones W(p) y veremos cómo se adapta a la dependencia mediante la elección de distintas W(p). Concluimos con un capítulo donde hemos resumido las principales aportaciones realizadas en los anteriores capítulos y las conclusiones a las que hemos llegado con lo trabajado. Finalmente, indicar que el contenido de las cuatro primeras secciones del Capítulo 2 ha sido publicado en Sordo, Suárez-Llorens y Bello (2015). El contenido de la quinta sección del Capítulo 2 ha sido publicado en Sordo, Suárez-Llorens y Bello (2013a) y en Sordo, Suárez-Llorens y Bello (2013b). El contenido del Capítulo 3 ha sido presentado en el "21st International Congress on Insurance: Mathematics and Economics" (2017) y en el "IIIWorkshop on Pensions and Insurance" (2017), y se encuentra actualmente sometido a revisión para publicación. El contenido del capítulo posterior ha sido presentado en el "7th European Symposium on Computational Intelligence and Mathematics" (2015) y en el "II Workshop on Pensions and Insurance" (2016).