Una metodología de selección de variables en dea basada en valores críticos de medidas de relevancia

  1. Villanueva Cantillo, Jeyms
Dirigida por:
  1. Manuel Muñoz Márquez Director

Universidad de defensa: Universidad de Cádiz

Fecha de defensa: 14 de julio de 2021

Tribunal:
  1. Emilio Carrizosa Priego Presidente/a
  2. Yolanda Hinojosa Bergillos Secretario/a
  3. Fernando Fernández Palacín Vocal
Departamento:
  1. Estadística e Investigación Operativa

Tipo: Tesis

Teseo: 670894 DIALNET

Resumen

Esta tesis doctoral se desarrolla en el contexto del análisis envolvente de datos, comúnmente conocido como DEA (siglas en inglés de Data Envelopment Analysis). DEA es una metodología utilizada para estimar las eficiencias de un conjunto de unidades productivas homogéneas, es decir, que operan en un mismo contexto y que realizan los mismos procesos en donde utilizan un igual conjunto de entradas para obtener un idéntico conjunto de salidas. Habitualmente, en la literatura relacionada con DEA, a las entradas y salidas se les denomina inputs y outputs, respectivamente. La eficiencia estimada por DEA de una unidad productiva se obtiene mediante la resolución de un problema de programación lineal en el que se asignan pesos a las variables (inputs y outputs) incluidas en el problema. Por tal motivo, la selección de variables es un aspecto clave en DEA puesto que dicha selección puede afectar los resultados obtenidos con respecto a las eficiencias estimadas. Es por ello que se han desarrollado diversos trabajos enfocados en la selección de variables en DEA, que es la temática específica abordada en este trabajo. A continuación, presentamos y describimos la estructura de esta tesis doctoral. En el capítulo 1 se examinan inicialmente el concepto de eficiencia y las diferentes formas en que puede ser medida. Luego, se revisan los conceptos de eficiencia relativa y de envolvente para después presentar, uno a uno, los diferentes elementos del planteamiento matemático del modelo inicial del análisis envolvente de datos. Asimismo, se muestran las diferentes formas de clasificar los diferentes modelos DEA según los supuestos sobre los rendimientos a escala de las unidades productivas y las maneras que miden las eficiencias. Finalmente, se presenta una amplia colección de los principales modelos DEA formulados en la literatura, detallando sus correspondientes variantes y formatos. El capítulo 2 presenta una revisión exhaustiva de la literatura de los diferentes métodos formulados para realizar la selección de variables en DEA. Un grupo de métodos establece la relevancia de una variable incluida en un modelo DEA a partir del cambio en las eficiencias estimadas cuando se excluye dicha variable del modelo. Otros métodos determinan las variables a incluir en el modelo DEA con base en un análisis de correlaciones o regresión lineal. También hay métodos que reducen el número de variables en el modelo DEA mediante la combinación lineal de algunas variables inicialmente incluidas o mediante problemas de programación lineal. Además, se presenta un método que se basa en los pesos de las variables en DEA y que maximiza la menor contribución de dichas variables en el cálculo de las eficiencias. Por último, se resumen los resultados de diferentes estudios en donde se describen y comparan los resultados obtenidos al aplicar los métodos citados en simulaciones y problemas reales. En el capítulo 3 se presenta el primer aporte teórico de esta tesis ya que se proponen dos nuevos métodos para realizar la selección de variables en DEA. Estos dos métodos se derivan del método existente en la literatura relacionado con los pesos de las variables. El factor diferenciador de estos nuevos métodos con respecto al existente es que calculan la relevancia de cada una de las variables incluidas en el modelo de forma independiente a las demás variables. Uno de los métodos propuestos permite a cada variable alcanzar la mayor contribución posible a las eficiencias de manera independiente a las demás variables, mientras que el otro método se enfoca en determinar la menor contribución posible de una variable a las eficiencias. El capítulo 4 está dedicado al principal aporte teórico de esta tesis: el desarrollo de una metodología para realizar la selección de variables en DEA a partir de valores críticos de la medida de relevancia definida por un método de selección. El propósito de estos valores críticos es determinar que una variable en el modelo DEA no es relevante si su medida de relevancia no es mayor que el correspondiente valor crítico. De esta manera, es posible llevar a cabo un algoritmo iterativo en el que se elimine, paso a paso, la variable del modelo con la menor medida de relevancia si cumple con el criterio anterior. Los valores críticos se calculan por medio de simulaciones Monte Carlo y una prueba de hipótesis basada en un nivel nominal del siguiente error Tipo I: eliminación de una variable relevante del modelo. De esta forma, los valores críticos tienen una fundamentación estadística que los respalda. El pilar fundamental de la metodología propuesta es el proceso de generación de datos en las simulaciones ya que permite introducir y manejar diferentes aspectos relacionados con los inputs, los outputs, las eficiencias y la operación de las unidades productivas. Un aporte teórico adicional presentado en este capítulo es la definición de tres nuevas métricas para medir y comparar el desempeño de los métodos de selección de variables en DEA, aparte de tradicionales estimaciones de error Tipo I y de potencia. En el capítulo 5 se implementa la metodología propuesta en el capítulo 4 mediante un par de extensos estudios de simulación, en cuatro métodos de selección de variables: dos elegidos de la literatura citada y los dos propuestos en esta tesis. Inicialmente, se definen múltiples experimentos y escenarios en los estudios de simulación a partir de factores relacionados con: i) el número de inputs, outputs y unidades productivas del problema, ii) la distribución de los valores de los inputs y outputs, iii) la distribución de las eficiencias de las unidades productivas, y iv) la función de producción que transforma los inputs en los outputs. Luego, se analiza el efecto de las variaciones de dichos factores en los valores críticos calculados para cada método de selección bajo estudio. Adicionalmente, se sugieren valores críticos por defecto para realizar la selección de variables en diferentes modelos DEA de acuerdo con el número de inputs, outputs y unidades productivas. Por último, se describe y compara el desempeño de cada método de selección usando las medidas definidas en el capítulo 4. El capítulo 6 muestra la aplicación de los valores críticos sugeridos obtenidos con la metodología propuesta en varios problemas encontrados en la literatura. Esto con el fin de analizar y evaluar los resultados que se obtengan mediante el uso de dichos valores críticos. Al contar con valores críticos para cuatro métodos diferentes, se formuló una regla para manejar los casos en donde no todos los métodos valoren como relevante a una variable. Para cada uno de los problemas estudiados se realiza un análisis detallando la relevancia de las variables en los diferentes modelos DEA que surjan en el proceso de selección de variables. Finalmente, el capítulo 7 recopila los hallazgos más importantes y las principales conclusiones de esta tesis y presenta diferentes sugerencias de trabajo futuro.