LA PREDICCIÓN DEL FRACASO EMPRESARIAL
Transcripción
LA PREDICCIÓN DEL FRACASO EMPRESARIAL
115b LA PREDICCIÓN DEL FRACASO EMPRESARIAL. PROPUESTA DE UN MODELO SECUENCIAL BASADO EN EL ANÁLISIS DE SUPERVIVENCIA José Manuel Pereira Departamento de Contabilidade e Fiscalidade Escola Superior de Gestão Instituto Politécnico do Cávado e do Ave Miguel Ángel Crespo Domínguez Departamento de Economía Financiera y Contabilidad Facultad de Ciencias Económicas y Empresariales Universidad de Vigo José Luís Sáez Ocejo Departamento de Economía Financiera y Contabilidad Facultad de Ciencias Económicas y Empresariales Universidad de Vigo Área temática: B) Valoración y Finanzas. Palabras clave: Predicción del Fracaso Empresarial, Análisis de Supervivencia, Modelo de Cox. 3 LA PREDICCIÓN DEL FRACASO EMPRESARIAL. PROPUESTA DE UN MODELO SECUENCIAL BASADO EN EL ANÁLISIS DE SUPERVIVENCIA Resumen La predicción del fracaso empresarial es un tema que despierta interés en un amplio conjunto de agentes económicos, en particularlos inversores, acreedores, instituciones financieras, pero también a losgobiernos.La literatura especializada sobre el fracaso empresarial presenta una amplia gama de modelos utilizados para discriminar entre empresas sanas y fracasadas. En este trabajo proponemos un modelo para la predicción del fracaso empresarial basado en el análisis de supervivencia. Este modelo utiliza el tiempo de supervivencia o la tasa de riesgo como variable dependiente e asume que las empresas fracasadas y las empresas no fracasadas son de la misma muestra poblacional, considerando las empresas no fracasadas como observaciones censuradas. Con esta metodología pasamos a tener un enfoque diferente, una vez que el análisis de la curva de supervivencia de una determinada empresa nos permite saber cuál es la probabilidad de supervivencia más allá de un período de tiempo, y en consecuencia, la obtención del riesgo de insolvencia.El modelo elaborado mantiene con los datos de cada uno de los años elevados porcentajes de acierto para el grupo de empresas no fracasadas, principalmente para los dos años siguientes cualquiera que sea el año de referencia. Para el grupo de las empresas fracasadas el nivel de aciertos va disminuyendo a medida que nos desviamos del momento del fracaso, pero alcanza resultados muy razonables si no consideramos la secuencia temporal. Abstract In face of the current economic and financial environment, predicting corporate bankruptcy is arguably a phenomenon of increasing interest to investors, creditors, borrowing firms, and governments alike. Within the strand of literature focused on bankruptcy forecasting we can find diverse types of research employing a wide variety of techniques, but only a few researchers have used survival analysis for the examination of this issue. We propose a model for the prediction of corporate bankruptcy based on survival analysis, a technique which stands on is own merits. In this research, the hazard rate is the probability of ‘‘bankruptcy’’ as of time t, conditional upon having survived until time t. The model employed in this paper uses the time of survival or the hazard risk as dependent variable, considering the unsuccessful companies as censured observations. The model developed presents with the data of each of the three years high rates of success for the group of non failed companies, mainly for two years regardless of the reference year. For the group of failed companies hit level decreases as we get off the time of failure, but achieved very reasonable results if we do not consider the time sequence. KEY WORDS: Bankruptcy Prediction, Survival Analysis, Cox model. 4 Introducción La globalización impone que cada vez más las empresas tengan que desarrollar su actividad en un entorno económico en permanente mutación, caracterizado por una fuerte competencia, elevados niveles de exigencia, incertidumbre y situaciones coyunturales de crisis económicas. La salud financiera de las empresas ha sido una de las grandes preocupaciones sociales, siendo muchos los agentes económicos, bien a nivel individual o colectivo, interesados en la continuidad empresarial. A lo largo de los últimos cuarenta años la literatura acerca del fracaso empresarial presenta una amplia gama de modelos de predicción de crisis empresarial, basados esencialmente en datos extraídos de los estados contables. El objetivo de la mayoría de los estudios se ha circunscrito a la elaboración de modelos que permitiesen predecir la continuidad empresarial y, al mismo tiempo, destacar los elementos más significativos de los mismos. Desde los trabajos pioneros de Beaver (1966) y Altman (1968) los investigadores buscan metodologías alternativas y nuevas herramientas con el objetivo de mejorar los resultados, soslayar limitaciones metodológicas y potenciar la utilidad de los modelos obtenidos. En este trabajoproponemos un modelopara la prediccióndel fracaso empresarialbasado enel análisis de supervivencia. En orden al repaso bibliográfico que hemos efectuado, constatamos que el número de estudios que utilizaron este análisis en el campo de la predicción del fracaso empresarial es aún muy reducido. Dentro del escaso grupo podemos mencionar los trabajos de Lane et al. (1986), Luoma y Laitinen (1991), Chen y Lee (1993), Laitinen (1999), Laitinen y Kankaanpää (1999), Partington et al. (2001), Parker et al. (2002) o Minguéz (2006). 1. EL ANÁLISIS DE SUPERVIVENCIA En el estudio del análisis de supervivencia es importante definir claramente el acontecimiento de interés. En el ámbito de nuestro estudio el acontecimiento de interés podría ser el tiempo hasta la crisis de una empresa. Lo que distingue el análisis de supervivencia de otras áreas de la estadística es la presencia de censura. Para algunos individuos en estudio, no es observada la realización del acontecimiento de interés durante el período en que los mismos están en observación. Apenas se dispone de información parcial sobre su “tiempo de vida”, sabiéndose simplemente que excede (censura a la derecha) o es inferior (censura a la izquierda) a determinado valor. En el análisis de supervivencia existen dos funciones de especial interés: la función de supervivencia y la función hazard, que definiremos en los puntos siguientes. 5 2.1. Función de supervivencia Según Collet (1994) el tiempo de supervivencia actual de un individuo t puede ser visto como una realización de una variable aleatoria T , la cual puede tomar cualquier valor no negativo. T se encuentra así, asociada al tiempo de supervivencia y sigue una determinada distribución de probabilidad. Siendo T una distribución de probabilidad continuada y definiendo f como la subyacente función densidad de probabilidad, la función distribución de F de T es entonces dada por: t F (t ) = P(T < t ) = ∫ f (u )du [1] 0 y representa que la probabilidad del tiempo de supervivencia sea menor que un determinado valor t. La función de supervivencia, S (t ) , es definida siendo la probabilidad del tiempo de supervivencia mayor o igual a t , representada con la siguiente anotación: S (t ) = P (T ≥ t ) = 1 − F (t ) . [2] La función de supervivencia puede por tanto, representar la probabilidad del tiempo de supervivencia de un individuo sobrepasando un determinado valor t . 2.2. Función hazard La función hazard describe la evolución a lo largo del tiempo de la tasa instantánea de “muerte” de un individuo (Rocha, 1996). Para obtener la función hazard, consideremos la probabilidad que la variable aleatoria asociada con un tiempo de supervivencia T , esté entre t y t + δt , condicionado a que T sea mayor o igual a t , la fórmula equivalente se representaría de esta manera: P (t ≤ T < t + δt | T ≥ t ) . [3] La función hazard h(t ) será entonces el límite de esta probabilidad dividida por el intervalo de tiempo δt , con δt tendiendo para 0, como se puede visualizar: P (t ≤ T < t + δt | T ≥ t ) h(t ) = lim . δt → 0 δt [4] De acuerdo con Collet (1994), de esta definición se pueden conseguir algunas relaciones útiles entre las funciones supervivencia y hazard. Atendiendo al teorema de Bayes, la probabilidad de un evento A, condicionada a la probabilidad de un evento B es dada por P ( A | B ) = P ( A I B ) / P ( B ) . En base a este resultado, la probabilidad condicional de la función hazard en la ecuación [4]es P(t ≤ T < t + δt ) , P(T ≥ t ) [5] 6 lo que es igual a F (t + δt ) − F (t ) , S (t ) [6] donde F (t ) es la función distribución de T. Entonces, F (t + δt ) − F (t ) 1 . h(t ) = lim δt → 0 δt S (t ) [7] Ahora, F (t + δt ) − F (t ) lim δt → 0 δt [8] es la definición de la derivada de F , en el instante t , dada por f , y por consiguiente h(t ) = f (t ) . S (t ) [9] Entonces, h (t ) = − d {logS (t )},. dt [10] luego S (t ) = exp{− H (t )}, [11] donde t H (t ) = ∫ h(u )du . [12] 0 La función H (t ) es designada como función hazard acumulativa y puede ser obtenida de la función supervivencia, desde la ecuación [11]. H (t ) = −logS (t ) [13] 7 2.3. El modelo hazard proporcional Existen dos motivos esenciales para obtener un modelo de datos de supervivencia. Uno es determinar cual la combinación de las potenciales variables explicativas que afecta la forma de la función hazard. El otro es obtener una estimación de la función hazard para una determinada empresa. Uno de los modelos que se podría aplicar sería el modelo hazard proporcional, formulado por Cox (1972) y también conocido por modelo de regresión de Cox. La definición del modelo podrá ser efectuada de la siguiente forma. Suponiendo que el hazard de “fracaso” para un determinado tiempo depende de los valores de x1 , x 2 ,..., x p de p variables explicativas X 1 , X 2 ,..., X P . El conjunto de los valores de las variables explicativas en el modelo hazard proporcional serán representadas por el vector x, de forma que x = ( x1 , x 2 ,..., x p ) ' . Designaremos h0 (t ) como la función hazard de una empresa para quien los valores de todas las variables explicativas hacen que el vector x sea cero. La función h0 (t ) es designada función hazard baseline. La función hazard para la i’ésima empresa puede entonces ser representada como: hi (t ) = ψ ( xi )h0 (t ) , [14] donde ψ ( xi ) es la función de los valores del vector de las variables explicativas para la i’ésima empresa. La función ψ (.) puede ser interpretada como el riesgo en el tiempo t para una empresa cuyo vector de variables explicativas es xi, relativo al riesgo para una empresa cuyo x=0. Un vez que el riesgo relativo ψ ( xi ) no puede ser negativo, es conveniente representarlo como exp(η i ), donde η i es una combinación lineal de p variables explicativas en xi. Por tanto, η i = β 1 x1i + β 2 x 2 i + ... + β p x pi , [15] lo que es equivalente a p η i = ∑ β j x ji . [16] j =1 En anotación matricial, ηi = β ' X i , [17] donde β es el vector de coeficientes de las variables explicativas x1 , x 2 ,..., x p en el modelo. La cantidad η i es designada como componente lineal del modelo, siendo también conocida como risk score o prognostic índex para la i’ésima empresa. 8 El modelo hazard proporcional general puede ser enunciado de la siguiente manera: hi (t ) = exp( β 1 x1i + β 2 x 2 i + ... + β p x pi ) h0 (t ). [18] Una vez que el modelo puede ser escrito en la forma h (t ) log i = β 1 x1i + β 2 x 2i + ... + β p x pi , h0 (t ) [19] entonces el modelo hazard proporcional puede ser visto como un modelo lineal para el logaritmo del ratio hazard. 2.4. Ajustando el modelo hazard proporcional Una de las primeras tareas en esta técnica es la selección de las variables. Los principales paquetes de estadística tienen una serie de rutinas automáticas para la selección secuencial de variables. Estas rutinas están basadas en la selección hacia delante, en la eliminación hacia atrás, o en la combinación de las dos denominada como procedimiento paso a paso. Según Maroco (2003) la ventaja del procedimiento paso a paso es que permite la salida de una variable cuya importancia en el modelo es reducida por la suma de nuevas variables, siendo particularmente apropiado cuando existen correlaciones significativas entre variables independientes. Algunos autores (e.g., Howell, 1999) defienden que ninguno de estos métodos conduce al modelo óptimo. En sustitución de estos procedimientos automáticos de selección de variables Collett (1994), recomienda que se efectúen los siguientes pasos: 1. El primero paso es ajustar el modelo de cada vez con una variable. El valor estadístico − 2 log L̂ para cada uno de estos modelos es comparado con el valor estadístico producido por el modelo de hipótesis nula, para determinar qué variables por si solas, reducen significativamente el valor estadístico. 2. Las variables que parecen ser relevantes en el paso 1 son ahora ajustadas conjuntamente. Con la presencia de determinadas variables, algunas pueden perder dicha relevancia. En consecuencia, aquellas variables que no incrementen significativamente el valor de − 2 log L̂ cuando son omitidas del modelo, pueden ahora ser descartadas. Sólo aquellas que llevan a un aumento significativo del valor de − 2 log L̂ (si fueron retiradas) permanecerán en el modelo. Una vez retirada una variable, su efecto deberá ser analizado. 3. Las variables que no eran importantes por si solas y que no fueran consideradas en el paso previo 2, pueden pasar a ser importantes con la presencia de otras. Estas variables son por tanto, incluidas al modelo desde el paso 2, una de cada vez, y aquellas que reduzcan significativamente el valor de − 2 log L̂ permanecen en el modelo. 4. Se deberá realizar un examen final para asegurar que ninguna variable del modelo puede ser omitida sin aumentar significativamente el valor de − 2 log L̂ , y que ninguna variable no incluida lo reduce significativamente − 2 log L̂ . 9 Siempre que se use este procedimiento de selección, el nivel de significación no deberá ser demasiado pequeño. Collett (1994) recomienda un nivel de significación aproximado del 10%. 2. PROPOSTA DE UM MODELO PREDICTIVO 3.1.Las variables utilizadas Al igual que muchos estudios sobre este tema la selección de variables independientes – en nuestro estudio ratios económico-financieros – se ha basado en el mayor uso y en orden al nivel de significación que de dichas variables han realizado los diferentes investigadores a lo largo de la literatura financiera sobre el tema en cuestión.La ¡Error! No se encuentra el origen de la referencia. recoge la lista de 60 ratios seleccionados que se han elaborado con la información del Balance de Situación y de la Cuenta de Resultados de las empresas que componen la muestra. Tabla 1. Indicadores seleccionados X1 Activo Total / Pasivo Total X2 (Activo Circulante - Existencias) / Pasivo Circulante X3 (Activo Circulante - Pasivo Circulante) / Pasivo total X4 (Activo Circulante - Pasivo Circulante) / Ventas Netas X5 Activo Circulante / Activo Total Neto X6 Activo Circulante / Pasivo a Corto Plazo X7 Activo Circulante / Pasivo Total X8 Activo Fijo / Activo Circulante X9 Amortizaciones / Ingresos de Explotación X10 Capital Propio / Activo Total X11 Capital Propio / Inmovilizado Neto X12 Capital Propio / Pasivo Total X13 Cash-flow / Pasivo a Corto Plazo X14 Cash-flow / Pasivo Total X15 Gastos Financieros / Ingresos de Explotación X16 Gastos Financieros / Resultados Explotación X17 Gastos Financieros / Total Deudas a Instituciones de Crédito X18 Disponibilidades / Activo Total X19 Disponibilidades / Pasivo a Corto Plazo X20 (Disponibilidades + Créditos a Corto Plazo) / Pasivo a Corto Plazo X21 Deudas con Terceros / Activo Total X22 Existencias / Activo Total X23 Existencias / Ventas X24 Capital circulante / Activo Total Neto X25 Gastos de personal / Activo Fijo X26 Gastos de personal / Ingresos de Explotación X27 Inmovilizado Tangible / Activo Circulante X28 Inmovilizado Tangible / Activo Total 10 X29 Inmovilizado Intangible / Activo Total X30 Inmovilizado Neto/ Activo Total X31 Inmovilizado Total / Deudas a Largo Plazo X32 (Inversiones Fin. M/L Plazo + Inv. Fin. C/P) / Activo Total X33 (Inversiones Fin. C/P + Disponibilidades) / Activo Total X34 Pasivo a Corto Plazo / Pasivo Total X35 Pasivo a Medio y Largo Plazo / Pasivo a Corto Plazo X36 Pasivo a Medio y Largo Plazo / Pasivo Total X37 Pasivo Total / Capital Propio X38 Ingresos de Explotación / Activo Circulante X39 Ingresos de explotación / Activo Total X40 Ingresos de explotación / Gastos Explotación X41 Ingresos de explotación / Inmovilizado X42 (BAI + Amortizaciones + Provisiones) / Gastos Financieros X43 Reservas / Activo Total X44 (Reservas + Resultados Ejercicios Anteriores) / Pasivo Total X45 Beneficio Extraordinario / Beneficio Neto X46 Beneficio Neto / Activo Total X47 Beneficio Neto/ Capital Propio X48 Beneficio Neto / Pasivo Total X49 Beneficio Neto / Ingresos de Explotación X50 Beneficio Neto / Ventas X51 Beneficios Explotación / Activo Total Liquido X52 Beneficios Explotación / Gastos Financieros X53 Beneficios Explotación / Ingresos de Explotación X54 Beneficios Explotación / Ventas Netas X55 Ventas / Activo Total X56 Ventas / Capital Circulante X57 Ventas / Disponibilidades X58 Ventas / Existencias X59 (BAI + Gastos Financieros) / Total de Ventas X60 BAI / (BAI +Gastos Financieros) 3.2.La muestra de empresas obtenida Para ajustar el modelo era necesaria una muestra de empresas en las que se verificase el acontecimiento de interés, es decir, el momento del cierre de la actividad. Con base a la información facilitada por Gestores Judiciales y a través del Diário da República hemos logrado obtener una muestra de 171 empresas cuyos tiempos de supervivencia eran conocidos, siendo clasificadas dentro del grupo de las empresas fracasadas. Posteriormente hemos seleccionado de forma aleatoria una muestra de 23 empresas no 1 El total de 17 empresas se obtuvieron: 4 empresas con 4 meses, 2 empresas con 5 meses, 4 empresas con 6 meses, 4 empresas con 8 meses y 3 empresas con 10 meses. 11 fracasadas, es decir, con tiempos de supervivencia censurados (no disponibles), todas ellas dentro del sector textil. Con los tiempos de supervivencia ha sido posible desdoblar cada empresa en 3, obteniendo un grupo de empresas fracasadas con 51 observaciones y un grupo de empresas no fracasadas con 69. Para ejemplificar tomemos los datos de una empresa que ha estado en actividad hasta 6 meses después del último año en que tenemos registros de sus datos. Una vez que recopilamos los datos de 3 años consecutivos es posible tener elementos para 6, 18 y 32 meses previos al tiempo de cierre de la actividad. Este procedimiento se ha hecho para todas las 40 empresas de la muestra. El método de selección de las variables explicativas ha sido el recomendado por Collett (1994), utilizando para ello el paquete estadístico SPSS, versión 14.0 para Windows. Las variables explicativas que contribuían de forma significativa para la disminución de la función estadística − 2 log L̂ , son las que aparecen en la tabla siguiente. Tabla 2. Variables seleccionadas e respectivos coeficientes Variables in the Equation X3 X6 X13 X60 B ,897 -1,734 -5,424 ,236 SE ,304 ,562 1,033 ,085 Wald 8,740 9,526 27,579 7,765 df 1 1 1 1 Sig. ,003 ,002 ,000 ,005 Exp(B) 2,453 ,177 ,004 1,266 La variable X3 representa el (Activo Circulante - Pasivo Circulante)/ Pasivo Total. La variable X6 se refiere al Activo Circulante / Pasivo a Corto Plazo y la variable X13 representa el Cash-flow / Pasivo a Corto Plazo. La variable X60 representa el peso de los gastos financieros en la estructura de la empresa: Resultados Antes de Impuestos / (Beneficios antes de Impuestos y Gastos Financieros). El valor de la última columna [Exp(B)] nos indica el riesgo, relativo a una función base, por cada variación unitaria de la respectiva variable explicativa. De esta forma, cuanto mayor sea el valor de la variable explicativa cuyo coeficiente es negativo, menor será el riesgo y viceversa. Por otro lado, cuanto mayor es el valor de la variable cuyo coeficiente es positivo, mayor será el riesgo. 3.3.El algoritmo de supervivencia La tabla 3 nos permite conocer los valores de la función de supervivencia relativa a los valores medios de las variables. A través del Algoritmo 1es posible calcular los valores de la función de supervivencia para una determinada empresa en cada uno de los instantes de tiempo disponibles, proporcionándonos una imagen de la previsión de su comportamiento a lo largo del tiempo referido. Como ejemplo del funcionamiento de este algoritmo, elegiremos dos empresas. La empresa 6, con datos referentes a 6 meses antes del cierre de la actividad y la empresa 62 con datos censurados referentes a 36 meses antes del fin del estudio. El output de este algoritmo comienza por darnos el valor de la función de supervivencia para cada uno de los tiempos referidos en los meses que aparecen en la primera columna de la tabla de supervivencia. La información es complementada con el gráfico de la función de supervivencia. 12 Tabla 3. Valores de la función de supervivencia Survival Table Time 4 5 6 8 10 16 17 18 20 22 28 29 30 32 34 Baseline Cum Hazard ,065 ,132 ,301 ,390 ,605 ,915 1,095 1,478 1,905 2,403 3,900 5,219 7,043 9,947 12,160 At mean of covariates Survival SE Cum Hazard ,995 ,003 ,005 ,990 ,006 ,010 ,978 ,011 ,022 ,972 ,014 ,029 ,956 ,020 ,045 ,935 ,027 ,067 ,922 ,032 ,081 ,897 ,041 ,109 ,869 ,049 ,140 ,838 ,058 ,177 ,750 ,078 ,287 ,681 ,092 ,385 ,595 ,102 ,519 ,480 ,110 ,733 ,408 ,111 ,896 Algoritmo 1. Valores de la función de supervivencia para cada mes function surv te=[4,5,6,8,10,16,17,18,20,22,28,29,30,32,34]; b3=0.897; b6=-1.734; b13=-5.424; b60=0.236; H0=[0.065,0.132,0.301,0.39,0.605,0.915,1.095,1.478,1.905,2.403, 3.9,5.219,7.043,9.947,12.16]; x3=input('variable x3? '); x6=input('variable x6? '); x13=input('variable x13? '); x60=input('variable x60? '); es=exp(b3*x3+b6*x6+b13*x13+b60*x60); H=es*H0; S=exp(-H); for k=1:size(te,2) fprintf('Valor de la %g\n',te(k),S(k)); end función de supervivencia para %g meses = plot(te,S); Valores de la función de supervivencia en cada uno de los meses para la Empresa 6 13 Valor de lafunción de supervivencia para 4 meses = 0.79735 Valor de lafunción de supervivencia para 5 meses = 0.631353 Valor de lafunción de supervivencia para 6 meses = 0.350397 Valor de lafunción de supervivencia para 8 meses = 0.256977 Valor de lafunción de supervivencia para 10 meses = 0.121501 Valor de lafunción de supervivencia para 16 meses = 0.0412594 Valor de lafunción de supervivencia para 17 meses = 0.0220377 Valor de lafunción de supervivencia para 18 meses = 0.005803 Valor de lafunción de supervivencia para 20 meses = 0.00131088 Valor de lafunción de supervivencia para 22 meses = 0.00023123 Valor de lafunción de supervivencia para 28 meses = 1.25588e-006 Valor de lafunción de supervivencia para 29 meses = 1.26818e-008 Valor de lafunción de supervivencia para 30 meses = 2.20448e-011 Valor de lafunción de supervivencia para 32 meses = 8.898e-016 Valor de lafunción de supervivencia para 34 meses = 3.98863e-019 Gráfico 1. Visualizaciónde lafunción de supervivenciade la empresa 6 Função de sobrevivência da empresa 6 0.8 Valor da função de sobrevivência 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 20 Tempo em meses 25 30 35 14 Valores de lafunción de supervivenciaen cada uno de los meses para la Empresa 62 Valor de lafunción de supervivencia para 4 meses = 0.999879 Valor de lafunción de supervivencia para 5 meses = 0.999754 Valor de lafunción de supervivencia para 6 meses = 0.999439 Valor de lafunción de supervivencia para 8 meses = 0.999273 Valor de lafunción de supervivencia para 10 meses = 0.998872 Valor de lafunción de supervivencia para 16 meses = 0.998295 Valor de lafunción de supervivencia para 17 meses = 0.99796 Valor de lafunción de supervivencia para 18 meses = 0.997247 Valor de lafunción de supervivencia para 20 meses = 0.996453 Valor de lafunción de supervivencia para 22 meses = 0.995528 Valor de lafunción de supervivencia para 28 meses = 0.992753 Valor de lafunción de supervivencia para 29 meses = 0.990313 Valor de lafunción de supervivencia para 30 meses = 0.98695 Valor de lafunción de supervivencia para 32 meses = 0.981619 Valor de lafunción de supervivencia para 34 meses = 0.977576 Gráfico 2. Visualizaciónde lafunción de supervivenciade la empresa 62 Função de sobrevivência da empresa 62 1.005 Valor da função de sobrevivência 1 0.995 0.99 0.985 0.98 0.975 0 5 10 15 20 Tempo em meses 25 30 35 Como se puede verificar por los valores de la función de supervivencia de la empresa 6, la probabilidad de supervivencia de la misma más 2 meses respecto al tiempo que ha sobrevivido es de apenas 26%, fácilmente perceptible por la caída abrupta del respectivo gráfico. Respecto a la empresa 62, se constata que la probabilidad de supervivencia de la misma para más de 4 meses, es de casi el 99,99%, estimando una probabilidad de actividad, 15 para un período superior a 34 meses, prácticamente similar a la estimación anterior, con una pequeña disminución de aproximadamente un 2%. Para calcular los porcentajes de acierto y error en la clasificación de las empresas de la muestra de estimación y de validación hemos utilizado un punto de corte de 0,5, es decir, consideramos una previsión acertada siempre que a la probabilidad de supervivencia de la empresa se le asocie un valor superior a 0,5. De las 65 observaciones de la muestra de estimación el modelo ha errado en 9, de ellas en 4 se ha verificado que el tiempo de supervivencia real era inferior al previsto (error tipo I) y en las 5 situaciones restantes el tiempo de supervivencia real era superior al previsto (error tipo II). Con base a estos resultados el error tipo I ha sido de 6,15% y el error tipo II de 7,69%. Respecto a la muestra de validación, que estaba formada por 55 observaciones, el modelo ha obtenido un comportamiento similar, siendo el tiempo de supervivencia real inferior al previsto en 4 situaciones (7,27%) y el tiempo de supervivencia real superior al previsto en 7 situaciones (12,73%). 4. MODELO SECUENCIAL BASADO EN EL ANÁLISIS DE SUPERVIVENCIA El análisis de supervivencia permite una información cuantitativa de la probabilidad de una empresa que puede fracasar al final de un determinado tiempo t y no únicamente si va o no fracasar. Con la intención de conceptuar este modelo como generalizable y aplicable a cualquier empresa, en el sentido de que el output pueda ser expresado como fracasada o no fracasada, efectuamos una transformación del output del modelo, cuyo resultado es una probabilidad en una dicotomía 0 (cero) o 1 (uno), es decir, si se va a fracasar o no, respectivamente. Para ello se utilizarán 3 puntos de corte que correspondan a los valores de frecuencia al final de determinado tiempo, para comparar con los valores de la función de supervivencia. Los instantes de tiempo considerados para el estudio son: 12 meses, 24 meses y 36 meses. La frecuencia del evento así como los valores de la función de supervivencia para cada uno de los referidos instantes de tiempo, se ha basado en los respectivos valores para los instantes de tiempo más próximos obtenidos en el modelo de supervivencia confeccionado en el punto 3.3. Conjugando toda esta información ha sido posible elaborar un algoritmo en el programa Matlab, versión 7.1 (0) que nos permite tener una previsión del comportamiento de la empresa a lo largo del periodo considerado. El resultado viene recogido en una tabla con 4 columnas (puede verse como ejemplo la 0) donde la primera columna identifica la empresa y cada una de las restantes nos indica la previsión sobre si la empresa va a fracasar (0) o no (1) en los próximos 12, 24 y 36 meses, respectivamente. 16 Algoritmo 2. Modelo con tres puntos de corte function survival %valores temporales te=[4,5,6,8,10,16,17,18,20,22,28,29,30,32,34]; %valores estimados de los coeficientes b3=0.897; b6=-1.734; b13=-5.424; b60=0.236; H0=[0.065,0.132,0.301,0.39,0.605,0.915,1.095,1.478,1.905,2.403,3.9,5 .219,7.043,9.947,12.16]; load tabla d=size(T,1); for k=1:d es(k)=exp(b3*T(k,3)+b6*T(k,4)+b13*T(k,5)+b60*T(k,6)); end es=es'; H=es*H0; %función de supervivencia ST=exp(-H); %Total de empresas: 120 e10=1-17/120; e22=1-34/120; e34=1-51/120; for k=1:d if ST(k,find(te==10))>e10 A1(k,1)=1; else A1(k,1)=0; end if ST(k,find(te==22))>e22 A1(k,2)=1; else A1(k,2)=0; end if ST(k,find(te==34))>e34 A1(k,3)=1; else A1(k,3)=0; end end A1=[T(:,1) A1]; save resultadosSTA1-double 17 Para el funcionamiento del algoritmo se deben seguir los siguientes pasos una vez inicializado el programa Matlab: 1 – Se escribe el nombre del algoritmo (en el caso survival) y se pulsa “enter”; 2 – Se escribe load resultados y se pulsa “enter”; 3 – Por fin pulsamos 2 veces en el icono de la tabla A1. Siempre que necesitemos aplicar este algoritmo a datos de otras empresas (puede ser una base de datos con información de 1 o miles de empresas) sólo tenemos que entrar en el algoritmo y cambiar el nombre de la base de datos que sigue a load(escribiendo el nombre de la nueva base de datos) después de que los datos hayan sido importados para un fichero del Matlab. A continuación y para su funcionamiento sólo se necesita repetir los 3 pasos que acabamos de mencionar. Figura 1. Visión parcial de los resultados del Algoritmo 2 18 A continuación aplicaremos este modelo a la muestra de empresas textiles, compuesta por 445 empresas sanas y 143 fracasadas, con los indicadores de cada uno de los 3 años. Para los datos correspondientes a 1 año previo al fracaso consideramos clasificaciones acertadas para cada uno de los grupos de empresas la siguiente simbología: Empresas fracasadas 0 0 0 Empresas no fracasadas 1 ___ ___ Para las empresas no fracasadas consideramos una clasificación acertada cualquier situación desde que en la primera columna el valor sea 1, una vez que no disponemos de información sobre lo que se ha verificado en los años siguientes, para una parte significativa de estas empresas. Los resultados alcanzaron niveles significativos muy precisos, clasificando acertadamente 439 empresas no fracasadas, que corresponde a un porcentaje de 98,65% y 135 empresas fracasadas, que se traduce en un porcentaje de 94,41%. Con los datos referentes a 2 años previos al fracaso las clasificaciones acertadas tenían que corresponder a la siguiente simbología: Empresas fracasadas 1 0 0 Empresas no fracasadas 1 1 ___ La información que poseíamos en nuestra base de datos para este periodo, nos permite afirmar que las empresas pertenecientes al grupo de las fracasadas han continuado activas al menos más de un año, desarrollándose alguna de las situaciones encuadradas en la definición de fracaso utilizada a partir del segundo año. Respecto a las empresas no fracasadas sabemos que al menos en los 2 años siguientes han continuado su actividad sin que se haya manifestado cualquiera de las situaciones que definimos como fracaso. El porcentaje de aciertos en el grupo de empresas no fracasadas se mantiene elevado, con 398 empresas correctamente clasificadas (89,44%), verificándose en el grupo de empresas fracasadas una disminución significativa de aciertos, con sólo 45 empresas bien clasificadas, que corresponde a un porcentaje de 31,47%. Sin embargo, si no tomamos en cuenta la secuencia temporal, el modelo considera que 87,41% de las empresas de este grupo fracasarán durante el período considerado. Para los datos referentes a 3 años previos consideramos clasificaciones acertadas para cada uno de los dos grupos de empresas la siguiente simbología: Empresas fracasadas 1 1 0 Empresas no fracasadas 1 1 1 19 El modelo ha logrado clasificar correctamente 295 empresas no fracasadas (66,29%) y 65 empresas fracasadas (45,45%). No obstante, si no tomamos en cuenta la secuencia temporal el modelo considera que 109 de las 143 empresas (76,22%) fracasarán durante el periodo considerado. Podemos concluir que el modelo mantiene con los datos de cada uno de los años, elevados porcentajes de acierto para el grupo de empresas no fracasadas, principalmente para los dos años siguientes cualquiera que sea el año de referencia. Para el grupo de las empresas fracasadas el nivel de aciertos va disminuyendo a medida que nos desviamos del momento del fracaso, pero alcanza resultados muy razonables si no consideramos la secuencia temporal, siendo siempre superiores a los obtenidos por cualquier otro de los métodos analizados para el grupo de empresas analizado. 5. CONCLUSIÓN El análisis de supervivencia utiliza el tiempo de supervivencia o la tasa de riesgo como variable dependiente. Asume que las empresas fracasadas y las empresas no fracasadas son de la misma muestra poblacional, considerando las empresas no fracasadas como observaciones censuradas. La principal ventaja de este modelo está en la información adicional que el mismo proporciona. Con esta metodología pasamos a tener un enfoque diferente, una vez que el análisis de la curva de supervivencia de una determinada empresa nos permite saber cuál es la probabilidad de supervivencia más allá de un período de tiempo, y en consecuencia, la obtención del riesgo de insolvencia. Sin embargo, y a semejanza de lo que sucede con los demás métodos, su precisión dependerá en mucho, de la calidad de los datos que sirvieron de base a su confección. En comparación con los restantes métodos estadísticos, éste se ajusta mejor a procesos dinámicos. La principal limitación reside en la dificultad de obtención de los tiempos de supervivencia, es decir, del momento en que ocurre el fenómeno que está siendo analizado. En el presente trabajo diseñamos un algoritmo con la intención de posibilitar que el modelo basado en el análisis de supervivencia sea generalizable y aplicable a cualquier empresa, en el sentido de que el output pueda ser expresado en una dicotomía 0 (cero) o 1 (uno), es decir, si se va a fracasar o no, respectivamente. En base a los resultadosobtenidoscon la muestra utilizadanos parece queeste métodotiene potencialen el desarrollo demodelos de prediccióneneste campo de investigación. Como extensiones de este trabajo o futura línea de investigación podremos mencionar la elaboración de modelos basados en el análisis de supervivencia utilizando bases de datos que permitan el acceso a la información de los estados financieros con periodicidad inferior a un año. La utilización de información como mínimo semestral, podría posibilitar la obtención de mejores resultados, además de disponer de más períodos de supervivencia. 20 BIBLIOGRAFIA Altman, E. I. (1968. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy. The Journal of Finance, 23(4), 589-609. Beaver, W. H. (1966). Financial Ratios as Predictors of Failure. Journal of Accounting Research, 4(3), 71-111. Chen, K. C. W. y Lee, C-W. J. (1993). Financial Ratios and Corporate Endurance: A Case of the Oil and Gas Industry. Contemporary Accounting Research, 9(2), 667-694. Collett, D. (1994).Modelling Survival Data in Medical Research, First Edition, Chapman & Hall, London. Cox, D. R. (1972). Regression Models and Life-Tables. Journal of the Royal Statistical Society, Series B: 34: 187-202. Howell, D. C. (1999).Fundamental Statistics for the Behavioural Sciences. 4th ed., Belmont, CA: Duxbury Press. Laitinen, E. K. (1999). Predicting a corporate credit analyst’s risk estimate by logistic and linear models. International Review of Financial Analysis, 8(2), 97-121. Laitinen, T. y Kankaanpaa, M. (1999). Comparative Analysis of Failure prediction Methods: The Finnish Case. The European Accounting Review, 8(1), 67-92. Lane, W.; Looney, S. y Wansley, J. (1986). An application of the Cox proporcional hazards model to bank failure. Journal of Banking and Finance, 10, 511-531. Luoma, M. y Laitinen, E. K., (1991). Survival Analysis as a Tool for Company Failure Prediction. Omega, 19(6), 673-678. Maroco, J. (2003).Análise Estatística com Utilização do SPSS, 1ª ed., Edições Sílabo, Lisboa. Mínguez Conde, J. L. (2006). Factores Explicativos de la Insolvencia Empresarial: Una Aplicación a la Pequeña y Mediana Empresa Constructora. XII Encuentro ASEPUC, 31 mayo y 1 y 2 junio, Burgos. Parker, S.; Peters, G. F. y Turetsky, H. F. (2002). Corporate Governance and Corporate Failure: A Survival Analysis. Corporate Governance, 2(2), 4-12. Partington, G.; Russel, P.; Stevenson, M. y Torbey, V. (2001). Predicting Return Outcomes to Shareholders from Companies Entering Chapter 11 Bankruptcy. Managerial Finance, 27(4), 78-96. Rocha, C. S. (1996). Análise de Sobrevivência. IV Congresso Anual da Sociedade Portuguesa de Estatística. Universidade de Lisboa, Portugal. 21