administración, finanzas y economía
Transcripción
administración, finanzas y economía
REVISTA DE Volumen 5 Número 1 Enero-Junio 2011 ADMINISTRACIÓN, FINANZAS Y ECONOMÍA (Journal of Management, Finance and Economics) Artículos Comité Editorial Director José Antonio Núñez Mora Directores Adjuntos Carlos Manuel Urzúa Macías Jorge Fernández Ruiz Edgar Ortiz Calisto Cristian Alonso y Eduardo Fracchia El Emprendedor Shumpeteriano Aportes a la Teoría Económica Moderna Linda Margarita Medina Herrera y José Benito Díaz Hernández Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores José Carlos Ramírez Sánchez Humberto Valencia Herrera Consejo Editorial Value at risk and return from the use Bayesian methods for stress testing Alberto Hernández Baqueiro in a world asset allocation and the 2008-2009 crises Elvio Accinelli Gamba José Luis de la Cruz Gallegos Arturo Cortés Aguilar Anabella Dávila Martínez Estimación del residual de un bono respaldado por hipotecas mediante un modelo Julián Pérez García de riesgo crédito: una comparación de resultados de la teoría de cópulas y el modelo Frank Dellman IRB de Basilea II en datos del mercado hipotecario mexicano Raúl Moncarz Isabel Martínez Torres Enciso Enrique Cásares Gil Beatriz Mota Aragón Capital Investments and the real options: new proposes Carolyn Erdener Igor P. Rivera, Enzo D’Antonio di Vito D. y Andrés Fundia Editora de Producción Valuación de Swaptions Bermuda basada en el modelo LIBOR Martha F. Carrillo Urbina adaptado a vectores frontera EGADE BUSINESS SCHOOL Directorio Salvador Alva Gómez David Noel Ramírez Padilla María de Lourdes Dieck Assad Rector del Sistema Tecnológico de Monterrey Rector del Tecnológico de Monterrey Rectora de las Escuelas Nacionales de Posgrado: EGADE Business School & EGAP Gobierno y Política Pública Revista de Administración, Finanzas y Economía (Journal of Management, Finance and Economics) Comité Editorial Director José Antonio Núñez Mora EGADE Business School del Tecnológico de Monterrey Directores Adjuntos Jorge Fernández Ruiz Edgar Ruiz Calisto José Carlos Ramírez Sánchez Carlos Manuel Urzúa Macías El Colegio de México Universidad Nacional Autónoma de México Universidad Anáhuac EGAP Gobierno y Política Pública del Tecnológico de Monterrey Consejo Editorial Alberto Hernández Baqueiro Elvio Accinelli Gamba José Luis de la Cruz Gallegos Anabella Dávila Martínez Julián Pérez García Frank Dellman Raúl Moncarz Isabel Martínez Torres Enciso Enrique Cásares Gil Carolyn Erdener Tecnológico de Monterrey Facultad de Economía de la UASLP Tecnológico de Monterrey EGADE Business School del Tecnológico de Monterrey Universidad Autónoma de Madrid, España Universidad de Münster, Alemania Universidad Internacional de Florida, USA Universidad Autónoma de Madrid, España Universidad Autónoma Metropolitana Kazakhstan Institute of Management Economics Research, KIMEP Editora de Producción Martha F. Carrillo Urbina EGADE Business School del Tecnológico de Monterrey Revista de Administración, Finanzas y Economía (Journal of Management, Finance and Economics) Volumen 5, Número 1, enero-junio 2011, publicación semestral EGADE Business School Calle del Puente 222, Col. Ejidos de Huipulco, Tlalpan. C.P. 14380, México D.F. Aulas III, cuarto piso. Tel. +52 (55) 54832020 ext. 1390 y 1392 Correo electrónico: [email protected] Página: http://www.csf.itesm.mx/egade/publicaciones El presente ejemplar se encuentra protegido por la Ley Federal del Derecho de Autor. ISSN en trámite. Se prohíbe la reproducción total o parcial del contenido en este número sin la previa autorización que por escrito emita el editor. Artı́culos Página Cristian Alonso y Eduardo Fracchia El emprendedor Shumpeteriano Aportes a la Teorı́a Económica Moderna .................................................................................1 Linda Margarita Medina Herrera y José Benito Dı́az Hernández Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores .................................................................................23 Humberto Valencia Herrera Value at risk and return from the use of Bayesian methods for stress testing in a world asset allocation and the 2008-2009 crises ....................33 Arturo Cortés Aguilar Estimación del residual de un bono respaldado por hipotecas mediante un modelo de riesgo crédito: una comparación de resultados de la teorı́a de cópulas y el modelo IRB de Basilea II en datos del mercado hipotecario mexicano ...................................................50 Beatriz Mota Aragón Capital Investments and real options: news proposes.............................................................................................65 Igor P. Rivera, Enzo D’Antonio di Vito D y Andrés Fundia Valuación de Swaptions Bermuda basada en el modelo LIBOR adaptado a vectores frontera........................................................................77 Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and Economics), vol. 5, núm. 1 (2011), pp. 1-22. El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna Cristian Alonso ∗ Eduardo Fracchia∗∗ Recibido 13 de septiembre de 2010. Aceptado 16 de diciembre de 2010 Resumen A un siglo de la primera edición de la Teorı́a del Desenvolvimiento Económico, las ideas de Schumpeter conservan una vigencia notable que sorprenderı́a al propio autor. En este artı́culo se propone releer en particular el segundo capı́tulo de su obra a la luz del contexto actual y analizar en qué modo sus enseñanzas siguen siendo válidas y cuán consistente fue a lo largo de su vida académica. Se ensaya también un rápido análisis de su influencia sobre las corrientes de pensamiento actuales y las teorı́as modernas de innovación y entrepreneurship. Abstract One century after the first edition of the Theory of the Economic Development, Schumpeter’s ideas remain so current that Schumpeter himself would be surprised. In this paper we propose to perform a new reading especially over the second chapter of the Theory in order to check the validity of his teachings and his consistency over time. A quick review of Shumpeter’s influence over current economic research and over modern theory of innovation and entrepreneurship is also included. Clasificación JEL : B20, O30 Palabras clave: Schumpeter, Emprendedor, Innovación Introducción Schumpeter es un autor imposible de encasillar. Admira a Walras fervientemente pero comparte con los austrı́acos el rechazo al estado estacionario. Cree inevitable el avance de las economı́as hacia el socialismo pero no por el fracaso del capitalismo como señalara Marx, sino por su éxito. Schumpeter no forma parte de ninguna de las grandes escuelas teóricas y, sin embargo (o quizás por eso mismo), es que puede percibirse su influencia en economistas sumamente disı́miles. Este trabajo no es una sı́ntesis de la obra schumpeteriana ni una exposición detallada de cómo ha influido en la teorı́a económica. El objetivo de este trabajo es simplemente releer a Schumpeter hoy y apreciar qué tan ∗ ∗∗ IAE Universidad Austral. E-mail: [email protected] IAE Universidad Austral. Casilla de correo No.49. Mariano Acosta s/n y Ruta Nacional 8 (B1629WWA) Pilar. Buenos Aires. Argentina. E-mail: [email protected] 2 Revista de Administración, Finanzas y Economı́a vigentes son sus ideas. Una propuesta que puede sonar atractiva si se considera que pronto se cumplirán cien años de la primera edición de su “Teorı́a del Desenvolvimiento Económico”. 1 La sección II ofrece una breve introducción biográfica, necesaria dada la importancia que se le atribuye a ciertos eventos de su vida personal sobre su trabajo. En la tercera parte se discuten los conceptos que constituyen el núcleo de su teorı́a; el emprendedor schumpeteriano que, mediante la introducción de innovaciones, motoriza el proceso de desarrollo no lineal de la sociedad. En este punto se propone una explicación gráfica de la noción de nuevas combinaciones para mostrar que se trata de un concepto superador al de mero cambio tecnológico del ideario neoclásico. En la sección IV se discute la tesis de obsolescencia del emprendedor. Y en la sección V se presentan algunas ideas del pensamiento neo-schumpeteriano. No es la intención de ese apartado presentar una discusión formal de las distintas ramas, sino simplemente evidenciar que los conceptos de Schumpeter se encuentran presentes en la actualidad en dos corrientes de pensamiento opuestas que emplean metodologı́as distintas para formalizar las mismas nociones. Por último, la sección VI retoma el tema de la innovación para mostrar la vigencia de las ideas del autor en este tópico. 2. Vida y obra de Joseph Shumpeter Joseph Alois Schumpeter nació el 8 de febrero de 1883 en el pequeño pueblo de Triesch, en Moravia (posteriormente parte del Imperio Austrohúngaro y, en la actualidad, de la República Checa). En el seno de una familia acomodada, propietaria de una fábrica textil, Schumpeter creció observando la cotidianeidad del manejo de los negocios. Inició sus estudios de abogacı́a en la Universidad de Viena, aunque pronto mostró interés por la economı́a. En particular, fue alumno de Friedrich von Wieser y de Eugen von Boehm-Bawerk, entre otros eminentes miembros de la escuela austrı́aca, cuya influencia resultará notable durante toda su carrera. En 1906 obtuvo su doctorado y en 1909 se inició en la labor docente en la Universidad de Czernowitz como profesor de economı́a y gobierno. Con sólo veintiocho años, en 1911 publicó su célebre “Teorı́a del Desenvolvimiento Económico”. En este libro desarrolló el concepto de emprendedor como un agente irracional que permite, gracias a sus innovaciones en los procesos productivos, el avance de la sociedad. Comulga además con sus colegas austrı́acos al negar la existencia de un estado estacionario señalando que el sistema económico justamente avanza gracias a los desequilibrios permanentes generados de forma endógena. Pero, como gran admirador de Walras que era (el mayor economista de todos los tiempos, según expresa en su “Historia del Análisis Económico”), presentó su teorı́a de cambio económico como un complemento a la teorı́a del equilibrio estático walrasiano. Más allá de las correcciones que fuera desarrollando a lo largo del tiempo, el núcleo de las ideas plasmadas en esa primera versión de la “Teorı́a del Desenvolvimiento Económico” estarı́a presente en el resto de su obra. 1 A lo largo de este trabajo se empleará la palabra desenvolvimiento como sinónimo de desarrollo en sintonı́a con la primera traducción al castellano del libro “Theory of the Economic Development”, aun cuando desarrollo sea el vocablo más usual. El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna 3 En 1911 comenzó a dar clases en la Universidad de Graz. En 1919 se desempeñó como ministro de finanzas de Austria durante poco más de medio año. Y entre 1920 y 1924 presidió un pequeño banco privado, el prestigioso banco Biedermann. Aunque su labor allı́ era bastante acotada, por lo que aprovechó ese tiempo para probar suerte como inversor privado amasando una pequeña fortuna que se evaporó con la crisis de 1924, junto con su trabajo. Afortunadamente en 1925 recibió un ofrecimiento de la Universidad de Bonn, con el cual inicia su retorno definitivo a la vida académica. En 1926 aparece la segunda edición de su “Teorı́a del Desenvolvimiento Económico” en alemán, una versión reducida y corregida de la anterior sobre la cual se editarı́a la primera traducción inglesa en 1934. Pero en 1926 sufre la pérdida de su segunda esposa, de su hijo recién nacido y de su madre y cae en una profunda depresión. Continúa enseñando en la Universidad de Bonn hasta que, con el ascenso del nazismo en Europa Central, decide mudarse a Estados Unidos en 1932. En Estados Unidos fue nombrado profesor en la Universidad de Harvard, cargo qua mantendrı́a hasta su muerte. En este perı́odo logró la publicación de otras dos de sus grandes obras; “Ciclos Económicos” en 1939 y “Capitalismo, Socialismo y Democracia” en 1942, además de infinidad de trabajos menores. También fue presidente de la Econometric Society entre 1940 y 1941 y de la American Economic Association en 1948. Luego de su muerte, ocurrida el 8 de enero de 1950, Elisabeth, su tercera esposa, se ocupó de editar el último gran trabajo de Schumpeter, “Historia del Análisis Económico”, que fue publicado en 1954. 3. El emprendedor Schumpeteriano y el fenómeno del desarrollo La teorı́a del desarrollo económico según la óptica de Schumpeter no se basa en la especialización y la división del trabajo como indica Adam Smith o en el cambio tecnológico exógeno como señalan las primeras versiones del modelo de crecimiento neoclásico. Schumpeter delinea en cambio la figura del emprendedor como agente motor de un proceso de transformaciones contı́nuas en la organización de la producción que configuran un avance no lineal de la sociedad. De hecho, en Schumpeter y, en particular, en el capı́tulo dos de su Teorı́a, titulado El Fenómeno Fundamental del Desenvolvimiento Económico, los conceptos de emprendedor y desarrollo económico se encuentran tan ı́ntimamente ligados que resulta imposible exponer una idea sin simultáneamente expresar la otra. Schumpeter inicia ese capı́tulo diferenciando dos fenómenos casi antagónicos en lo que refiere al avance de la sociedad, la adaptación y el desenvolvimiento o desarrollo. Considera adaptación a todos aquellos cambios que se producen en el sistema económico en respuesta a alteraciones en el medio externo. El equilibrio walrasiano de una economı́a puede variar, por ejemplo, por un incremento de la población; pero este no constituye un cambio cualitativo del cual la teorı́a deba ocuparse desde que, para determinar sus consecuencias económicas, basta incluir los nuevos números en el modelo. En contraposición, el fenómeno de desarrollo es el que encierra toda la riqueza del análisis de la evolución de los sistemas. En sus propias palabras, “Por tanto, entendemos por “desenvolvimiento” solamente a los cambios de la vida económica que no hayan sido impuestos a ella desde el exterior, sino 4 Revista de Administración, Finanzas y Economı́a que tengan un origen interno”. 2 El desenvolvimiento es entonces un cambio endógenamente gestado, espontáneo y discontinuo y es en la concepción de esta mutación que emerge la figura del emprendedor. Es importante notar que para Schumpeter no es necesario que existan más factores productivos para el desarrollo (en efecto, eso constituye una simple adaptación); lo que importa es que se hagan cosas nuevas con los factores existentes, que se los combine de formas más eficientes, que se creen nuevos productos. El emprendedor es el agente que genera esas innovaciones. Asimismo Schumpeter tampoco pensaba que el ahorro fuera la clave para entender el avance de las sociedades ya que, en cuanto a mera formación de capital, no genera cambios cualitativos en la economı́a, “El aumento lento, pero continuo en el tiempo, de la oferta nacional de medios productivos y de ahorro, es indudablemente un factor importante en la explicación del curso de la historia económica a través de los siglos, pero se oculta completamente por el hecho de que el desenvolvimiento consiste primariamente en el empleo en forma distinta de los recursos existentes, en hacer cosas nuevas con ellos, sin que importe si aumentan o no dichos recursos. Y esto es cierto en forma más tangible en el tratamiento de perı́odos más reducidos. Los distintos métodos de empleo, y no de ahorro, o de aumentos de la cantidad de trabajo, han cambiado la faz del mundo económico en los últimos cincuenta años”. 3 Schumpeter se ocupa entonces de delimitar el concepto de emprendedor o empresario. No todo aquel que tiene a su cargo una empresa es un emprendedor. Al contrario, sólo una porción muy reducida lo es, mientras el resto constituye lo que él denomina meros gerentes de empresa. En la distinción no importa si el individuo es el dueño o es sólo un dependiente de la empresa. Lo que importa es cómo desarrolle su trabajo. El gerente de empresa actúa rutinariamente; el emprendedor actúa innovando, ve con facilidad la existencia de nuevas combinaciones de factores y las implementa. En este sentido, el gerente de empresa es la expresión tı́pica del homo economicus neoclásico, un agente racional que contrapesa ingresos y costos y determina el curso óptimo de acción para su negocio. El emprendedor es, en cambio, un individuo irracional como subraya Schumpeter promediando el final del capı́tulo, “Pues a no ser que asumamos que los individuos que nos interesan se hallen impulsados por un deseo insaciable de satisfacción hedonista, el funcionamiento de la ley de Gossen harı́a cesar todo esfuerzo posterior por parte de los jefes de negocios. Pero la experiencia nos muestra que los empresarios tı́picos sólo se retiran de la arena cuando se ha agotado su fortaleza y no se sienten a la altura de su función. Esto no parece comprobar la representación del hombre económico, que compara resultados probables con la desutilidad del esfuerzo y alcanza a su debido tiempo un punto de equilibrio más allá del cual no desea pasar”. 4 Es irracional porque las motivaciones de su accionar no se limitan a la maximización de beneficios con un fin hedonista como el de incrementar su consumo 2 Schumpeter (1957), pág. 74. 3 Schumpeter (1957), pág. 79. 4 Schumpeter (1957), pág. 101. El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna 5 factible. El emprendedor schumpeteriano persigue, en palabras del autor, una posición social poderosa, el placer de sentirse independiente y superior a los demás, el impulso de lucha y conquista constante y la satisfacción de crear. Y es irracional también porque las innovaciones que incorpora no surgen de un proceso de estudio riguroso, sino de su propia intuición. Su comportamiento transgresor no es gratuito en una sociedad más bien regida por la inercia. Como lo sintetiza Swedberg (2007), los agentes enfrentan dos fenómenos de resistencia al cambio originados en el instinto de supervivencia de las sociedades y los individuos. Uno es de naturaleza sociológica, la sociedad reacciona negativamente si alguien abandona la forma tradicional, conocida y segura de obrar. El otro, de naturaleza psicológica, proviene del propio individuo, es la resistencia al cambio interna. Cambiar implica riesgos y los individuos, en general, rehúyen al riesgo. Es más fácil permanecer actuando en la forma conocida antes que embarcarse en nuevas alternativas, donde no existe un plan de acción acabado para todas las posibles vicisitudes con probabilidad de ocurrencia. El emprendedor, al decidir aplicar una innovación supera esas resistencias exponiéndose a la desaprobación general, a la negación de financiamiento o aceptación de su producto o, incluso a la agresión fı́sica. El emprendedor en Schumpeter es un lı́der nato. En la edición de 1911 se refiere a él como un “Man of Action”, expresión que curiosamente no está presente en la reedición de 1926, como lo nota Swedberg (2007). No acepta la realidad tal como es, sino que busca cambiarla y para ello necesita convencer a otras personas para que lo sigan. Necesita impresionar al banquero para que financie sus proyectos. Si está introduciendo un nuevo producto, necesita crear demanda. Conduce los factores productivos y los combina de formas no tradicionales. Y lidera también al mercado en su conjunto, en cuanto sus competidores lo seguirán e imitarán en la implementación de innovaciones. Por supuesto, el autor reconoce que el emprendedor no está innovando diariamente y que desarrolla ciertas actividades en forma rutinaria. Muchas veces el emprendedor debe ocuparse de tareas administrativas o técnicas, del manejo de personal, la liquidación de impuestos, entre muchas otras. Pero lo que lo define como emprendedor es su vocación por la realización de nuevas combinaciones. Es irrelevante por tanto el tamaño de la empresa que maneja, como ası́ también la clase social a la cual pertenezca. Lo único que importa es que cumpla esa función especial. Por eso Schumpeter señala, “() y es en consecuencia tan raro que una persona conserve durante toda su vida el carácter de empresario, como lo es para un hombre de negocios no ser empresario, ni aun siquiera un momento y en forma modesta, durante todo el curso de su vida”. 5 Es decir, es bastante improbable que el directivo de empresa nunca implemente un cambio en la forma de producción, comercialización o competencia, aunque más no sea uno de reducida importancia. Como también resulta improbable pensar que alguien pueda generar innovaciones en forma continua durante toda su gestión. Lo más razonable es pensar que, en ciertos perı́odos o en ciertas áreas, el emprendedor tenderá a apegarse a la rutina. Pero no es función tı́pica del emprendedor la invención, sino sólo su aplicación. Es ası́ como el empresario protagoniza el fenómeno de desarrollo en 5 Schumpeter (1957), pág. 88. 6 Revista de Administración, Finanzas y Economı́a Schumpeter mediante la implementación de innovaciones que benefician a algunos sectores y perjudican a otros en un proceso que dio en llamar destrucción creativa, término que acuñó en “Capitalismo, Socialismo y Democracia”. De todos modos, vale destacar que este proceso no es lineal o progresivo, como el propio autor lo advierte. El empresario es el responsable, con su accionar, tanto de las expansiones como de las depresiones debido a los efectos desequilibrantes que genera la incorporación de nuevos bienes o procesos productivos en la economı́a. Schumpeter da una concepción holı́stica a la innovación, y establece la distinción entre tres fases interconectadas que forman el proceso: invención, innovación y difusión. La invención según Schumpeter es aquel producto o proceso que se genera en la esfera cientı́fico-técnica, es decir, el descubrimiento propiamente dicho. Ahora bien, la socialización o comercialización de la invención es el paso decisivo para que se convierta en una innovación. La ciencia debe incorporarse a productos, procesos y/o métodos organizativos para poder difundirse en el tejido social; siendo el empresario innovador quien hace de nexo entre ciencia y mercado. Es el que, en busca de ganancias independientes al crecimiento de los factores de la producción, está dispuesto a arriesgarse a incorporar una innovación. Esto le permitirı́a acceder a beneficios (un lugar monopólico en el mercado, excedente organizacional, u otros) que harán que otros empresarios se sumen y ası́ se animará la competencia entre empresas. Una vez difundida la innovación, el ciclo vuelve a empezar, el empresario buscará nuevas innovaciones para aumentar su beneficio y prestigio personal. Schumpeter define las innovaciones en general como el hallazgo de nuevas combinaciones, la incorporación al sistema de conocimiento que es cualitativamente nuevo, no incluı́do en la configuración económica anterior. En particular, establece cinco tipos de innovación: a) La creación de nuevos productos o nuevas variantes a productos existentes b) El desarrollo de nuevos métodos de producción o comercialización c) El ingreso o apertura de nuevos mercados d) La obtención de nuevas fuentes de materias primas o insumos e) La modificación de la estructura de mercado (tı́picamente, la creación de un monopolio) Para ejemplificar gráficamente estas ideas se propone comparar la teorı́a de la firma neoclásica con la schumpeteriana en una variante de la alternativa propuesta por Winter (1967). El análisis que sigue es un modelo deliberadamente simplificado de equilibrio parcial con el sólo efecto de conseguir una rápida exposición. Considérese un conjunto de firmas en una industria competitiva que producen el bien Y empleando un único insumo, trabajo, L a través de una función Y = F (L). Asumiendo que la función de producción presenta rendimientos marginales decrecientes, admitirı́a una representación como la del Gráfico 1. En la concepción neoclásica esta función separa las combinaciones factibles de las que no lo son. Todo punto por debajo de la frontera es técnicamente posible, aunque sólo aquellos situados en la curva son eficientes. Mientras que todas las combinaciones por encima de la función de producción son inalcanzables, serı́a deseable poder obtener más producto empleando una cierta cantidad de factor pero, en el estado actual de la tecnologı́a, eso no es posible. El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna 7 La firma neoclásica en competencia observa la relación de precios insumoproducto vigente en el mercado y determina el nivel de producción dentro del conjunto de alternativas perfectamente conocidas que maximiza sus beneficios. En el gráfico que precede, la firma comprarı́a L0 unidades de factor para elaborar Y0 unidades de producto. Si los precios cambiaran la firma sólo tendrı́a que ajustar las cantidades para conseguir una nueva igualación de los precios relativos al producto marginal y ası́ seguirı́a maximizando beneficios. Gráfico 1. Función de producción. Interpretación Neoclásica. En Schumpeter, sin embargo, más que la diferencia entre planes de producción factibles y no factibles, lo que interesa es distinguir los planes que son empı́ricamente conocidos de los que no lo son. El Gráfico 2 es útil para presentar esta idea. Por ejemplo podrı́a pensarse que, aún bajo la misma función de producción que en el caso neoclásico, no todo el espacio de alternativas alcanzables es conocido por las firmas. Al contrario, las firmas podrı́an conocer empı́ricamente sólo el área sombreada simplemente porque esos son los planes que eventualmente han implementado con anterioridad y no tienen un conocimiento perfecto de la función de producción. En este caso, si el precio relativo del insumo disminuyera por el simple incremento poblacional, por ejemplo, el grueso de las firmas maximizarı́a sus beneficios de acuerdo a su conocimiento histórico de la función de producción y se situarı́a en el punto (L1 , Y1 ). Este ajuste, un incremento en el nivel de producto y empleo, constituirı́a lo que Schumpeter denomina una adaptación de los agentes a nuevas condiciones y no desenvolvimiento. Pero si alguna de las firmas estuviera dirigida por un emprendedor, un individuo no apegado a la rutina y a lo conocido, podrı́a exhibir un comportamiento distinto. El individuo podrı́a notar que es posible incrementar la producción más allá de los niveles reconocidos por el conocimiento histórico y podrı́a animarse a explorar planes productivos por encima de la frontera conocida. Al hacerlo descubrirı́a que obtiene mayores beneficios si elige producir en el punto (L2 , Y2 ), generando un mayor nivel de empleo y producto. De este modo el 8 Revista de Administración, Finanzas y Economı́a emprendedor habrı́a introducido una innovación al identificar nuevas combinaciones de factores para la obtención del bien final. En el corto plazo su firma se beneficiarı́a por mayores ganancias respecto al resto de sus competidores. Mientras que en el largo plazo el beneficio se derramarı́a sobre el resto de la sociedad también ya que, cuando el resto de las empresas note que este agente encontró una forma más eficiente de producir, tenderı́an a imitarlo. Las que ası́ no lo hicieran serı́an eliminadas del mercado. En definitiva, el aporte de este emprendedor al desarrollo de la sociedad vendrı́a dado por el empleo de los recursos en la forma óptima al descubrir la verdadera frontera de posibilidades. Gráfico 2. Función de producción. Interpretación Shumpeteriana. Gráfico 3. Función de producción. Cambio tecnológico. El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna 9 Otro ejemplo que puede plantearse en este mismo escenario es el del tradicional cambio tecnológico. En este sentido, el emprendedor podrı́a observar la existencia de herramientas nuevas o, simplemente distintas, que incrementarı́an la productividad de sus operarios. Al introducirlas a su proceso de elaboración, su frontera de posibilidades se expandirı́a hasta G(L), lo que le permitirı́a producir mucho más para cada nivel de empleo de insumos. Si esta ganancia extraordinaria superara los costos de incorporar las herramientas, con el tiempo el resto de las firmas lo imitarı́a; pero mientras tanto disfrutarı́a de beneficios por encima de los competitivos. A modo de sı́ntesis, en la teorı́a original del emprendedor schumpeteriano, este individuo se constituye en el motor de los saltos cualitativos en el orden económico mediante la introducción de innovaciones en la producción, comercialización o estructura del mercado. Para ello se vale de su intuición más que del cálculo acabado de costos y beneficios a la hora de detectar posibles nuevas combinaciones. Del mismo modo que su motivación no se acaba en la persecución hedonista de la maximización del beneficios, sino que encuentra placer en la actividad creadora y en una posición social poderosa. 4. La tesis de obsolescencia del emprendedor Hacia el final de su vida algunos autores consideran que Schumpeter perdió la fe en su emprendedor. En “Capitalismo, Socialismo y Democracia”, predice la evolución pacı́fica del capitalismo hacia un estadio superior, el socialismo, como consecuencia de la constante y creciente concentración económica en grandes firmas que desplazan al emprendedor. “This social function is already losing importance and is bound to lose it at an accelerating rate in the future even if the economic process itself of which entrepreneurship was the prime mover went on unabated. () The romance of earlier commercial adventure is rapidly wearing away, because so many more things can be strictly calculated that had of old to be visualized in a flash of genius. () Thus, economic progress tends to become depersonalized and automatized. Bureau and committee work tends to replace individual action.” 6 Schumpeter señala que esta obsolescencia del emprendedor se explica básicamente por dos fenómenos. Por un lado, la concentración y burocratización de los procesos de investigación y desarrollo en el seno de las grandes corporaciones. La búsqueda de nuevas combinaciones y los medios para ponerlas en práctica se convierten en la tarea cotidiana de un grupo de técnicos preparados. La innovación se torna de este modo una actividad rutinaria. Por otra parte, tampoco es necesaria ya la voluntad del emprendedor para superar las resistencias, sociológicas y psicológicas, al cambio porque, tras tantas y tan frenéticas mutaciones económicas (durante la primera mitad del siglo XX, en particular), sociedades e individuos simplemente se acostumbraron a los cambios. La predicción de Schumpeter era que las grandes firmas reemplazarı́an a los emprendedores y a la burguesı́a industrial, en general. Perdida su función caracterı́stica y con ingresos limitados a un salario por desempeñar una actividad rutinaria, esta clase social tenderı́a a desaparecer. La semilla para el paso al socialismo quedarı́a ası́ sembrada. 6 Schumpeter (1976), pág. 133 10 Revista de Administración, Finanzas y Economı́a Un importante debate se ha producido en la literatura en torno a este cambio en el pensamiento schumpeteriano o, como se le denomina usualmente, la tesis de obsolescencia del emprendedor. La corriente principal señala que el cambio en Schumpeter se produjo cuando abandonó Austria y se instaló en Estados Unidos. Allı́ fue cuando comprendió la naturaleza del capitalismo tardı́o al observar las grandes empresas norteamericanas en las cuales la figura de su emprendedor, bastante realista en el escenario austrı́aco de principios de siglo, no tenı́a cabida. Trabajos clásicos en esta lı́nea son los de Phillips (1971), Nelson (1977), Klein (1977) y Freeman (1982). Todos ellos sugieren que se produjo un cambio sustancial en la comprensión y descripción schumpeteriana de la economı́a a tal punto que bien podrı́a considerarse que se trata de dos autores totalmente distintos, un Schumpeter temprano y uno tardı́o. De hecho, Klein expresa esta hipótesis de un modo bastante sugestivo: “Schumpeter expressed very different views in his later writings than in his earlier works, so much so that one has the impression there were two Schumpeters: Schumpeter the revolter against determinism, and Schumpeter the determinist.” 7 Estos autores destacan el cambio producido especialmente en su concepción de las innovaciones. En el Schumpeter inicial, las invenciones eran un fenómeno más o menos exógeno, que se convertı́an en innovaciones comerciales cuando un emprendedor las aplicaba obteniendo ganancias extraordinarias que motivaban al resto del empresariado a seguirlo. En el tardı́o, sin embargo, el proceso exógeno de invención es endogeneizado en el interior de titánicas corporaciones que requieren de la innovación continua, de la destrucción creativa constante, para mantener su posición competitiva en el mercado. La intuición del emprendedor se vuelve un don irrelevante en instituciones burocráticas donde todo se ha racionalizado. Sin embargo, existe otra lı́nea de investigación que niega que Schumpeter haya modificado su teorı́a al mudarse a Estados Unidos. Destaca en este sentido el trabajo de Langlois (2002). Langlois intenta demostrar que la teorı́a del emprendedor schumpeteriano mantuvo consistencia, al menos, desde 1926 en adelante, seis años antes que abandonara Europa. En efecto, en la última versión de la “Teorı́a del Desenvolvimiento Económico”, basada en la segunda edición alemana de 1926 puede leerse: “Sin embargo, cuanto más exactamente lleguemos a conocer el mundo natural y social, tanto más perfecto será nuestro control de los hechos; y cuanto mayor sea la perfección con que puedan calcularse las cosas, con tiempo y racionalización progresiva, y en forma rápida y segura, tanto más decrece la importancia de dicha función. Deberá disminuir, por tanto, la importancia del empresario, lo mismo que ha disminuido ya la del jefe militar.” 8 La similitud entre este pasaje del Schumpeter temprano y el previamente citado del Schumpeter tardı́o es innegable. La idea detrás de esta consistencia implicarı́a que, en situaciones de marcada incertidumbre o ignorancia, la intuición del emprendedor constituye un don muy valioso. Pero, en la medida que el conocimiento acerca del ambiente externo se acrecienta, es más fácil calcular 7 Klein (1977), pág. 133. 8 Schumpeter (1957), pág. 95. El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna 11 costos, beneficios y riesgos; y determinar, sobre la base del análisis racional de estos cálculos, el mejor curso de acción. De esta forma, la intuición del emprendedor queda relegada a un segundo plano. Langlois cita además el aporte de Becker y Knudsen quienes, al traducir el ensayo “Emprendedor”de 1928, indican que efectivamente aprecian un cambio en la teorı́a del emprendedorismo pero entre 1911 y 1926, y no entre 1926 y 1942. En su interpretación, de constituir una caracterı́stica psicológica de un pequeño grupo poblacional en la primera versión de la “Teorı́a del Desenvolvimiento Económico”, la noción de emprendedor pasarı́a a intentar conceptualizar una forma de comportamiento más bien despersonalizada, un ideal de individuo o, quizás incluso, de organización. Estos autores leen entonces una versión institucionalizada del emprendedor ya en los escritos de 1926. Para Becker y Knudsen este cambio se debió a un conjunto de eventos y tragedias en la vida personal de Schumpeter. Para Langlois, se explica más bien por una intención de compatibilizar su teorı́a con las ideas burocráticas de Max Weber, que gozaban de notable reconocimiento en la Europa Central de la década del veinte. Sin embargo, en repetidos pasajes de la segunda versión de su libro, Schumpeter reitera la definición explı́cita del emprendedor como una persona y no como una institución, poniendo especial énfasis en la importancia de su intuición. A favor de estos autores podrı́a pensarse que, el propio Schumpeter señala en el prefacio a la versión inglesa de 1934 que, en la edición de 1926 que sirvió de base para la traducción, intentó mantener la obra original de 1911 aplicando sólo alteraciones menores; lo que justificarı́a la persistencia de la figura del emprendedor como individuo. Pero esas alteraciones menores no impidieron que eliminara un capı́tulo completo y reescribiera el segundo y el sexto intentando excluir los términos estático y dinámico que, a su juicio, habı́an motivado ciertas confusiones entre sus lectores. En consecuencia, no parece tan irracional inferir que, si Schumpeter hubiera estado convencido que el emprendedor ya no era un individuo sino una institución, habrı́a introducido algunos cambios en este sentido. En nuestra opinión, la teorı́a schumpeteriana del emprendedorismo mantuvo una consistencia notable durante toda la obra de este autor. Incluso Langlois (2002) reconoce esta posibilidad al señalar: “A more detailed study might well discover that the continuity really goes back to 1912 or earlier, not merely to 1926.” 9 El emprendedor de 1911 es el mismo que el de 1926 y de 1934; lo que cambió es el medio ambiente en el que se desarrolla y las herramientas que utiliza en la toma de decisiones. La resistencia al cambio fue desvaneciéndose y el desarrollo de nuevas técnicas de gestión y análisis de mercados proveyeron de mayor información al individuo para manejar la incertidumbre. En este sentido, el emprendedor se ha racionalizado. Y fue el propio autor el primero en llamar la atención en este sentido, contrario a lo que afirma Berumen (2007), por ejemplo. Sin embargo, ningún individuo toma decisiones bajo información perfecta. En ocasiones, ni siquiera puede emplear toda la información que podrı́a conseguirse por no disponer del tiempo o los recursos para obtenerla, como también ya lo notaba Schumpeter. De modo que, la intuición, el talento 9 Langlois (2002), pág. 11. 12 Revista de Administración, Finanzas y Economı́a individual, aún cuando reducida en su importancia, sigue siendo una parte no despreciable del comportamiento emprendedor. Es cierto que la teorı́a de 1911 fue diseñada especialmente a medida del capitalismo temprano. Pero también es verdad que el autor entrevió pronto que el paso a la nueva etapa estarı́a relacionada con un detrimento de la intuición en pos de la racionalidad. Y es largamente reconocido que no esperaba elaborar una teorı́a económica universal válida para toda época y lugar. En sus propias palabras, en su prólogo a la edición española de 1944, “Se me ha dicho con frecuencia que mi esquema analı́tico se refiere únicamente a una época histórica que está rápidamente llegando a su fin. Y en eso estoy de acuerdo. En mi opinión la teorı́a económica no podrá ser nunca, en este sentido, más que la teorı́a de una cierta época histórica.” 10 Probablemente lo que ha motivado este nivel de discusión es el énfasis particular que Schumpeter otorgó a las grandes corporaciones en “Capitalismo, Socialismo y Democracia”. Al señalar que, en el lı́mite, estas empresas desplazarı́an totalmente a los emprendedores en cuanto a la endogeneización de la generación de innovaciones posiblemente estaba considerando que las firmas crecerı́an y avanzarı́an en forma perpetua gracias a su posición privilegiada en el mercado, constituyendo una suerte de oligopolio de cı́clopes industriales. Pero la evidencia demuestra que ese no es el caso. Muchas grandes corporaciones con centros integrados de investigación y desarrollo han sucumbido por su propio peso. Mientras que proyectos surgidos en un garaje han revolucionado el mundo tecnológico. Es evidente que el emprendedor de la actualidad no es idéntico al arquetipo schumpeteriano. Pero no es menos cierto que comparte varios de los atributos más importantes. Es un agente más racional, pero no desprecia la intuición. Ve oportunidades donde otros sólo ven rutina e implementa innovaciones que revolucionan el mercado. Afirmar que, como en el pensamiento de Schumpeter, este emprendedor es la base del desarrollo puede sonar un poco arriesgado. Pero que juega un papel importante en el proceso es innegable. 5. El pensamiento Schumpeteriano en las corrientes actuales Tras la muerte de Schumpeter, sus contribuciones en materia de crecimiento fueron soslayadas. El mainstream se hallaba abocado a la formalización matemática de las teorı́as tras la aparición de los celebrados modelos de HarrodDomar (1946) y de Solow (1956). Las ideas de Schumpeter eran difı́ciles de expresar en relaciones matemáticas, él mismo durante su vida habı́a intentado hacerlo a sabiendas que el resto de los economistas teóricos no tomarı́a en serio su teorı́a del desarrollo hasta que pudiera formalizarla, según lo afirma Klein. Pero los esfuerzos de Schumpeter y de algunos de sus seguidores inmediatos no lograron los resultados deseados. Probablemente porque todavı́a no estaban disponibles las herramientas matemáticas y computacionales necesarias para hacerlo. No es la intención de esta sección realizar un análisis detallado de la amplia gama de autores influenciados por el pensamiento de Schumpeter. Al contrario, a sabiendas de que se comete la imperdonable omisión de autores notables, esta 10 Schumpeter (1957), pág. 10. El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna 13 sección simplemente intenta proveer una breve identificación de las dos principales corrientes que fundamentan sus trabajos en los conceptos de emprendedor, innovación y destrucción creativa, entre otros. A grandes rasgos se clasifica a estos autores en dos ramas. Por un lado, los neo-schumpeterianos que persiguen la formalización de las ideas de la “Teorı́a del Desenvolvimiento Económico” a través de modelos de simulación. Por el otro, economistas neoclásicos que desarrollan modelos de crecimiento endógeno utilizando versiones simplificadas de tales conceptos. A continuación, una rápida descripción de cada grupo. De acuerdo a Kwasnicki (2003) fueron el desarrollo de la informática en los años cincuenta y sesenta y del enfoque de simulación los que permitieron comenzar a estudiar problemas no lineales. El primer modelo neo-schumpeteriano en emplear simulaciones para emular el comportamiento evolucionista fue el de Winter en 1964, “Economic Natural Selection and the Theory of the Firm”. Los esfuerzos en esta lı́nea se intensificaron durante las décadas siguientes hasta consolidarse en el libro de referencia de la economı́a evolucionista “An Evolutionary Theory of Economic Change” publicado por Nelson y Winter en 1982. Desde entonces, han proliferado modelos de simulación inspirados en las ideas del crecimiento schumpeteriano basado en la destrucción creativa. Estos modelos desplazan totalmente la idea de equilibrio general a favor la modelización evolucionaria. Esto les permite incorporar supuestos mucho más realistas respecto a los modelos neoclásicos tradicionales. Se consideran, por ejemplo, heterogeneidad de agentes, racionalidad acotada, mecanismos alternativos de innovación y apropiación, estructuras de mercado alternativas, aprendizaje en la producción, rendimientos no decrecientes, etc. Pero un punto particularmente interesante entre estos autores es que complementan su modelo de simulación con el análisis de la experiencia histórica, contrastando sus resultados con la evidencia empı́rica. Un claro compromiso metodológico con la visión de Schumpeter para quien la teorı́a económica, la estadı́stica y la historia debı́an interactuar en la explicación de los fenómenos. Aunque tal compromiso no implica que los neo-schumpeterianos hayan adoptado los trabajos del maestro como dogma. Al contrario, como lo señala Freeman (1998) es sorprendente la variedad de enfoques que ha proliferado en el marco de esta corriente, muchos de ellos incluso criticando al propio Schumpeter. En general, los autores neo-schumpeterianos comparten la visión del capitalismo como un fenómeno evolutivo que muta en el tiempo a través de innovaciones productivas, comerciales o estructurales. Partiendo de ese denominador común, se ha sometido al análisis y formalización a la mayor parte de las ideas de Schumpeter y se han explorado áreas sobre las que el autor no habı́a trabajado como es el caso del comercio internacional, subdesarrollo y desarrollo regional. Aunque también es cierto que otras áreas relevantes han sido excluidas del análisis, por ejemplo, teorı́a del consumidor. Para un excelente repaso de esta literatura se sugiere Freeman (1998). Una última caracterı́stica notable de los modelos neo-schumpeterianos es que centran su estudio en la innovación microeconómica a nivel de firmas o industria y no a escala macroeconómica donde la teorı́a del desarrollo se encuentra estancada en un callejón sin salida. Estudios notables se han llevado a cabo tomando las caracterı́sticas especı́ficas de la industria sobre el avance técnico en agricultura, minerı́a y, especialmente, actividades manufacturares. Sin embargo, se ha dejado de lado al sector más importante de la economı́a global y al 14 Revista de Administración, Finanzas y Economı́a más afectado por los avances tecnológicos, el de los servicios. Por otra parte, las innovaciones estudiadas se han concentrado en cambios tecnológicos en la producción pero escasas investigaciones se han llevado a cabo sobre innovaciones en organización. Aunque justo es reconocer el elevado grado de dificultad que la modelización de estos avances impone. En otra lı́nea de sucesión, ya sobre la década del noventa, las ideas de Schumpeter encontraron cabida en el marco de los modelos de crecimiento endógeno. Estos autores no son neo-schumpeterianos en el sentido que se le ha dado al término en los párrafos anteriores desde que no emplean la metodologı́a evolucionista de los modelos de simulación. En cambio, emplean modelos de corte neoclásico para formalizar las ideas de Schumpeter acerca de la endogeneización de las innovaciones, la competencia como fenómeno evolutivo que expulsa a quienes no se ajustan a las nuevas condiciones de mercado, la destrucción creativa, entre otros. A partir de los trabajos fundacionales de Romer y Lucas, en 1992 llegó el destacado aporte de Aghion y Howitt, quienes desarrollaron un modelo de crecimiento endógeno basado en la idea schumpeteriana de la destrucción creativa. Propusieron una economı́a constantemente sometida a innovaciones tecnológicas que benefician a algunos sectores y perjudican a otros y donde la competencia se ocupa de eliminar a los que no tienen éxito desarrollando o imitando innovaciones. En este sentido se diferencian de la teorı́a AK convencional que considera al progreso tecnológico simplemente como otro modo de acumulación de capital ignorando la posible existencia de conflictos interpersonales. Este trabajo original fue continuado en la misma tradición generalizando el modelo básico y desarrollando nuevas alternativas. A continuación se propone un repaso breve de aquella versión. Aghion y Howitt (1992) constituye una primera aproximación al crecimiento endógeno bajo la concepción schumpeteriana en un contexto de incertidumbre. Para ello modelizan las innovaciones como una secuencia aleatoria de mejoras únicamente en la calidad de los productos, por lo que constituye un modelo de innovaciones verticales ya que estas vuelven obsoleta la tecnologı́a anterior. Ası́ intentan formalizar parcialmente el concepto de destrucción creativa. Adicionalmente suponen que las investigaciones son llevadas a cabo por las firmas quienes gozarı́an de un monopolio sobre las eventuales invenciones. Para operacionalizar estos supuestos, Aghion y Howitt suponen que el trabajo en una economı́a puede destinarse a investigación y desarrollo o a producir un insumo del cual se obtiene un bien final. Cuando una empresa incorpora una innovación monopoliza la producción del insumo y goza de beneficios extraordinarios hasta que otra empresa desarrolle otra innovación y la desplace. Por último, las innovaciones se suponen idénticamente distribuidas Poisson con parámetro λ. Con esta estructura el monopolista (actual y potencial) maximiza beneficios llegando a una ecuación de arbitraje. Aparece luego una relación negativa entre la investigación corriente y la futura porque si se advierte que existirá mucha investigación en los próximos perı́odos, las rentas creadas por la investigación actual se ven amenazadas, desincentivándola. En virtud de esta relación negativa el modelo puede tener una única solución de estado estacionario o varias originando posibles senderos de crecimiento cı́clicos e, incluso, una trampa de no crecimiento donde la innovación se detiene. Aunque vale El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna 15 notar que esta relación negativa se da porque el monopolista no endogeneiza la externalidad positiva de la investigación corriente sobre la futura. Si se permite que sea un planificador de Pareto el que toma las decisiones podrı́a alcanzarse una tasa de crecimiento mayor que bajo descentralización. Para que esto se produzca los efectos que generan mayores incentivos sociales a la investigación por el lado de una menor tasa de descuento social respecto a la privada (porque para el planificador el beneficio de la próxima innovación será para siempre) y por el problema de la apropiabilidad (el monopolista no puede endogeneizar los beneficios que producen sus innovaciones sobre las futuras) deben superar al desincentivo social que resulta de la internalización por parte del planificador de la destrucción del retorno social de la innovación anterior (que los privados no interiorizan). El aporte más significativo de esta lı́nea de trabajo claramente resulta entonces la modelización de intereses contrapuestos y su impacto sobre el crecimiento. En este sentido el enfoque verdaderamente responde al ideal schumpeteriano aún cuando constituye una simplificación notoria. En palabras de Howitt respecto a la superioridad de este esquema de trabajo sobre los modelos AK, “Our new theory treats innovation as a separate activity from saving, and it is explicit about who gains from it, who loses, how the gains and losses depend on social arrangements, and how such arrangements affect society’s willingness and ability to progress.” 11 Las generalizaciones a este modelo básico desarrolladas en los últimos veinticinco años versan sobre distintas modificaciones a los supuestos. Pero las que resultan más interesantes son las relacionadas a competencia, polı́tica de patentes, diferencias de ingresos entre paı́ses y revoluciones tecnológicas. En términos de competencia, por ejemplo, los modelos de crecimiento señalan que la competencia reduce la tasa de crecimiento al contraer la tasa de retorno potencial de las innovaciones. Sin embargo, la evidencia empı́rica parece afirmar lo contrario. Lo que motivó a estos autores a buscar explicaciones alternativas en el marco del modelo de 1992. Ası́ aparecen modelos incluyendo barreras de entrada, problemas de principal-agente y maximizaciones sobre los beneficios incrementales y no sobre los absolutos. Para más detalles acerca de las generalizaciones del modelo de 1992 se sugiere Aghion y Howitt (1998). 6. La Innovación en la Teorı́a Moderna Las ideas de Schumpeter acerca de las innovaciones también han evidenciado una revitalización en los últimos años. Probablemente por la gravitación que ciertos autores neo-schumpeterianos han ejercido sobre organizaciones como la Organización para la Cooperación y el Desarrollo Económico (OCDE) y el Fondo Monetario Internacional (FMI) en pos de la estandarización de las estadı́sticas sobre investigación y desarrollo. En el Manual de Oslo (2005) de la OCDE puede apreciarse una cierta influencia de Schumpeter cuando se señala que las innovaciones pueden agruparse en cuatro categorı́as: 11 Howitt (2002), pág. 1. 16 Revista de Administración, Finanzas y Economı́a a) La innovación de producto implica cambios significativos en las caracterı́sticas de las mercancı́as o de los servicios. Se incluyen tanto las mercancı́as totalmente nuevas como los servicios y las mejoras significativas de los productos existentes. b) La innovación de proceso representa cambios significativos en los métodos de producción y de distribución. c) La innovación de organización, referida a la puesta en práctica de nuevos métodos de trabajo, tanto de la organización como del lugar de trabajo y/o de las relaciones exteriores de la empresa. La innovación de comercialización refleja la puesta en práctica de nuevos métodos de comercialización; desde cambios en el diseño y el empaquetado hasta la promoción del producto mediante nuevas polı́ticas de precios y de servicios. Además, el concepto de innovación ha cobrado particular vigor en el marco de las teorı́as modernas de competitividad. Existen varias estrategias de competitividad, pero no se puede negar que la innovación es el único medio para lograr que la competitividad de una nación a nivel internacional sea genuina, sustentable y acumulativa. La capacidad de innovar, de apropiarse de rentas tecnológicas y de generar economı́as de escala dinámicas y sustentables explican las diferencias entre paı́ses en cuanto a PBI per cápita y distribución de la riqueza; y explican también el fenómeno de convergencia que se observa en la actualidad en cuanto la innovación ha cobrado importancia dentro de las naciones emergentes como puede apreciarse en el Gráfico 4. Los paı́ses emergentes han incrementado el gasto en investigación y desarrollo en relación a su producto mucho más fuertemente que los paı́ses industrializados intentando reducir la brecha tecnológica. Liderando esta tendencia aparece China donde la participación se multiplicó por 2,5 entre 1996 y 2007. Gráfico 4. Gasto en Investigación y Desarrollo en relación al PIB. Paı́ses seleccionados. Fuente: Ministerio de Ciencia, Tecnologı́a e Innovación Productiva, Argentina El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna 17 Los niveles de crecimiento y renta de los estados en una economı́a globalizada están determinados por su especialización internacional, y ésta a su vez depende de las caracterı́sticas de su estructura productiva, las decisiones empresarias y el entorno. Un crecimiento genuino sólo se producirá si el entramado industrial es capaz de absorber y generar tecnologı́a en un proceso de diversificación de la actividad industrial desde las tecnologı́as más simples a las más complejas, lo que no implica necesariamente un tipo particular de distribución sectorial de la producción sino la capacidad de mejorar la productividad y la complejidad tecnológica de cada uno de los sectores industriales existentes. El proceso de destrucción creativa lleva al desarrollo de nuevos productos y procesos empujando al crecimiento de las naciones. Sin embargo, el impacto de la innovación en el bienestar social de un paı́s puede ser positivo o negativo. Según Reinert, el progreso técnico puede conducir al desarrollo o puede acentuar el subdesarrollo. El avance tecnológico puede impactar en la sociedad a través de menores precios, menores salarios y, en consecuencia, un menor bienestar, asociado a desempleo, exclusión y deterioro de la distribución del ingreso (derrame clásico de la tecnologı́a); o puede generar el efecto contrario (mayores precios y mayores salarios) y el sector se beneficiará a través de un aumento en sus ingresos. El rumbo que tomará el desarrollo vendrá dado no sólo por las caracterı́sticas de la firma sino también por el entorno a nivel macro. Desde una perspectiva micro, una primera aproximación a la idea de innovación dentro de una empresa es el modelo lineal de innovación que se inicia con la investigación básica y finaliza con la implementación del nuevo proceso o la introducción al mercado del nuevo producto. Sin embargo, la realidad muestra que la innovación no es lineal sino más bien un proceso con mucha retroalimentación y repetitivo. Las decisiones de las firmas no vienen sólo de las invenciones cientı́fico técnicas, sino que a estas se le agrega la información proveniente de la demanda y las posibilidades reales de implementar el cambio. En otras palabras, ya que el proceso innovador depende de la capacidad de la firma de generar nuevo conocimiento, la firma deberá sumar a sus fuentes generadoras de conocimiento (internas y/o externas) vinculaciones con sus clientes y proveedores, más allá de las relaciones comerciales tradicionales. La innovación surge de la empresa, pero también se da en un contexto histórico, geográfico y socioeconómico determinado que agregan aún más información y conocimiento. De modo que también en este sentido valen las enseñanzas de Schumpeter en cuanto es el emprendedor quien incorpora nuevas combinaciones que son concebidas en su observación del medio en el cual su negocio se halla inmerso. A todo este proceso de innovación hay que ubicarlo dentro de la estrategia empresarial que determinará en qué momento del proceso de destrucción creativa ingresará la firma al mercado. Según Porter (1990), se puede distinguir una estrategia de lı́der o de diferenciación entre las empresas que entran al proceso en la etapa de introducción del producto (proceso), la estrategia de seguidor combinada en parte con una estrategia de diferenciación entre las que sigan con la imitación, y una estrategia de liderazgo en costos entre las que avanzan en la estandarización del producto y procesos. Dependiendo del objetivo que tenga y sus acciones, el derrame en el tejido social variará ası́ como lo harán la cantidad de esfuerzo que deba aportar y la demanda de capacidad a la que esté exigida. La trayectoria que vaya tomando la firma también tendrá consecuencia sobre los determinantes del cambio tecnológico, porque la selección, desarrollo 18 Revista de Administración, Finanzas y Economı́a y adaptación de la estrategia tendrán un efecto directo sobre la disponibilidad de la tecnologı́a. Según Pavitt (1984), otra forma de explicar la dinámica del cambio tecnológico es a partir de la pertenencia sectorial. En este enfoque la estrategia innovadora de la firma depende de las caracterı́sticas del sector y es entonces a nivel de la industria donde deben buscarse los patrones de conducta innovadora. Lall (1992) sigue esta lı́nea y explica la dinámica de acuerdo al grado de intensidad tecnológica de los sectores industriales medido a partir de los esfuerzos en I+D. Lo que falları́an en explicar son los diferentes niveles de conocimiento incorporado que se pueden encontrar en un mismo sector. Pero en todos estos planteos está presente la idea schumpeteriana de que existen firmas emprendedoras que toman la iniciativa en la implementación de cambios y firmas seguidoras que se apresuran a imitarlas para no quedar excluidas del mercado. Además, de la experiencia se sabe que las firmas innovadoras tienen menores probabilidades de desaparecer ante crisis económicas, son menores expulsoras de empleo cuando buscan sobrevivir y alcanzan mayores niveles de crecimiento de las ventas e inserción exportadora. Más aún, presentan mejores indicadores de desempeño y trayectoria que las firmas no innovadoras, e incrementos en la calidad y cantidad de los recursos humanos. Punto a favor de la proposición de Schumpeter al señalar que son los emprendedores quienes lideran el crecimiento de la economı́a. El efecto positivo de la innovación sobre la performance financiera, medida por el valor de mercado o el precio de las acciones, aparece como bastante robusto en la evidencia empı́rica, como discuten Blundell et al. (1999), Griliches (1984), Hall et al. (2005) y Toivanen et al. (2002). Existe también abundante literatura documentando los efectos de la innovación sobre el crecimiento y las ganancias de las firmas, aunque no exenta de ciertas ambigüedades. Geroski et al. (1993) encuentran un impacto positivo de las innovaciones exitosas de la firma sobre su margen de ganancias. Mientras que Geroski y Machin (1992) destacan la persistencia y significatividad de las diferencias en rentabilidad entre compañı́as innovadoras y no innovadoras. Por su parte, Freel (2000) argumenta que tales diferenciales dependen de factores como el tamaño de la firma y las caracterı́sticas de la industria. El trabajo de Adamou y Sasidharan (2007) encuentra que firmas con mayor ratio I+D a ventas crecen más rápido. Yasuda (2005) llega a un resultado análogo al estudiar el impacto de los gastos de innovación por empleado sobre el crecimiento de la compañı́a. Yang y Huang’s (2005), Foray et al. (2007) y Del Monte y Papagni (2003) arriban a las mismas conclusiones. En cambio, Hershmati y Lööf (2006) no encuentran impacto significativo de la innovación sobre el crecimiento de las ventas en una muestra de 930 firmas suizas. Almus y Nerlinger (1999) concluyen que el crecimiento de una firma es sólo afectado por su tamaño y edad, pero no por sus actividades de innovación. Además, las actividades de innovación aumentan la probabilidad de supervivencia de las firmas. Christensen et al. (1998) muestran que la combinación de estrategias tecnológicas y de mercado son predictores importantes de la probabilidad de supervivencia. Cefis y Marsili (2003) muestran que las firmas jóvenes y pequeñas son las más expuestas al riesgo de salida y, al mismo tiempo, las que más se benefician de las innovaciones para permanecer en el mercado. Por último, y a modo de conclusión y aplicación de estos conceptos, una mirada a la realidad argentina desde esta óptica. La historia económica argentina El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna 19 reciente ha estado signada por la incertidumbre y vulnerabilidad causadas por los recurrentes desequilibrios macroeconómicos. A la incertidumbre inherente al proceso de innovación hay que agregarle entonces la del entorno, y esto impacta directamente en los procesos de toma de decisiones de inversión. Los proyectos de innovación suelen ser de corto plazo para ser capaces de sostener la competitividad en los perı́odos de crecimiento y minimizar la exposición en caso de una nueva crisis. Además, las empresas enfrentan el inconveniente adicional de un mercado doméstico de reducido tamaño que limita las economı́as de escala que podrı́an obtenerse, desincentivando los gastos en innovación y promoviendo el gasto en tecnologı́a incorporada (productos de tecnologı́as anteriores a las existentes pero que ya fueron amortizadas en mercados desarrollados) sin esfuerzos endógenos de generación y apropiación de conocimiento. Esto se combina con una baja inserción internacional como muestra Porta (2007), de forma tal que los estándares de competencia del grueso de las firmas locales son justamente los del mercado local: gustos y preferencias de menor sofisticación relativa, baja demanda de conocimiento, bajo-medio poder adquisitivo y escala reducida. Paralelamente, las interacciones entre los entes públicos como el Sistema Nacional de Innovación (SNI), el Instituto Nacional de Tecnologı́a Industrial (INTI) y las universidades y las empresas están lejos de ser las de los paı́ses desarrollados, y están más asociados a vı́nculos rutinarios asociados al desarrollo de pruebas y ensayos y al cumplimiento de normas que a la búsqueda de nuevos productos y procesos como lo expresa Suárez (2007). 7. Conclusiones Schumpeter fue el primero en señalar que su teorı́a económica carecı́a de valor universal, del mismo modo que todas las teorı́as económicas carecen ya que sólo sirven para explicar un perı́odo histórico particular. Sin embargo, a casi un siglo de la primera edición de la “Teorı́a del Desenvolvimiento Económico” sus ideas gozan de una validez notable. Evidentemente el emprendedor que describe en el segundo capı́tulo de su obra no es idéntico al emprendedor actual, pero tiene muchos puntos en común. Se trata de un agente en búsqueda permanente de desafı́os impulsado no sólo por el beneficio económico, sino también por el reconocimiento de la sociedad y por una sensación de superioridad y liderazgo. En cuanto al modo de incorporar las nuevas combinaciones, seguramente en la actualidad a cada innovación le antecede un estudio mucho más minucioso, racional y menos intuitivo que en la Austria de principios del siglo XX. Sin embargo eso no implica que el talento natural para percibir oportunidades de negocio constituya un don inútil. Además en este trabajo se rescata la consistencia, en lı́neas generales, del pensamiento schumpeteriano durante más de cuarenta años, contrario a la tesis de obsolescencia que indica que existe un Schumpeter temprano europeo y un Schumpeter tardı́o americano con posiciones irreconciliables. El autor claramente vislumbró que el emprendedor tal y como lo habı́a descrito en su teorı́a se transformarı́a en un agente más racional en la medida que mayores herramientas técnicas estuvieran a su alcance. De ese modo el proceso de desarrollo se tornarı́a más burocrático y despersonalizado. Y esta apreciación aparece ya en la primera edición de la Teorı́a en 1911, treinta años antes de “Capitalismo, Socialismo y Democracia”, cuando la expone en profundidad. 20 Revista de Administración, Finanzas y Economı́a Por último se intenta mostrar cómo sus principios se hallan presentes no sólo en la escuela neo-schumpeteriana, sino también en el seno de la escuela neoclásica donde ha cobrado especial valor como componente de sustancia de los modelos de crecimiento endógeno, y en las teorı́as contemporáneas de innovación, competitividad y emprendedorismo. La principal conclusión de este trabajo es que Schumpeter estaba en lo correcto sólo a medias. Parte de su teorı́a efectivamente cayó en el olvido como él esperaba. Pero la mayor parte conserva una vigencia envidiable y se ha constituido en inspiración de economistas tan disı́miles que el propio Schumpeter se asombrarı́a de los efectos de su obra. 8. Referencias Adamou, A. y Sasidharan, S. (2007), “The Impact of R&D and FDI on Firm growth in Emerging-Developing Countries: Evidence from Indian Manufacturing Industries”, from SSRN: http://ssrn.com/abstract=987024 Aghion, P., Howitt, P., “A Model of Growth Through Creative Destruction”, Econometrica, Vol. 60, No. 2, 1992 Almus, M., y Nerlinger, E., “Growth of New Technology-Based Firms: Which Factors Matter?”, Small Business Economics, Vol. 13, 1999 Berumen, S., “El legado de Schumpeter al estudio de la administración de empresas”, Cuaderno de Difusión 12 (22), Real Academia de Ciencias Morales y Polı́ticas, Madrid, 2007 Berumen, S., “Una Aproximación a la Construcción del Pensamiento Neoschumpeteriano: Más allá del Debate entre Ortodoxos y Heterodoxos”, ICE N 845, España, 2008 Blundell, E., Griffith, R. y Van Reenen, J., “Market Share, Market Value and Innovation in a Panel of British Manufacturing Firms”, The Review of Economic Studies, Vol. 66, No. 3, 1999 Cefis, E. y Marsili, O., “Survivor: The Role of Innovation in Firms Survival”, 2003, Disponible en http://www.sussex.ac.uk/Units/spru/events/KP Conf 03/documents/Cefis Marsili.pdf Christensen, C., Suarez, F. y Utterback, J., “Strategies for Survival in FastChanging Industries”, Management Science, Vol. 44, 1998 Del Monte, A. y Papagni, E., “R&D and the Growth of Firms: Empirical Analysis of a Panel of Italian Firms”, Research Policy, Vol. 32, 2003 Dinopoulos, E., Sener, F., “New Directions in Schumpeterian Growth Theory”, en “Edgar Companion to Neo-Schumpeterian Economics”, Editado por Hanusch, H. y Pyka, A., Edward Elgar, Capı́tulo 42, Gran Bretaña, 2007 Foray, D., Hall, B. y Mairesse, J., “Pitfalls in Estimating the Returns to Corporate R&D Using Accounting Data”, Paper presented at the First European Conference on Knowledge for Growth, October 8-9, 2007 Freel, M., “Strategy and Structure in Innovative Manufacturing SMEs: The Case of an English Region”, Small Business Economics, Vol. 15, No. 1, 2000 Freeman, C., “The Economics of Industrial Innovation”, MIT Press, Cambridge, 1982 Fremman, C., “The Economics of Technical Change”, en “Trade, Growth and Economics”, Editado por Archibugi, D., Michie, J., Cambridge University Press, 1998 El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna 21 Geroski, P. y Machin, S., “Do Innovating Firms Outperform Non-Innovators?”, Business Strategy Review, Vol. 3, No. 2, 1992 Geroski, P., Machin, S. y Van Reenen, J., “The Profitability of Innovating Firms”, RAND Journal of Economics, Vol. 24, No. 2, 1993 Griliches, Z., “Market Value, R&D and Patents”, NBER Chapters in “R&D, Patents and Productivity”, pp. 249-252, 1984 Hall, B., Jaffe, A. y Trajtenberg, M., “Market Value and Patent Citations”, Rand Journal of Economics, Vol. 36, No. 1, 2005 Heshmati, A. y LööF, H., “Investment and Performance of Firms: Correlation or Causality?”, CESIS Electronic Working Paper Series, 2006 Howitt, P., “The Research Agenda: Peter Howitt on Schumpeterian Growth Theory”, Economic Dynamics Newsletter, Vol. 3, No. 2, 2002 Klein, B., “Dynamic Economics”, Harvard University Press, Cambridge, 1977 Kwasnicki, W., “Schumpeterian modeling”, Wroclaw University, Poland, 2003 Lall, S., “Technological Capabilities and Industrialization”, World Development, Vol. 20, N2, 1992 Langlois, R., “Schumpeter and the Obsolescence of the Entrepreneur”, Working Paper 2002-19, University of Connecticut, 2002 Nelson, R., Winter, S., “An Evolutionary Theory of Economic Change”, Belknap Press, Cambridge, 1982 Nelson, R., “The Moon and the Ghetto”, Norton, New York, 1977 Organización para la Cooperación y el Desarrollo Económico, “Manual de Oslo. Guı́a para la Recogida e Interpretación de Datos sobre Innovación”, Grupo Tragsa, España, 2005 Pavitt, K., “Sectorial Patterns of Technical Change: Towards a Taxonomy and a Theory”, Research Policy N 13, 1984 Porta, F., “Especialización Productiva e Inserción Internacional. Evidencias y Reflexiones sobre el Caso Argentino”, Documento presentado al PNUD, Proyecto FO/ARG/05/012, 2007 Porter, M., “The Competitive Advantage of Nations”, Free Press, New York, 1990 Perelman, M., “Schumpeter, David Wells and Creative Destruction”, The Journal of Economic Perspectives, Vol. 9, No. 3, 1995 Phillips, A., “Technology and Market Structure: A study of the Aircraft Industry”, D.C. Heath, Massachusetts, 1971 Schumpeter, J., “Capitalism, Socialism and Democracy”, Allen & Unwin, Gran Bretaña, 1976 Schumpeter, J., “History of Economic Analysis”, Editado por Schumpeter, E., Allen & Unwin, Gran Bretaña, 1954 Schumpeter, J., “Teor´ ia del Desenvolvimiento Económico”, Traducido por Prados Arrarte, J., Fondo de Cultura Económica, México, 1957 Suárez, D., “Dinámica Innovativa y Estructura de Vinculaciones en la Industria Manufacturera Argentina”, Ponencia presentada en ALTEC 2007, 2007 Swedberg, R., “Rebuilding Schumpeters Theory of Entrepreneurship”, Conference on Marshall, Schumpeter and Social Science, Hitotsubashi University, Japan, 2007 Toivanen, O., Stoneman, P. y Bosworth, D., “Innovation and the Market Value of UK Firms, 1989-1995”, Oxford Bulletin of Economics and Statistics, Vol. 64, 2002 22 Revista de Administración, Finanzas y Economı́a Winter, S., “Economic Natural Selection and the Theory of the Firm”, Yale Economic Essays, 4, 1964 Winter, S., “Toward a Neo-Schumpeterian Theory of the Firm”, Class at California Institute of Technology, California, 1967 Yang, C. y Huang, C., “R&D, Size and Firm Growth in Taiwans Electronics Industry”, Small Business Economics, Vol. 25, 2005 Yasuda, T. “Firm Growth, Size, Age and Behavior in Japanese Manufacturing”, Small Business Economics, Vol. 24, 2005 Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and Economics), vol. 5, núm. 1 (2011), pp. 23-32. Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores Linda Margarita Medina Herrera José Benito Dı́az Hernández ∗∗ ∗ Recibido 12 de agosto de 2010. Aceptado 22 de septiembre de 2010 Resumen En este artı́culo revisaremos las principales herramientas que permiten analizar las caracterı́sticas estadı́sticas y topológicas de redes financieras. Presentamos un caso de estudio en la Bolsa Mexicana de Valores que exhibe árboles dinámicos a lo largo de un periodo de 10 años y analiza los cambios importantes que han presentado los movimientos de las acciones, impactando la longitud, el centro de masa y los conglomerados (sectores económicos). Los sectores más importantes dentro de la red son el de construcción y el de telecomunicaciones. Abstract We review the main tools which allow for statistical and topological characterization of financial networks. We present a case study in the Mexican stock market (Bolsa Mexicana de Valores) displaying dynamic trees over a period of 10 years and analyzes the significant changes that have made the movements of the stock, impacting the length, center of mass and clusters (economic sectors). The construction and telecommunications sectors are the most important within the network. Clasificación JEL: E44, G13. Palabras clave: redes financieras, árboles dinámicos, portafolio, conglomerados. 1. Introducción El mercado mexicano de valores es uno de los más importantes en América Latina y uno de los diez grandes mercados emergentes, posee un número importante de compañı́as que han estado involucradas en fusiones y adquisiciones en todo el mundo y cada vez está más integrado con mercados de valores internacionales. Esto lo convierte en un interesante caso de estudio. Este artı́culo está enfocado en la Bolsa Mexicana de Valores (BMV). El objetivo principal es caracterizar la topologı́a y taxonomı́a de la red formada por las principales ∗ Departamento de Fı́sica y Matemáticas, Tecnológico de Monterrey, Campus Ciudad de México, Calle del Puente 222, Oficinas 1, Piso 2, Col. Ejidos de Huipulco, Del. Tlalpan, 14380 México, D.F., Teléfono +52(55)54832190, E-mail: [email protected]. ∗∗ EGADE, Tecnológico de Monterrey, Campus Ciudad de México, Calle del Puente 222, Oficinas 3, Piso 4, Col. Ejidos de Huipulco, Del. Tlalpan, 14380 México, D.F., E-mail: [email protected]. 24 Revista de Administración, Finanzas y Economı́a acciones que cotizan en la BMV. También estudiamos la estructura dinámica de las redes en la BMV, que nos da información relevante sobre las principales empresas y sectores. Calculamos el coeficiente β de dominio, conglomerados, centralidad, disparidad, nivel de ocupación y fortaleza, para cada vértice y analizamos el comportamiento de algunos conglomerados en el tiempo. Estos parámetros nos proveen información en cuanto a la heterogeneidad de la red y de cuáles sectores son más importantes. Empezando en el 2004 formamos ventanas móviles de un año (250 observaciones por empresa, aproximadamente). Estimamos los parámetros para las observaciones de enero-diciembre del 2004, enero-diciembre de 2005 y ası́ sucesivamente hasta diciembre de 2009. Además analizaremos una ventana especial para los datos correspondientes a la crisis de octubre del 2008 al febrero del 2010. Y el árbol total, correspondiente a los datos del 2004 al 2010. El estudio de las propiedades topológicas de las redes se ha convertido en un tema central en la teorı́a de redes. En particular, se ha mostrado que muchos sistemas naturales y sociales presentan propiedades estadı́sticas inesperadas de relaciones que conectan diferentes elementos del sistema y que no pueden ser descritas con gráficas aleatorias. Investigaciones recientes han mostrado que la teorı́a de redes tiene importantes aplicaciones en el análisis de mercados financieros. El conocimiento del comportamiento del mercado en el tiempo, permite minimizar el riesgo en los portafolios y diseñar mejores estrategias de inversión. Es por esto que la descripción de patrones en la bolsa ha llegado a ser un objetivo popular entre los investigadores en los últimos años. El desarrollo de la teorı́a de redes ha permitido revelar estos patrones de una manera muy sencilla y clara. Los trabajos fundamentales en redes financieras aparecen a finales de los ochenta, el concepto de grafos en el ambiente de mercados financieros fue introducido por Mantenga, Bonano y otros (1989) como un método para encontrar arreglos jerárquicos de acciones a través del estudio de conglomerados de compañı́as, usando las correlaciones de los rendimientos de las acciones. Bonano (2004) lo emplea para investigar no sólo las acciones de un portafolio, sino también ı́ndices financieros y volatilidad. Onnela, Chakraborti, Kaski y Kertész (2002) analizan árboles dinámicos, esto es, con ventanas en el tiempo, para mostrar que los activos del portafolio óptimo de Markowitz están prácticamente todo el tiempo en las ramas externas del árbol, los mismos autores (2003) usan el concepto de vértice central, eligen el nodo más fuertemente conectado del árbol y definen una medida importante, “el promedio del nivel de ocupación” que durante las caı́das del mercado aparece con un valor muy bajo. P. Hage, F. Harary (1995) emplean la noción de centralidad para analizar grafos en contextos no financieros. M. Barthélemy, A. Barrat, R. PastorSatorras (2005) realizan una revisión de las principales herramientas en el análisis de árboles financieros. Los artı́culos de Kim, D., and Jeong, H. (2005), Tabak, B. Serra, T. Cajueiro, D (2010) y Medina, L. Mansilla, R. (2007) muestran evidencia empı́rica de la importancia de los árboles de expansión en el análisis de los movimientos de los precios en mercados financieros. No hay evidencia clara de cómo los parámetros que caracterizan una red cambian en el tiempo. Muy pocas investigaciones de este tipo se refieren a mercados emergentes y es aquı́ donde esta investigación busca contribuir, caracterizando redes en la Bolsa mexicana de Valores y estudiando sus cambios en Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores 25 el tiempo. En la sección dos presentamos la definición de los parámetros que se usarán para analizar las redes. En la tercera sección presentamos los datos empı́ricos, los árboles dinámicos y las medidas que caracterizan a cada árbol y en la última sección está constituida por conclusiones y consideraciones finales. 2. Redes financieras Sea N el número de acciones con precio Pi (t) para el activo i en el tiempo t, con t = 0, 1, 2, .., T . Tomamos Si (t) como el logaritmo de los rendimientos de los activos Sit = ln(Pi (t)) − ln(Pi (t − 1)). Las entradas de la matriz de correlación las calculamos mediante la fórmula de Pearson: PT (Sit − S̄it )(Sjt − S̄jt ) ρij = qP t=1 PT T 2 2 t=1 (Sit − S̄it ) t=1 (Sjt − S̄jt ) donde S̄i es la media. p Para construir la red, usamos la distancia euclidiana di j = 2(1 − ρij ). Debido a que −1 ≤ ρij ≤ 1 se tiene que 0 ≤ dij ≤ 2. Note que si dos acciones están perfectamente correlacionadas (rij = 1) la distancia entre ellas es 0, y, si están “anticorrelacionadas” (rij = −1) su distancia es 2. El árbol de expansión es una gráfica de N objetos (vértices o nodos) unidos por N − 1 arcos que permiten ir de un vértice a cualquier otro. Si cada arco representa una distancia o costo, o en general si a cada arco se le asocia un peso (número real), la suma de los pesos de todos los lados de un árbol, será el peso total del árbol. Un árbol de expansión mı́nima es un árbol de expansión que minimiza el peso total del árbol. Emplearemos varias medidas para caracterizar las redes financieras. Con el objeto de estudiar la evolución de los parámetros de las redes en el tiempo, usaremos una ventana móvil de un año de datos, que nos permitirá estimar y comparar los parámetros a través de los años. Este acercamiento dinámico permitirá estudiar la evolución de la red en el tiempo. Revisaremos brevemente las diferentes medidas y parámetros que nos permitirán una primera caracterización estadı́stica de las redes. Peso: Las propiedades de una gráfica se pueden expresar a través de la matriz de adyacencia, cuyos elementos toman el valor de 1 si i está conectado con j y 0 en otro caso (con i,j = 1, , N donde N es el tamaño de la red). Los árboles con peso usualmente se describen por medio de la matriz wij que especifica el peso del arco que conecta el nodo i con el j. Si el vértice i no está conectado con el vértice j, entonces wij = 0. Grado del vértice: El grado del vértice i, ki , es el número de nodos que están conectados directamente al nodo i, esto es, el número de elementos que integran la vecindad de i, (V (i)). Fortaleza del vértice: Junto con el grado del vértice, una medida muy significativa de las propiedades de las redes en término de sus pesos se obtiene analizando la fortaleza del vértice si definida como si = Σj∈V (i)wij La fortaleza del vértice integra la información de su conectividad y de la importancia de los pesos de sus vértices conectados. 26 Revista de Administración, Finanzas y Economı́a Nivel del vértice: El nivel es la suma de los arcos que hay que pasar sobre el aŕbol para ir del vértice i al vértice j. Si i = j entonces vij = 0. Promedio de ocupación: Es importante caracterizar la forma en que se extienden los nodos en el árbol. Para ello, se define la cantidad “promedio de ocupación del vértice i” ası́: l(vi ) = N 1 X niv(vij ). N j=1 El nodo con promedio de ocupación más baja es el centro de masa del árbol. Un valor alto de l(vm )refleja una estructura de mercado muy fina, mientras que en el otro extremo valores bajos se asocian con crisis en el mercado. El vértice central: El vértice central vc es considerado como el padre de todos los vértices del árbol o también como la raı́z del mismo. Este se usa como punto de referencia en el árbol, contra el cual la posición de los demás vértices es relativa. Hay un poco de arbitrariedad en la elección del vértice central, sin embargo los siguientes criterios pueden ayudar a escoger al mejor candidato: i) El vértice de mayor grado. ii) El vértice de mayor peso. iii) El centro de masa. Centralidad: La centralidad de la gráfica nos permite comparar la centralidad del vértice central con la de los demás vértices. Si consideramos la distancia sobre el árbol de un vértice fijo k a cada vértice h en el árbol G y encontramos R = maxh∈G dG(k, h). Podemos considerar que el árbol est inmerso en un cı́rculo de radio R con centro en k. La centralidad es la curvatura del cı́rculo 1 C(k) = maxh∈G dG (k, h) El árbol con mayor curvatura es más central. Coeficiente del peso del conglomerado: Los conglomerados topológicos no tienen en cuenta el hecho de que algunas vecindades son más importantes que otras. Es por esto que se introduce una medida para los conglomerados que combina la información topológica con la distribución de los pesos del árbol. El coeficiente del peso del conglomerado se define como cw (i) = X wij + wih 1 aij aih ajh , si (ki − 1) 2 j,h esta medida tiene en cuenta cada tripla que se forma en la vecindad del vértice i. El factor de normalización si (ki − 1) asegura que 0 ≤ cw (i) ≤ 1 y que cw (i) recupere el coeficiente topológico del conglomerado cuando wij sea constante. Una de las aplicaciones importantes de los árboles se encuentra en la optimización de portafolios. La localización del activo con respecto al vértice central juega un papel importante a la hora de medir el riesgo y los rendimientos. Si rm y rM son los rendimientos mı́nimo y máximo de un portafolio P , respectivamente. El rendimiento esperado varı́a entre estos dos extremos, y se puede expresar como rP,θ = (1 − θ)rm + θrM Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores 27 donde 0 ≤ θ ≤ 1. Se define el promedio ponderado del portafolio de la siguiente manera: X lP (θ) = wi niv(vci ) i∈P PN donde i=1 wi = 1 y vc es el vértice central. Los activos que minimizan el riesgo de un portafolio se encuentran en las ramas exteriores del árbol, por lo tanto, se espera que árboles largos (con l grande) tengan mayor potencial de diversificación, esto es, la oportunidad del mercado financiero para eliminar un riesgo especı́fico del portafolio de riesgo mı́nimo. A medida que se incrementa θ hasta llegar a la unidad, el riesgo del portafolio en función del tiempo empieza prontamente a comportarse muy diferente del promedio de ocupación l. Consecuentemente, ya no es útil para describir la diversificación potencial del mercado. Sin embargo, emerge otro resultado interesante: el promedio ponderado del portafolio lp (θ) decrece cuando θ aumenta su valor. Esto significa que de todos los posibles portafolios de Markovitz, las acciones del portafolio de riesgo mı́nimo están localizadas lo más lejos posible del vértice central, y a medida que se mueve hacia portafolios con altos rendimientos esperados, las acciones incluidas en ese portafolio estarán localizadas cerca del vértice central. 3. Árboles empı́ricos Las series de tiempo que conforman la base de datos para este estudio están formadas por los precios de cierre diario de 68 empresas que cotizan en la BMV, en el periodo comprendido entre el 1/03/00 y el 2/23/10. Para la elección de las empresas y la longitud de la serie se tuvo en cuenta la bursatilidad, capitalización y mantenimiento de las mismas. La longitud final de las series es de 2553. Dentro de las 68 empresas seleccionadas para el estudio se encuentran representados todos los sectores económicos, las empresas elegidas tienen la mayor bursatilidad de cada sector y juntas representan más del 90% de participación en el IPC y el 100% del ı́ndice México (INMEX). Todas las acciones incluidas han permanecido activas en el periodo seleccionado para el estudio. Construimos la matriz de distancia a partir de los coeficientes de correlación y el árbol de expansión mı́nima usando el algoritmo de Kruskal. Calculamos las medidas presentadas en la sección 3 para cada vértice (acción) y analizamos el comportamiento de los sectores económicos. También estudiamos la evolución de las redes en el tiempo construyendo ocho árboles. Un árbol con los 2553 datos (del 2000 al 2010), seis árboles dinámicos para los años del 2004 al 2009 y un árbol correspondiente a la crisis del 2008 (con datos de octubre del 2008 a febrero del 2010). Calculamos todas las medidas en cada árbol y las promediamos por sector económico. La Tabla 1 muestra los cálculos obtenidos para el centro de masa, grado y fortaleza para las empresas que obtuvieron los mejores parámetros en cada año. Las empresas sombreadas fueron seleccionadas como el vértice central del año correspondiente. El vértice central del árbol completo es CEMEX siendo el vértice con mayor fortaleza en el tiempo, el vértice con grado más alto y una posición cercana al centro de masa. CEMEX, una de las empresas lı́deres en 28 Revista de Administración, Finanzas y Economı́a la rama de la construcción, tiene una de las participaciones más altas del IPC, siendo de alta bursatilidad. GEO, la compañı́a de vivienda más rentable en el sector de la construcción, aparece como vértice central en varias ventanas del tiempo: en el 2005 y en los años de crisis, finales del 2008 a principios del 2010. El 2005 es el año que exhibe el mayor promedio de ocupación, donde el árbol se despliega y el mercado muestra cierta recuperación y los conglomerados por sectores económicos se muestran más separados, permitiendo cierta diversificación. En los años de crisis, el vértice central puede mostrar el sector económico más afectado. Las empresas que aparecen en la tabla, disputándose el tı́tulo de vértice central son todas de alta bursatilidad, juntas aportan alrededor del 80% al IPC. Tabla 1. Vértice Central. América Móvil (AMX), la principal compañı́a de telecomunicaciones de América Latina, es la empresa con mayor fortaleza promedio, las empresas unidas a éste vértice tienen correlaciones altas, y permanecen muy cerca del vértice central, son empresas con altos rendimientos. En la figura 1 mostramos el promedio de ocupación, el cual oscila entre 3.16 y 4.28. El promedio de ocupación más bajo lo obtuvo el árbol correspondiente a la crisis económica que empezó en el 2008, mostrando que efectivamente hubo contracción en el mercado. El promedio de ocupación más alto corresponde al año 2005. El pico que apreciamos en el 2005 podrı́a ser explicado por algunas condiciones económicas presentes en ese año que favorecieron a la estabilidad financiera: se mantuvo la orientación a la prudencia fiscal y monetaria de la polı́tica económica. Las tasas de interés descendieron en la segunda parte del año y el tipo de cambio se apreció ligeramente en términos reales, lo que favoreció la baja de la inflación. En los años estudiados, las bolsas financieras americanas mostraron un promedio de ocupación entre 3 y 9.8, manteniéndose la mayorı́a del tiempo por encima de 4. El rango en el que oscila el promedio de ocupación de la BMV Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores 29 (3.16, 4.28) nos muestra que el mercado mexicano es aún un mercado en desarrollo, uno donde el comportamiento del sistema es todavı́a muy homogéneo. El árbol con mayor centralidad corresponde a los años de crisis, confirmando la contracción en el mercado, una centralidad alta representa un árbol sumergido en un cı́rculo pequeño, es por esto que el árbol muestra la pérdida de conglomerados por sectores económicos. Las ramas exteriores cerca de las interiores dificultan la clasificación de las empresas en cuanto al riesgo y los rendimientos. Figura 1. Variación del Promedio de ocupación en el tiempo. Figura 2. Variación de la centralidad en el tiempo. El árbol del 2005 (figura 3) tiene la centralidad más baja de todas las ventanas, muestra claramente las ramas exteriores del árbol (las acciones de riesgo mı́nimo) y los vecinos del vértice central (las acciones de mayor rendimiento). 30 Revista de Administración, Finanzas y Economı́a El árbol del 2005 es el que presenta coeficientes de peso de conglomerado más altos, obteniendo tres conglomerados importantes: el de la construcción con centro en GEO (figura 4), el de telecomunicaciones con centro en AMX y el de siderurgia y metalurgia con centro en SIMEC. Figura 3. Izquierda: Ventana Octubre 2008 - Enero 2010. Derecha: Ventana 2005. Figura 4. Conglomerado de construcción en el árbol 2005. A lo largo del tiempo sólo se conservan dos conglomerados: el de construcción con un coeficiente de peso de conglomerado tres veces mayor que el siguiente conglomerado, el de telecomunicaciones. Las empresas con mayores rendimientos son precisamente las que aparecen en la Tabla 1 y en las ramas exteriores se mantienen a lo largo del tiempo la hotelera POSADAS, el Grupo POCHTEC, dedicado a la producción y comercialización de productos quı́micos, HILASA y VASCONI. 4. Conclusiones El árbol de activos se puede ver como una poderosa herramienta en el análisis del movimiento de las acciones en la Bolsa Mexicana de Valores, pues aunque parece estar fuertemente reducido, contiene información esencial del mercado y se puede usar para añadir un juicio subjetivo al problema de optimización de un portafolio. La evidencia nos muestra que el mercado financiero mexicano forma conglomerados en el sector de la construcción y el de telecomunicaciones. Las Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores 31 ramas exteriores y los centros de los árboles permanecen estables en el tiempo, el mercado es homogéneo. Los árboles mostraron ligeras contracciones en la crisis y extensiones en el 2005. Las medidas de las redes sugieren que los sectores de construcción y telecomunicaciones son los sectores relativamente más importantes en los árboles con una gran influencia sobre los demás sectores. En este artı́culo mostramos que algunas caracterı́sticas de las redes cambian con el tiempo, más aún, la importancia relativa de sectores especı́ficos cambia. Investigaciones posteriores podrı́an explotar las medidas de los árboles para crear y analizar ı́ndices como el IPC, también está abierto el tema para comparar comportamientos de bolsas internacionalmente y de otros instrumentos financieros. 5. Referencias Batagelj, V. and Mrvar, A. (2005) Pajek. Program for Analysis and Visualization of Large Networks. Reference Manual. http://vlado.fmf.uni-lj.si/pub/networks/pajek/. Bonanno, G., Caldarelli, G., Lillo, F.,and Mantenga, R.N. (2002) Topology of correlation-based minimal spanning trees in real and model markets, Physical Review E 68 (2003) 046130. Bouchaud, J.P., and Potters, M. (2003) Theory of Financial Risks -from statistical physics to risk management-. 2ed. Cambridge University Press, Cambridge. C. Eom, G. Oh, Woo-Sung Jung, H. Jeong, S. Kim, Topological properties of stock networks based on minimal spanning tree and random matrix theory in financial time series, Physica A: Statistical Mechanics and its Applications 388 (2009) 900906. J. Saramaki, M. Kivela, J. Onnela, K. Kaski, J. Kertesz, Generalizations of the clustering coefficient to weighted complex networks, Physical Review E 75 (2007) 027105. Kim, D., and Jeong, H. (2005) Systematic analysis of group identification in stock markets. . e- print. http://xxx.lanl.gov/physics/0503076v1 Lee, W. (2000) Theory and methodology of tactical asset allocation. F.J. Fabozzi Associates, New Hope, Pennsylvania. M. Barthlemy, A. Barrat, R. Pastor-Satorras, A. Vespignani, Characterization and modeling of weighted networks, Physica A 346 (2005) 3443. Mantegna, R. (1998) Hierarchical Structure in Financial Markets. Eur. Phys. J. B, 11, 193-197. Mantegna, R., and Stanley, H.E. (2000) An Introduction to Econophysics correlations and complexity in finance. Cambridge University Press, Cambridge. Mantegna, R. et al. (2004) Networks of equities in financial markets. e-print http://xxx.lanl.gov/cond-mat/041300v1 Marsili, M. (2002) Dissecting financial markets: sectors and states. Quantitative Finance, 2, 297- 302. Medina, L. Mansilla, R. Un árbol de expansión mı́nima en la Bolsa Mexicana de Valores. Revista de Administración, Finanzas y Economa (Journal of Management, Finance and Economics) (2007) vol. 1, issue 2, pages 116-124 M. Tumminello, T. Aste, T. Di Matteo, R.N. Mantegna, Correlation based networks of equity returns sampled at different time horizons, EPJB 55 32 Revista de Administración, Finanzas y Economı́a (2007) 209217. Onnela, J.-P., Chakraborti, A., and Kaski, K. (2003) Dynamics of market correlations: Taxonomy and portfolio analysis, Physical Review E 68 056110. Onnela, J.-P., Chakraborti, A., and Kaski, K. (2003) Dynamic asset trees and black monday, Physica A: Statistical Mechanics and its Applications 324 247. P. Hage, F. Harary, Eccentricity and centrality in networks, Social Networks 17 (1995) 5763. Tabak, B. Serra, T. Cajueiro, D. Topological properties of stock market networks: The case of Brazil. Physica A 389 (2010) 3240-3249 Tumminello, M., Mateo, T., and Mantegna, R.N. (2005) A new tool for filtering information in complex systems. E-print http://xxx.lanl.gov/cond mat/0501335v1 V. Tola, F. Lillo, M. Gallegati, R.N. Mantegna, Cluster analysis for portfolio optimization, Journal of Economic Dynamics and Control 32 (2008) 235258. Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and Economics), vol. 5, núm. 1 (2011), pp. 33-49. Value at risk and return from the use of Bayesian methods for stress testing in a world asset allocation and the 2008-2009 crises Humberto Valencia Herrera ∗ Recibido 22 de julio de 2010. Aceptado 30 de septiembre de 2010 Resumen El rendimiento y el valor en riesgo de una propuesta asignación de activos obtenida usando métodos de carteras Bayesianas tipo Black-Litterman y Markowitz aplicado a una cartera mundial de ı́ndices es fuertemente dependiente del parámetro de escala de las distribuciones de retornos a priori. Sin embargo, el rendimiento y valor en riesgo observado con la cartera recomendada durante el perı́odo 2008 y 2010 es menos sensible a este parámetro. Abstract The return and value at risk return of a proposed asset allocation obtained using Black-Litterman and Markowitz Bayesian portfolio methods applied to a world portfolio of indexes is strongly dependent on the scale parameter of the prior return distribution. However, the observed mean and value at risk during the 2008 to 2010 period with the proposed allocation is relatively less sensible to this parameter. Clasificación JEL : G11, G15 Palabras clave: financial studies, international security markets, Black-Litterman model, Bayesian portfolio optimization 1. Introduction The 2008-2009 global financial crises has been described as the worst financial crises in the United States and many other countries after the great depression of 1929, which was characterized by negative information effects during the financial panic, which resulted in negative movements and contagion across funds [Jinjarak and Zheng, 2010], in particular, during September 2008 [Idier, ∗ Humberto Valencia-Herrera is finance research professor at Instituto Tecnológico y de Estudios Superiores de Monterrey, Campus México City. Email: [email protected]. Telephone: 52-55-54832241. Address: Office Building 3, 2nd Floor, Calle del Puente 222, Ejidos de Huipulco, México, D.F., 14380, México. I thank the comments received from an anonymous referee, the participants at the Banco de México Economic Research Seminar and the research assistance of Nayeli Carranco. Any remaining errors are the author’s responsability. 34 Revista de Administración, Finanzas y Economı́a 2011]. 1 The crises started in the debt market, but extended to other assets because funds could not be raised easily and quickly, which affected the fundamental values of many assets, which became separated from its real value. These distortions resulted in real consequences in the economy that affected many assets far from the toxic subprime mortgage assets, which were the root of the problem, Krishnamurthy [2010]. These effects not only were limited to the period of the financial crises. Hall [2010] discuses persistent adverse effects of a temporary crises that can have adverse effects on employment and output and they can be fell for many years after the crises, even after the financial crises subsided. Here, we propose to use two formulations to incorporate information in portfolio selection. Bayesian updating applied directly to the Markowitz [1952] optimization problem and the use of the views in the Black Litterman portfolio model to update information and to incorporate past information in the portfolio decision. In those frameworks, we explore how changes in the scale parameters of the prior portfolio distribution modify the asset allocation, the return, and the value at risk of the forecasted posterior portfolio distribution and the resulting ones in the 2008 to 2010 period. 1.1. Bayesian updating in the Markowitz optimization problem The mean variance portfolio optimization problem was initially proposed by Markowitz [1952], who showed the problem of an investor who minimizes his/her expected portfolio variance given a desired level of return. An alternative formulation is the problem of an investor who maximizes an expected utility function of future returns, E(U (RT +τ )), whose probability depends on an expected return vector µ, a covariance matrix Σ and the proportions invested on each asset, w, that add on to one, maxω E(U (ω0 RT +τ )) = maxω Z U (ω0 RT +τ )pT +τ (RT +τ |µ, Σ)dRT +τ (1) subject to ω0 1 = 1. The investor has an expected quadratic utility function of return a time T + τ of the form E(U (ω0 RT +τ )) = µp − A 2 σ 2 p (2) where A is the relative risk aversion coefficient, a measure of the rate at which the investor is willing to accept extra risk for a one unit increase in expected return. If there is uncertainty in the parameters, it can be accounted for using a Bayesian framework. If the next-period excess return data is RT +1 the predictive return density is 2 1 Jinjarak and Zheng [2010] shows contagion an negative feedback in emerging-market funds during the 2008-2009 period. Idier [2011] shows extreme volatility comovements during September 2008. 2 For a more extensive discussion, see Rachev et al. [2008] Value at risk and return from the use of Bayesian... p(RT +1 |R) ∝ p(RT +1 |µ, Σ)p(µ, Σ|R)dµdΣ, 35 (3) where R = return data available up to period T , a T × N matrix, p(µ, Σ|R) = joint posterior density of the two parameters of the multivariate normal distribution, p(RT +1 |µ, Σ) = multivariate normal density and ∝= proportional to. Substituting in (1), the predictive density of excess returns (3), the investor’s optimization problem becomes maxω E(U (ω0 RT +1 )) = maxω Z U (ω0 RT +1 )p(RT +1 |R)dRT +1 (4) subject to ω0 1 = 1. In this problem, the optimal weights depend on the expected return vector P µ eT +τ and the inverse of the expected covariance matrix T +τ : P−1 µ eT +τ ∗ ω = T +τ (5) A If the investor has informative beliefs about the mean vector and the covariance matrix of excess returns and they can be represented by conjugate priors, 3 the mean vector will be normal with mean η a variance covariance matrix (1/τ )Σ and the covariance matrix will be Wishart with parameters Ω and ν. The prior parameters τ and ν reflect the confidence that the investor has on the parameters η and Ω, respectively. The larger the τ and ν, the less confidence the investor has on those values, respectively, µ|Σ ∼ N (η, (1/τ )Σ) and Σ ∼ IW (Ω, ν). The predictive distribution of next-period excess return is a Student’s t distribution with mean and covariance parameters, respectively, e= Σ µ e= τ T η+ µ b T + τ) T + τ) T +1 Tτ 0 b Ω + (T + 1)Σ + (η − µ b)(η − µ b) T (ν + N − 1) T +τ The vector of optimal portfolio weights, ω∗ is a function of the forecasted e and is given by (5). The efficient mean, µ e and the forecasted variance matrix, Σ 3 In Bayesian probability theory, if the posterior distributions p(θ|x) are in the same family as the prior probability distribution p(θ), the prior and posterior are called conjugate distributions, and the prior is called a conjugate prior for the likelihood, see [Raiffa and Schlaifer, 1961]. The Gaussian family is conjugate to itself (or self-conjugate) with respect to a Gaussian likelihood function. If the likelihood function is Gaussian, a Gaussian prior over the mean ensures that the posterior distribution is also Gaussian. 36 Revista de Administración, Finanzas y Economı́a 0 frontier can by traced out by the optimal weights (µ∗p , σp∗ ) where µ∗p = ω∗ µ e and 2 ∗0 e ∗ σp = ω Σω , for varying values of the risk-aversion parameter A, in the relation (2). 1.2 Black Litterman optimization problem The Black and Litterman [1991, 1992] portfolio model (BL model, hereafter) is appealing for many investors because it can combine subjective information with objective one. The BL model is based on the Sharpe [1964] and Lintner [1965] Capital Asset Pricing Model, CAPM, hereafter. The model assumes that there is one risk factor that explains returns in equilibrium, the market return. 4 Numerous extensions have been made to the basic model, both in the industry and in the academics. See, for example, Martellini and Ziemann [2007], Nardari and Scruggs [2007], Giacometti et al. [2007], Zhou [2009], Bade et al. [2009], Meucci [2009], and Kooli and Selam [2010]. b assets, let us assume that If the asset universe (the market portfolio ) are N b the equilibrium risk premiums are the N ×1 vector R, R = Ra −Rf 1, where Ra b × 1 vector of market asset returns, 1 is a N b × 1 vector of ones, and Rf is is a N b the risk-free rate. If weq are the N ×1 vector of market capitalization weights of the resampling portfolio in BL, the market portfolio, and the CAPM holds, R is equal to β(Rm − Rf ), where Rm − Rf is the market risk premium, β is equal 2 b × 1 vector of asset betas and R0 weq is the market to cov(R, R0 weq )/σM is a N 2 2 0 return, and σM is the variance of the market return, that is, σM = weq Σweq , where Σ is the asset return covariance matrix. If the Sharpe ratio of the market portfolio is R = δΣweq , with δ equal to 2 (Rm − Rf )/σm , the vector of equilibrium risk premiums R can be written as R = δΣweq (6) After rearranging, we obtain weq = 1 −1 Σ R δ (7) and δ is the risk aversion parameter A of the relation (2). The market on average is expected to be in equilibrium, but at any point in time, the equilibrium can be perturbed by shocks. Therefore, the return will be µ = Ra +, where the N × vector includes the perturbations to the equilibrium, which we assume that they have a multivariate normal distribution and that the prior distribution of µ is given by µ ∼ N (Ra , τ Σ), that is, the prior covariance matrix of the mean is a scaled covariance matrix of the sampling distribution. The scale parameter τ can be interpreted as the uncertainty in the accuracy with which Ra can be estimated or the confidence that the analyst has on the CAPM. A small τ reflects high accuracy and confidence. 4 Even though the CAPM model has been strongly criticized in the literature, it is a useful approximation for the true market model. Further extensions are Fama and French [1993] and Carhart [1997], who extended the CAPM model, to account for other factors, to a multifactor market model, which better explains returns. Value at risk and return from the use of Bayesian... 37 Notice that the covariance matrix is a square symmetric matrix, and the inverse of a block symmetric square matrix can be written, see Jo et al. [2004], Bernstein [2005, p44-45], as AT A AT B Σ= BT A BT B = −1 (AT PB A)−1 −(AT PB A)−1 AT B(B T B)−1 T −1 T T −1 −(B PAB) B A(A A) (B T PA B)−1 (8) where PA = I − A(AT A)−1 AT and PB = I − B(B T B)−1 B T . If the blocks out of the main diagonal are close to zero, and PB is close to be the identity matrix, an allocation based on the first block will be the optimal allocation on b assets will be the the subset of those assets, that is, the allocation of the N allocation based on the N assets in the market, except for the omitted ones. b assets and the investor has K views on those If the analysis focuses on N b assets, let us denote the K × N matrix of views portfolios by P . Each row of the matrix P represents a view portfolio, where an element of P is nonzero if the corresponding asset is associated with the view and zero elsewhere. The K × 1 vector of expected returns on the view portfolios is given by Pµ . If the prior distribution of returns µ is normally distributed, the investor’s subjective views will be Pµ ∼ N (Q, Ω) = N (Pb , Ω), µ (9) M = ((τ Σ−1 + P 0 Ω−1 P )−1 ((τ Σ)−1 R + P 0 Ω−1 Q) (10) where µ b is the n b × 1 vector of the expected prior returns, which maps to the K × 1 vector of prior expected values Q of the views. The K × K covariance matrix reflects the uncertainty of the views under the prior distribution of the stress testing scenario. 5 After applying Bayes’ theorem to combine the objective information, from µ, and subjective information, from Pµ , the posterior distribution of the expected returns µwill be normal with mean and covariance, M and V , respectively: = ((τ Σ−1 + P 0 Ω−1 P )−1 ((τ Σ)−1 R + P 0 Ω−1 P µ b), where µ b is the estimate of expected returns implied by the views, and µ b = (P 0 P )−1 P 0 Q, V = ((τ Σ)−1 + P 0 Ω−1 P )−1 5 In Black and Litterman [1991], the degree of confidence that the investor has on the views is reflected in the diagonal elements of the prior covariance matrix Ω. 38 Revista de Administración, Finanzas y Economı́a b assets in a stress scenario If the returns and the covariance matrix of the N b assets of interest, P reflect the absolute views of the investor on each of the N will be an identity matrix, that is, P = I, and M = ((τ Σ)−1 + Ω−1 )−1 ((τ Σ)−1 Ra + Ω−1 µ b) (12) V = ((τ Σ)−1 + Ω−1 )−1 . The resulting covariance matrix is the inverse of the sum of the inverse of the covariance, multiplied by τ , and the inverse of the prior views covariance, that is, a kind of harmonic weighted average of the covariance matrix Ω and Σ. 1.2.1 The parameter τ in Black-Litterman If the market portfolio has mean expected return µ, the distribution of the vector µ − R is µ − R ∼ N (0, τ Σ) (13) where Σ is the covariance matrix of returns computed separately. The parameter τ can be interpreted as the remaining uncertainty in the sample data due to the perturbations , which it is usually assumed between 0 and 1. For example, Black and Litterman [1992] proposes to use a value close to zero, Satchell and Scowcroft [2000] proposes to use the value of one, and Rachev et al. [2008] proposes τ = 1/T , where T is the length of the sample in years. For purpose of measuring uncertainty, we use two measures: standard deviation and value at risk, VAR hereafter. We employ the delta-normal method, 6 which uses a mean-variance approximation of the VAR and a 99% VAR, following Basel Committee guidelines, which is the expected lost, in a 10 day period, with a 99% confidence interval. For purpose of analysis, we use a one √ million portfolio, so if σ is the daily standard deviation, the VAR is (2.33)( 10)(1, 000, 000). 2. Methodology We use data from the following stock exchange indices: the IPC from Mexico, the MERVAL from Argentina, the IPSA from Chile, the BOVESPA from Brazil, the IBEX 35 from Spain, the DAX from Germany, the FTSE from Great Britain, the KOSPI 20 from South Korea, the HSENG Index from Hong Kong, the IGBL from Peru, the IGBC from Colombia, the IBC from Venezuela and the SP500 from the United States. The data set was from Economatica, complemented with Yahoo Finance and Bloomberg. The exchange rate was obtained from central banks web sources, the Pacific Exchange Rate Service from the Sauder School of Business at the University of British Columbia, Canada and Economatica. We use daily closing prices from September 10th, 1993 to December 17th, 2010. Missing data was filled with previous closing prices. Each 6 The delta-normal method assumes independence of returns. If returns exhibit positive correlation in the short term, the delta-normal VAR can underestimate the true VAR. Value at risk and return from the use of Bayesian... 39 of the indexes was converted to US dollars with daily exchange rates. A total of 4,505 daily return observations were calculated based on weeks with five days. Table 1 shows basic statistics for the indexes and equivalent daily returns for the three month T Bill rates. 7 Figure 4 shows the daily risk premium, the difference between the daily index return and the daily T Bill return. During 2008-2010 period, there was an increase in volatility in almost all indexes; however, other previous periods also showed high volatility. In order to analyze previous volatility, we estimated the yearly standard deviation for each index and built up a equally weighted portfolio of all indexes. Figure 2 shows that the standard deviation decrease during 2008, 2009 and 2010 to 0.24, 0.18, and 0.14, respectively. However, the years 1997 and 1998 also showed high volatility, standard deviations of 0.13 and 0.16, respectively. If we focus on returns, in 1998 the return was below zero, -1.1%, but it is not comparable with the sharp decreases of 2000 to 2002, -19.7% -10.3%, and -17.8%, respectively, a period in which the volatility was not extremely high. The returns failed strongly in 2008, to -48.7%, to recover in 2009 and 2010, 50.2% and 15.6%, respectively, see Figure 3. The correlation between yearly returns and standard deviation is negative, -0.527. 2.1 Bayesian Markowitz portfolio updating For the Bayesian Markowitz portfolio exercise (BM, hereafter, we select the time period before 2008 as the pre-sample one of daily excess returns. The annualized daily returns of a equally weighted portfolio till 2007 was 11.82%, with a standard deviation of 0.1096 and a Sharpe ratio of 0.0667. 8 For stress testing purposes, the prior returns must correspond to a worst case scenario, that is, a period with high volatility and small returns. The year 1998 had relatively high volatility but it did not have sharp decreases in return. In contrast, in the year 2000, there was large return decreases, but the volatility was relatively small. Therefore, for stress testing purposes, we use the covariance matrix of the year 1998, as the prior covariance and the returns from the year 2000, as the prior returns. The parameters are as follows: a) The vector µ are the average daily excess returns till the year 2007. b) The covariance matrix Σ is the covariance matrix from the pre-sample period, till the year 2007. c) The parameter T is equal to 3,731, the number of daily excess returns in the pre-sample period, till the year 2007. d) The vector of prior returns η is equal to the observed mean daily excess returns during the year 2000. 7 The exchange rates have had episodes of overvaluation and undervaluation, which resulted in different return and VAR in United States dollars (USD) from the ones in native currencies. The average return of the indexes in USD was 12.7% and the average exchange rate yearly change was -4.2%, in the period of study. However, the exchange rates volatilities were lower than the stock markets volatilities, 11.4% and 29.3% average yearly standard deviation, respectively. 8 The Sharpe ratio shows the same pattern as the daily returns. The Sharpe ratio, proposed by Sharpe [1966] and redefined in Sharpe [1994], is the ratio between the expected risk premium and its standard deviation, E(Rt − Rft )/σ(Rt − Rft ). 40 Revista de Administración, Finanzas y Economı́a e) The parameter τ is equal to 261. The parameter is usually interpreted as the size of a hypothetical sample drawn from the prior distribution. Here, the number corresponds to the daily observations in a year on average. f) The covariance matrix Ω is equal to Σ̄(ν − N − 1) where Σ̄ is its sample counterpart, the covariance matrix from the excess return during the year 1998. 9 g)The parameter N is equal to 15, the number of assets. h)The parameter ν is 30, the degrees of freedom in the Wishart distribution and a large value to make the prior of Σ informative and reflect the confidence about Ω. 10 2.2. Black-Litterman updating In order to use BL as a stress testing tool, we consider the market from the presample period. Because, we did not have information for a world sample of stock indexes for the period, we took two approximations: the MSCI World Index (MSWO) and the ex-post optimal risky portfolio during the presample period (PRESAM), given the observed returns vector and covariance matrix. MSWO is a index of more than 1,500 stocks from 24 developed economies. The stock indexes here are an incomplete sample of stock indexes, slightly bias to emerging economies. The prior views were from the stress testing scenario, the 1998 covariance matrix and 2000 observed return. Given that there is not a consensus in the literature about the scale parameter τ , we analyze the forecast behavior as a function of it. 3. Analysis 3.1. Bayesian Markowitz updating The assumption of conjugate priors overstates the expected volatility, see Figure 4, which is larger than the one observed in the 2008-2010 period. However, the observed return in 2008 was lower than the expected return, which was comparable to the one in 2009. From Figure 4, the portfolio expected return and the 2008 observed one are increasing with τ , but the 2009 and 2010 observed returns are decreasing with τ . From Figure 5, the expected portfolio VAR is increasing with τ , but the 2008, 2009 and 2010 observed ones are smaller at 600, 570 and 510 days, respectively, using intervals of 30 days for estimation purposes. 3.2. Black Litterman updating The selection of the scale parameter τ can be critical for the resulting asset allocation. The optimum portfolio composition is highly dependent on it. For example, in the case of the MCWO benchmark, there is a large portfolio reallocation when τ changes from 0.1 to 0.15. As a result, the return and the risk incurred can change dramatically, see Figures 6 and 7. In the MCWO benchmark case and a small τ , the return and the VAR are small, the expected and 9 10 Given that Σ is distributed IW (Ω, ν),the prior mean of Σ̄ is Ω/(ν − N − 1). ν > N + 1. The Wishart distribution exists if Value at risk and return from the use of Bayesian... 41 the observed ones during the 2008-2010 period; even though, the expected and the observed ones in the year 2008 are larger than the ones in the years 2009 and 2010. This relation will change with τ larger than the critical point, the expected return and observed ones for 2008 will be larger than the 2009 and 2010 returns. At large τ , the return differences subside. Changes are also observed in the presample benchmark case at a critical point. There is also a large change in asset allocation; however, it happens when τ changes from 0.55 to 0.65. At this critical point, the VAR increases dramatically, then it subsides, see Figure 9. Before the critical point, the expected return and the observed one during 2008 were smaller than the observed ones during the years 2009 and 2010, see Figure 8. At the critical point, the relation changes and continues for a while: the expected return and the observed one during 2008 are smaller than the observed ones during the years 2009 and 2010. However, at large τ , the return differences between periods diminish and the expected return and the observed one in 2008 become smaller than the ones in 2009 and 2010. 3.3. Comparing methods Table 2 compares differences between the forecasted Sharpe ratio and the observed one in different years with a conservative τ , that is, in the Bayesian Markowitz method, at τ = 240 days, in BL, at τ close to zero (0.1 and 0.05, with the MCWO Index and the optimal portfolio in the presample period as benchmarks, respectively) or with τ equal to one. We observed that the most consistent forecast is with the MCWO Index as market and τ equal to 0.1. The forecast with the presample index as market was not as consistent during the 2008 and 2010 period. In BL, a small τ gave optimistic forecasts, the observed differences were always negative. A τ equal to one gave pessimistic forecasts, the observed differences were all positive. The BM method was not consistent, in 2008, it was optimistic and, in 2009 and 2010, it was pessimistic. 4. Conclusions Black Litterman portfolio optimization can be useful to obtain an asset allocation that it is little sensible to changes in the stock market if the benchmark is a stock index. If the stock market recovers, the Black Litterman allocation also recovers, but it also suffers in bad times. There are small differences in allocation, risks and rewards if the market proxy is the MSWO index or the presample ex-post optimal portfolio in the analysis of the 2008-2010 period. Bayesian updating with conjugate priors in a Markowitz model can overestimate the forecasted VAR. However, the resulting asset allocation can be useful to manage VAR and return as we observed during the 2008-2010 period with a buy and hold strategy. Bayesian Markowitz portfolio optimization and Black Litterman portfolio optimization are sensible to the scale parameter τ , particularly the last method mentioned. Black Litterman portfolio optimization shows strong changes in asset allocation close to a critical scale parameter value and jumps in VAR and return. This value can be small, as in the MSWO case. If BL is used, the selection of the scale parameter demands special care. 42 Revista de Administración, Finanzas y Economı́a 5. References Bade, Alexander, Gabriel Frahm, and Uwe Jaekel (2009). A general approach to bayesian portfolio optimization. Mathematical Methods of Operations Research, Vol. 70, No.2, pp. 337356. Bernstein, Dennis (2005). Matrix Mathematics. Princeton University Press. Black, Fischer and Robert Litterman (1991). Asset allocation: combining investor views with market equilibrium. Journal of Fixed Income, Vol. September, pp. 718. Black, Fisher and Robert Litterman (1992). Global portfolio optimization. Financial Analysts Journal,Vol. 48, No. 1, pp 16. Carhart, M. (1997). On the persistence in mutual fund performance. Journal of Finance,Vol. 52, No.1, pp. 5782. Fama, E. F. and K. R. French (1993). Common risk factors in the return of stocks and bonds. Journal of Financial Economics, Vol. 33, No. 1, pp. 356. Giacometti, Rosella, Marida Bertocchi, Svetlozar T. Rachev, and Frank J. Fabozzi (2007). Stable distributions in the Black-Litterman approach to asset allocation. Quantitative Finance, Vol. 7, No. 4, pp. 423433. Hall, Robert E. (2010). Why does the economy fall to pieces after a financial crisis? Journal of Economic Perspectives, Vol. 24, No. 4, pp. 320. Idier, Julien (2011). Long-term vs. short-term comovements in stock markets: the use of markov-switching multifractal models. European Journal of Finance, Vol. 17, No. 1, pp. 2748. Jinjarak, Yothin and Huanhuan Zheng (2010). Financial panic and emerging market funds. Applied Financial Economics, Vol. 20, No. 23, pp. 17931805. Jo, S., S. W. Kim, and T. J. Park (2004). Equally constrained affine projection algorithm,. In Conference Record of the Thirty-Eighth Asilomar Conference on Signals, Systems and Computers, Vol. 1, pp. 955959. Kooli, Maher and Margaux Selam (2010). Revisiting the Black-Litterman model: The case of hedge funds. Journal of Derivatives & Hedge Funds, Vol. 16, No. 1, pp. 7081. Krishnamurthy, Arvind (2010). How debt markets have malfunctioned in the crisis. Journal of Economic Perspectives, Vol. 24, No. 1, pp. 328. Lintner, J. (1965). The valuation of risky assets and the selection of risky investments in stock portfolios and capital budgets. Review of Economics and Statistics, Vol. 47, pp. 1337. Markowitz, Harry M. (1952). Portfolio selection. Journal of Finance, Vol. 7, pp. 7791. Martellini, Lionel and Volker Ziemann (2007). Extending Black-Litterman analysis beyond the mean-variance framework. Journal of Portfolio Management, Vol. 33, No. 4, pp. 3344. Meucci, Attilio (2009). Enhancing the Black and Litterman and related approaches: Views and stress-test on risk factors. Journal of Asset Management, Vol. 10, No. 2, pp. 8996. Nardari, F. and J.T. Scruggs (2007). Bayesian analysis of linear factor models with latent factors, multivariate stochastic volatility. Journal of Financial & Quantitative Analysis, Vol. 42, No. 4, pp. 857892. Value at risk and return from the use of Bayesian... 43 Svetlozar Rachev, John S.J. Hsu, Biliana S. Bagasheva, and Frank J. Fabozzi (2008). Bayesian Methods in Finance. John Wiley & Sons, Inc., Hoboken, New Jersey. Howard Raiffa and Robert Schlaifer (1961). Applied Statistical Decision Theory. Division of Research, Graduate School of Business Administration, Harvard University, Cambridge, Ma. Satchell and A. Scowcroft (2000). A demystification of the Black-Litterman model; managing quantitative and traditional portfolio construction. Journal of Asset Management, Vol. 1, No. 2, pp. 138150. Sharpe, William F. (1964). Capital asset prices: A theory of market equilibrium under conditions of risk. Journal of Finance, Vol. 19, pp. 425442. Sharpe,William F. (1966). Mutual fund performance. Journal of Business, Vol. 39, No. 1,pp. 119138. Sharpe, William F. (1994). The Sharpe ratio. Journal of Portfolio Management, Vol. 21, No. 1, pp. 4958. Zhou, Guofu (2009). Beyond Black-Litterman: Letting the data speak. Journal of Portfolio Management, Vol. 36, No. 1, pp. 3645. 44 Revista de Administración, Finanzas y Economı́a Value at risk and return from the use of Bayesian... 45 46 Revista de Administración, Finanzas y Economı́a Value at risk and return from the use of Bayesian... 47 48 Revista de Administración, Finanzas y Economı́a Value at risk and return from the use of Bayesian... 49 Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and Economics), vol. 5, núm. 1 (2011), pp. 50-64. Estimación del residual de un bono respaldado por hipotecas mediante un modelo de riesgo crédito: una comparación de resultados de la teorı́a de cópulas y el modelo IRB de Basilea II en datos del mercado hipotecario mexicano Arturo Cortés Aguilar ∗ Recibido 10 de agosto de 2010. Aceptado 12 de octubre de 2010 Resumen El residual en un bono respaldado por hipotecas, tiene impacto en la calificación de la emisión, por lo que debe reflejar el riesgo de crédito de la estructura financiera. Se propone el uso de un enfoque de riesgo crédito para su estimación como la pérdida no esperada de las hipotecas que respaldan al bono a través de la aplicación de la teorı́a de cópulas, se presenta la comparación de los resultados obtenidos de la cópula t-Student, cópula Normal, cópula Gumbel, del modelo de capital económico para cartera hipotecaria de Basilea II y del residual real del bono, mostrando que se obtienen estimaciones inferiores al aplicar los modelos de cópulas que el análisis de escenarios empleado en la definición del residual del bono. Abstract Residual tranche in a mortgage backed security is a determinant issue in its grade and it should show the credit risk profile. I propose residual tranche estimation in a credit risk view with the application of copula theory to calculate unexpected losses in the collateralized mortgages. The comparison of results between t-Student copula, Normal copula, Gumbel copula, Basel II economic capital model and the residual tranche in a Mexican MBS show that residual as economic capital estimated with copula implementation are less than the scenario analysis that had defined that tranche in the structure. Keywords: Mortgage backed security, credit risk, copula theory, Basel II. Clasificación JEL : G21, G32. Palabras clave: Bono respaldado por hipotecas, riesgo crédito, teorı́a de cópulas, Basilea II. ∗ Programa Doctoral en Ciencias Financieras. Tecnológico de Monterrey, Campus Ciudad de México. E-mail: artur [email protected]. Tel: 55282493. Estimación del residual de un bono respaldado por hipotecas... 51 1. Introducción En el mercado mexicano, el originador de los créditos hipotecarios recurre a la estrategia de bursatilización traspasando activos crediticios a un fideicomiso con la finalidad de obtener más recursos para generar nuevos préstamos, al respecto, los agentes estructuradores están enfocados en resolver el problema de la falta de liquidez de los originadores de los créditos hipotecarios, más que en establecer juicios respecto al uso óptimo del capital, si se considera a la misma estructura como una entidad financiera, resultando en residuales que pueden sobre o sub valorar el riesgo de crédito de la estructura de acuerdo a lo que reflejarı́a un modelo de estimación de pérdidas esperadas y no esperadas, derivado de este hecho, este trabajo de investigación tiene por objetivo mostrar que el uso de los modelos aquı́ empleados disminuyen el requerimiento de capital o residual de la estructura comparado con lo que se obtiene con el análisis de escenarios empleado en la práctica, el beneficio de esta disminución en la porción subordinada de la estructura permitirá un incremento en la porción de bonos emitidos. 2. Riesgo crédito en bonos respaldados por hipotecas Los originadores de créditos recurren a la venta de sus activos hipotecarios para la emisión de bonos y ası́ obtener recursos financieros y emplearlos para originar más créditos, dicho mercado ha sido el que más ha entrado en el negocio de la bursatilización. En una estructura de bursatilización, la porción que no forma parte de los bonos emitidos y constituye parte del capital del fideicomiso, funciona como una porción de seguro contra incumplimiento en los pagos de los créditos, esto significa que es la parte que absorbe las pérdidas y generalmente es posesión del cedente, esto quiere decir que como el cedente ya recibió el valor de los créditos al momento de la transferencia para la originación de nuevos créditos, con excepción de esa proporción, tiene un cambio en su exposición al riesgo crédito y este cambio se refleja en un menor requerimiento de capital en su balance general, sin embargo tiene la desventaja de tener un activo subordinado, el cual regresará a formar parte de su balance en el caso de que se cumplan las siguientes dos condiciones: los bonos emitidos deben estar completamente pagados y las pérdidas realizadas sean menores que el residual. El riesgo de incumplimiento de un bono respaldado por hipotecas resulta de una omisión de pagos del suficiente número de acreditados que impidan el cumplimiento del pago del cupón a los inversionistas, es decir, que la amortización de los créditos hipotecarios no es suficiente para afrontar el compromiso adquirido en la emisión del bono, este riesgo es absorbido por el residual y el papel que desempeña en la estructura impacta en la calificación del bono por lo que el residual debiera ser establecido por el riesgo crédito de los colaterales, comprometiendo los flujos de acuerdo a la subordinación definida siguiendo los criterios que marcarı́a un agente calificador para el efecto de un alto grado de inversión, en este negocio el originador que se queda con el residual, visto como un inversionista que compra una nota subordinada no calificada, estarı́a dispuesto a obtener el diferencial entre las pérdidas esperadas y las pérdidas realizadas o cero en el escenario extremo. Dentro de una institución financiera, este riesgo se cubre mediante una porción de capital que se mantiene de acuerdo a las pérdidas potenciales surgidas 52 Revista de Administración, Finanzas y Economı́a por los factores que afectan a las transacciones realizadas por las instituciones, esto es, la pérdida esperada (EL), la cual se puede considerar como una prima de riesgo 1 y está en función los siguientes tres factores: una porción de pérdida realizada que es determinada por la experiencia del originador del portafolio y que es conocida como pérdida dado que la contraparte incumplió (LGD), de la probabilidad de que la contraparte caiga en incumplimiento (P D) y de la exposición a un evento de incumplimiento (EAD), mientras que la cantidad de capital necesario para proteger o respaldar a un portafolio de créditos es un estimado de la máxima pérdida posible en una ventana de tiempo de un año a un determinado nivel de confianza menos la pérdida esperada, es decir, U Lα = (Qα EL), donde Qα es el α-cuantil de la distribución de pérdidas y U Lα es la pérdida no esperada. Básicamente, la noción de modelar el riesgo crédito, se debe a la necesidad de una protección contra pérdidas, esto es, la estimación de una prima por riesgo para cada crédito y administrarlas dentro de una cuenta interna llamada reservas por riesgo crédito, estas reservas tendrán la función de cubrir las pérdidas ocasionadas por incumplimiento en los créditos; en este sentido, el capital económico tiene la función de proporcionar cierta protección en los eventos en los que la estimación del riesgo crédito sea excedida por otra pérdida. En general, si en un portafolio de créditos se establece que ocurre una pérdida cuando el valor de los activos Xi de la contraparte cae por debajo de un umbral ui establecido, se tiene lo siguiente: pi = P [Xi < ui ] = N (ui )ui = N −1 [pi ] (1) Es decir, si se define que el evento de incumplimiento ocurre cuando el rendimiento de los activos del acreditado es menor a cierto umbral y además si se establece que este rendimiento está sujeto a riesgo sistemático y riesgo idiosincrásico o especı́fico, se puede establecer la siguiente relación: p √ Xi = ρY + 1 − ρZi (2) donde X representa a un conjunto de variables aleatorias con distribución conjunta normal estándar y correlaciones ρ e Y , y Z1 , Z2 , ..., Zn son variables normal estándar mutuamente independientes y se refieren a factores de riesgo común y riesgo especı́fico, respectivamente. √ √ Por lo tanto, el incumplimiento ocurre si ρY + 1 − ρZi < ui , equiva√ √ lentemente ρY + 1 − ρZi < N −1 [pi ], es decir, el incumplimiento ocurre si y sólo si: p √ Zi < (N −1 [pi ] − ρY )/ 1 − ρ (3) Considerando que Zi es una variable normal estándar, el evento de incumplimiento ocurre con probabilidad condicional: −1 √ N [pi ] − ρY √ pi (Y ) = P [Li = 1|Y ] = N (4) 1−ρ 1 Esto se debe a que la pérdida esperada, de acuerdo a los mejores estimados de las instituciones, puede ser equivalente a la misma cantidad de recursos que éstas mantienen como protección, es decir, como un seguro contra incumplimiento. Estimación del residual de un bono respaldado por hipotecas... 53 Estableciendo que para un portafolio con m créditos, la exposición total se incrementa a medida de que el número de individuos se incrementa y que cada exposición individual se diluye a medida de que el tamaño del portafolio tiende a infinito es suficiente para garantizar que en el lı́mite, la pérdida total del portafolio Lm y la esperanza condicional de la pérdida E[Lm |Y ] son iguales a.s. tal que: P limm→∞ (Lm − E[Lm |Y ]) = 0 = 1 (5) cuando m X EADi ↑ ∞ si m → ∞ (6) √ N −1 [pi ] − ρY √ → p(Y ) = N a.s. 1−ρ (7) i=1 Ası́ cuando m → ∞: Lm Ahora, si se tiene que P [L ≤ x] = P [p(Y ) ≤ x], se sigue que: P [L ≤ p(−qα (Y ))] = P [p(Y ) ≤ p(−qα (Y ))] = P [Y ≥ −qα (Y )] = P [−Y ≤ qα (Y )] donde Y ∼ N (0, 1) y qα es el α-cuantil de la distribución normal estándar. Por lo tanto, se tiene que: −1 √ N [pi ] − ρqα Y √ qα (L) = p(−qα (Y )) = N (8) 1−ρ De la expresión anterior se desprende el modelo de capital económico de Basilea II considerando la severidad de la pérdida (LGD) y la pérdida esperada como P ixLGD a un cuantil del 99.9%, teniendo ası́: 0.5 R K = LGD×N (1−R)−0.5 ×G(Pr )+ ×G(0.999) −Pr ×LGD (9) 1−R siendo K =requerimiento de capital Pr =probabilidad de incumplimiento X =exposición LGD =Pérdida dado que hubo incumplimiento o severidad de la pérdida R =Coeficiente de correlación, establecida en 0.15 para préstamos hipotecarios N (x) : Denota la función de distribución acumulativa Normal estándar. 54 Revista de Administración, Finanzas y Economı́a G(z) : Denota la función de distribución acumulativa inversa para una variable aleatoria Normal estándar. La expresión anterior proporciona como resultado el capital económico para cubrir pérdidas no esperadas, al percentil 99.9%. 3. Cópulas La teorı́a de cópulas es el fundamento de modelos de riesgo crédito tal como los basados en calificaciones internas (BIS, 2006) y otros modelos estructurales derivados del modelo de Merton (1974), (Vasicek 2002), sin embargo, una caracterı́stica principal de dichos modelos es el supuesto de un solo factor de riesgo sistemático (ASRF, por sus siglas en Inglés). Puesto que la estructura de dependencia que se trata de capturar a través del modelo de cópula Gaussiana, se obtiene de la correlación entre los activos de las entidades bajo estudio, surge la necesidad de retomar los fundamentos de esta teorı́a para extender a otros factores de riesgo cuando no es posible observar la variable de activos, más aún, cuando se desea considerar la existencia de eventos extremos, los cuales no pueden ser modelados bajo el escenario de normalidad. En varios campos de estudio, el uso de cópulas ha sido una herramienta muy útil para el análisis de dependencia entre vectores aleatorios que tienen una función de distribución conjunta, la cual está definida por las distribuciones marginales de cada uno de los vectores considerados, particularmente en riesgo crédito, los nuevos enfoques para valuación de activos financieros sujetos a riesgo de incumplimiento, han mostrado mejores resultados empleando cópulas para obtener la estructura de dependencia entre dos eventos de incumplimiento conjunto (Li, 2000) para la valuación de derivados de crédito, estimación del requerimiento de capital o pérdida no esperada (Gordy 2003) y para una colocación eficiente de capital mediante el estudio de la dependencia de ı́ndices de mercado (Cherubini y Luciano, 2000), entre otras aplicaciones. Una Cópula n-dimensional es una función de distribución multivariada con distribuciones marginales estándar C : [0, 1]d → [0, 1], es decir, una función de n dimensiones que mapea desde el cubo unitario de n dimensiones al intervalo unitario y que está caracterizada por las siguientes tres propiedades: 1. C(u1 , u2 , ..., ud) es creciente en cada componente ui . 2. C(1, ..., 1, ui, 1, ...1) = ui para cada i ∈ {1, 2, .., d} y ui ∈ [0, 1]. 3. Para cualesquiera (a1 , a2 , ..., ad), (b1 , b2 , ..., bd) ∈ [0, 1]d con ai ≤ bi se tiene: 2 2 X X ... (−1)i1 +i2 +...+id C(u1i1 , udid , ..., udid ≥ 0 i1 i1 con uj1 = aj y uj2 = bj para todo j ∈ {1, 2, .., d}. Ası́, si se supone un vector aleatorio X = (X1 , X2 , .., Xd)0 con distribución conjunta F y marginales continuas F1 , F2 , ..., Fd aplicando una transformación adecuada se obtiene un vector de la forma (F (X1 ), F (X2 ), ..., F (Xd)) cuya función de distribución es por definición una cópula, la cual se denota por C, lo anterior queda establecido mediante el teorema de Sklar (Nelsen, 2006). Teorema de Sklar. Sea H una función de distribución n-dimensional con marginales F1 , F2 , ..., Fn, entonces existe una cópula C n-dimensional tal que para todo x ∈ Rn , Estimación del residual de un bono respaldado por hipotecas... H(x1 , x2 , ..., xn) = C(F1 (x1 ), F2 (x2 ), ..., Fn(xn )) 55 (10) Si F1 , F2 , ..., Fn son continuas, entonces C es única, de lo contrario C está definida únicamente sobre Ran F1 × Ran F2 × ... × Ran Fn . Recı́procamente, si C es una cópula n-dimensional y F1 , F2 , ..., Fn son funciones de distribución, entonces la función H definida en (10) es una función de distribución n-dimensional con marginales F1 , F2 , ..., Fn. 3.1 Cópula t-Student Ésta Cópula es estudiada con gran detalle en Demarta y Mcneil (2004) donde se definen algunas variantes importantes como la cópula t-Student agrupada y la de valores extremos, esto debido a la habilidad de la cópula t de capturar mejor el fenómeno de dependencia de valores extremos, la cópula t-Student está definida mediante la expresión (11): −1 t Cv,P (u1 , u2 , ..., ud) = tv,P (t−1 v (u1 ), ..., tv (ud )) (11) En la expresión (11) anterior, t−1 v es la inversa de la distribución t-Student univariada o función de cuantiles, mientras que tv,P es la distribución t-Student multivariada con v grados de libertad, media cero y matriz de correlaciones P , la cual se define como: td (v, 0, P ) = Z t−1 v (u1 ) ... −∞ Z t−1 v (ud ) −∞ Γ( v+d 2 ) Γ( v2 ) v+d 2 X 0 P −1 X 1+ dX v (12) donde X = (X1 , X2 , ..., Xd)0 es un vector aleatorio de mezcla normal en varianza definido como: √ Xd = µ + W Z (13) donde Z ∼ Nd (0, Σ), W es independiente de Z y satisface v/W ∼ χ2v , equivalentemente W tiene distribución gamma inversa W ∼ Ig (v/2, v/2). Para el caso particular de dos factores de riesgo o dos variables aleatorias de interés con distribuciones marginales t-Student, la cópula t-Student bidimensional, está definida mediante la distribución t-Student bivariada: t C (u; θ) = Z tθ1 (u1 ) −∞ Z tθ2 (u2 ) −∞ −θ12+2 (1 − θ22 )−1/2 s2 − 2θ2 st + t2 1+ dsdt (14) 2π v(1 − θ22 ) donde u = (u1 , u2 ), θ = (θ1 , θ2 ) y θ1 son los grados de libertad, el cual controla el peso de la cola y si θ1 → ∞, C t (u1 , u2; θ1 , θ2 ) → ΦN (u1 , u2 ; θ2 ), θ2 es el parámetro de dependencia o correlación. 56 Revista de Administración, Finanzas y Economı́a 3.2 Cópula Normal Una de las cópulas más usadas en finanzas es la cópula normal, el modelo de calificaciones internas de BASILEA II (BIS, 2006) se fundamenta en el supuesto de un solo factor de riesgo sistemático (ASRF por sus siglas en inglés), mismo que se distribuye normal con media cero y varianza uno. La cópula normal se define como: −1 −1 CPn (u1 , u2 , ..., ud) = ΦP (Φ−1 P (u1 ), ΦP (u2 ), ..., ΦP (ud )) (15) donde Φ es la distribución normal multivariada estándar, Φ−1 la distribución normal univariada estándar inversa, P es la matriz de correlaciones con 1 en la diagonal y ρ (la correlación del vector ui fuera de la diagonal, ası́ para el caso bivariado, la expresión (15) toma la forma siguiente: t C (u1 , u2 ) = Z Φ−1 (u1 ) −∞ Z Φ−1 (u2) −∞ x2 − 2ρxy + y2 exp − dxdy (16) 2(1 − ρ2 ) 1 − ρ2 1 2π p 3.3 Cópula Gumbel La cópula Gumbel es la más común de las cópulas de valores extremos y está definida mediante la expresión: CαG(u1 , u2 ) 1/α α α = exp − (ln(u1 )) + (ln(u2 ) ) (17) para α ∈ [1, +∞]. El parámetro α controla el grado de dependencia y cuando es igual a uno, la dependencia no existe, si α = +∞ hay dependencia perfecta. 3.4 Cópula empı́rica Las cópulas empı́ricas son empleadas para realizar pruebas de independencia no paramétricas y para la estimación no paramétrica de cópulas. Sean u1 ≤ u2 ≤ ... ≤ un y v1 ≤ v2 ≤ ... ≤ vn los estadı́sticos de orden de muestras univariadas de la cópula C, la cópula empı́rica Ĉ se define en los puntos (i/n, j/n) por: n i j 1X Ĉ , = I{uk ≤ui ,vk ≤vj } (18) n n n k=1 para i, j = 1, 2, ..., n. Ası́ mismo, Ĉ converge uniformemente a C, cuando el tamaño de la muestra tiende a infinito. La cópula empı́rica de frecuencia ĉ está dada por la siguiente expresión: 1 i j si (ui , vi ) son elementos de la muestra ĉ , = n (19) n n 0 en cualquier otro caso Estimación del residual de un bono respaldado por hipotecas... 57 4. Resultados Se analiza un bono respaldado por hipotecas a través de la aplicación del modelo de calificaciones internas básico (BIS, 2006) y la teorı́a de cópulas a los créditos hipotecarios que respaldan dicha estructura financiera, estimando el residual mediante un nivel de capital económico (U Lα ) resultado de ambos modelos. Para estimar los parámetros de riesgo crédito del portafolio, éste se segmentó mediante la técnica de árboles de segmentación basados en pruebas χ2 (CHAID), para esto se consideró la razón valor de la garantı́a a monto financiado (LT V ) en el momento de la originación del crédito y de acuerdo con Kaskowitz et al (2002), se consideró una ventana de 5 años para observar el incumplimiento, mismo que ocurre si los créditos que tenı́an un atraso igual o menor a 3 meses al inicio del periodo de observación, al final de 5 años tienen más de tres meses de atraso, esta segmentación se realizó en el paquete estadı́stico SPSS y los grupos resultantes se muestran en el cuadro 1. Cuadro 1. Grupos y probabilidad de incumplimiento resultado de la prueba CHAID. Posterior a la segmentación, se construyeron las curvas de tasas de incumplimiento históricas por grupo, considerando el incumplimiento con atraso en el pago mayor a 3 meses en un año, esta estimación es consistente con la probabilidad de incumplimiento anual que se obtiene en los métodos de calificaciones internas. En la práctica, el indicador de incumplimiento es 3 pagos atrasados o más, en el caso especı́fico de este trabajo, se empleará superior a 3 considerando un mayor periodo de observación antes de definir a un crédito con estatus de incumplimiento. Ası́, el incumplimiento está definido por: Îit = n X 1Dit (20) i=1 donde 1Dit = 1 si atraso mayor a 3 meses 0 si atraso menor a tres meses (21) Dado lo anterior, la tasa de incumplimiento está definida como la razón de incumplimientos a total de observaciones de acuerdo a lo siguiente: 58 Revista de Administración, Finanzas y Economı́a T it = Iˆit Nt (22) donde Tit es la tasa de incumplimiento observada en el periodo t y Nt el número total de créditos hipotecarios (vigentes y vencidos). La composición de la estructura de bursatilización se muestra en el cuadro 2, la primera estimación se realizó mediante simulación histórica de las pérdidas obteniéndose la pérdida esperada, pérdida no esperada, α-cuantil y déficit esperado (P E, U Lα , Qα , ESα respectivamente) en lo que respecta al U Lα , α-cuantil y al ESα , se obtuvieron para α = 99.9% que es el equivalente a la calificación BBB en escala global de un bono y también a manera de comparación se presentan valores de 99% y 99.5%, el residual va a estar definido mediante el resultado del α-cuantil menos la pérdida esperada, dado que la tasa activa 2 de un crédito incluye la estimación de este tipo de pérdida como un costo a ser cubierto, este resultado es el concepto de capital económico, estos resultados se muestran en el cuadro 3. Cuadro 2. Composición actual de la estructura de bursatilización. * La exposición es la proporción del saldo del grupo respecto al total. Dentro del enfoque regulatorio y de mejores prácticas bancarias, la correlación en el modelo de Basilea II es un parámetro exógeno establecido, para el caso de créditos hipotecarios este valor es 0.15 y la probabilidad de incumplimiento se puede obtener mediante un modelo que asigne una calificación o probabilidad de acuerdo a ciertas caracterı́sticas de segmentación, la severidad de la pérdida puede ser obtenido también mediante un modelo estadı́stico o puede considerarse como un parámetro establecido de acuerdo a si se trabajará bajo el enfoque avanzado o estándar, respectivamente. En este caso, se empleará la probabilidad promedio de cada grupo de segmentación como insumo para el modelo de capital económico; la severidad se considera un parámetro constante en 50%. Adicionalmente, se incrementa el supuesto de correlación entre incumplimientos para obtener una estimación más severa de la pérdida no esperada, es decir, se prueba con una correlación de 0.20 para probar los resultados del modelo con el supuesto del 0.15. 2 En términos generales, la tasa activa podrı́a definirse como la tasa de interés que cobra una institución al financiar a una contraparte, la cual incluye el costo de financiamiento de la institución, el riesgo crédito, un margen financiero, entre otros conceptos. Estimación del residual de un bono respaldado por hipotecas... 59 Cuadro 3. Resultados de la simulación histórica. Cuadro 4. Parámetros para la expresión (1) *El nombre del escenario no tiene relación con calificaciones crediticias. Los resultados del modelo de BASILEA II de acuerdo a los parámetros del cuadro 4, son mostrados en el cuadro 5, para el escenario KB1 significan el empleo de una probabilidad promedio a 5 años resultado del cuadro 1 y una correlación de 0.20, mostrando que la estimación del capital económico bajo estos supuestos es mayor que con los parámetros establecidos del modelo de Basilea II (expresión (9)) para un cuantil del 99.9%, el valor resultante del promedio ponderado por exposición de cada grupo de riesgo es de 23.3% menor que el bono bajo análisis que fue emitido con un residual igual al 27.9% de toda la estructura, el cual está respaldado por hipotecas a 30 años y formado por un tramo senior, un tramo subordinado y el residual que tiene la menor subordinación en la estructura. Cuadro 5. Estimación del residual por el modelo de Basilea II, expresión (1) con parámetros de acuerdo al cuadro 4. El análisis siguiente que se presenta, se desarrolló con el sistema estadı́stico de libre acceso R (Develompent Core Team, 2010), empleando el paquete cópula (Kojadinovic y Yan 2010) y de acuerdo a la teorı́a expuesta en la sección 3, 60 Revista de Administración, Finanzas y Economı́a se tiene como primer caso la estimación paramétrica de la cópula t-Student bivariada, que como ya se comentó en dicho apartado, supone que las marginales univariadas son t-Student con v grados de libertad, por lo que es preciso estimar los parámetros de la cópula (α) y de las marginales (β) de la expresión (14), partiendo de la misma, la expresión de log-verosimilitud es la siguiente: l(θ) = log(c(t1 (Xi , β), t2 (Xi , β); α) + n X 2 X log(tj (Xi , β)) (23) i=1 j=1 donde θ(β T , αT )T es el vector de parámetros a ser estimados y el estimador de máxima verosimilitud está dado por θ̂M L = arg maxθ∈Θ l(θ). Figura 1. Panel de grupos de Ti y EAD. Densidades de las cópulas ajustadas. La estimación de los parámetros de las cópulas y las marginales es un proceso numérico complicado si se quiere llevar a cabo en un solo paso, por lo que se implementó máxima verosimilitud en dos etapas, es decir primero se estiman los parámetros de las marginales t-Student y en una segunda etapa se estiman los parámetros de la cópula t-Student bivariada para los 5 pares de variables Ti y EAD, las densidades de las cópulas ajustadas se muestran en la figura 1, misma que muestra colas más pesadas para la cópula del par Ti y EAD que representa al total del portafolio de créditos hipotecarios (grupo Total). Teniendo ajustada la cópula a los datos, se procede a simular las pérdidas históricas y a obtener la pérdida esperada (P E), pérdida no esperada (U Lα ), Estimación del residual de un bono respaldado por hipotecas... 61 para cada uno de los pares de variables T ii , EADi de acuerdo a lo visto en la sección 3. Estos valores se estimaron para los cuantiles 95% que es el cuantil al que se define el V aR, al 99.9% que es la probabilidad a la cual se asigna la calificación BBB en escala global a un bono, también a manera de comparación se consideran 99% y 99.5%. Cuadro 6. Pérdida esperada para los grupos de Ti y EAD y pérdida no esperada a diferentes cuantiles para la cópula t-Student paramétrica. Como segundo caso, se lleva a cabo la estimación semi-paramétricamente de las cópulas t-Student, Normal y Gumbel, de acuerdo con Neelsen (1999) y Genests y Favre (2007), dentro del análisis de cópulas se presenta el problema de subestimación de las marginales ajustadas a los datos bajo estudio, este problema se minimiza empleando la distribución empı́rica de las marginales, obteniendo con esto la cópula empı́rica la cual está definida de acuerdo a la expresión (18), este análisis se refiere a la estimación no paramétrica de cópulas que de acuerdo a la sección III, dada la continuidad del par de vectores aleatorios (X, Y ), existe una única cópula asociada a dicho vector la cual es invariante bajo transformaciones monótonas no decrecientes de las marginales, es decir, Ĉ(i/n, j/n) → C(X, Y ) cuando n → ∞, ası́ la dependencia entre Ĉ es capturada por la cópula empı́rica como la mejor representación muestral de la cópula teórica C. En este sentido, se desarrolla el siguiente análisis mediante la estimación no paramétrica de las marginales y parámetrica para las cópulas t-Student, normal y Gumbel a los vectores (T i,EAD). Cuadro 7. Pérdida esperada para los grupos de Ti y EAD y pérdida no esperada a diferentes cuantiles para la cópula t-Student semi-paramétrica. 62 Revista de Administración, Finanzas y Economı́a Cuadro 8. Pérdida esperada para los grupos de Ti y EAD y pérdida no esperada a diferentes cuantiles para la cópula Normal semi-paramétrica. Cuadro 9. Pérdida esperada para los grupos de Ti y EAD y pérdida no esperada a diferentes cuantiles para la cópula Gumbel semi-paramétrica. Definiendo al residual como el resultado de los modelos analizados para un cuantil del 99.9% para el caso de las cópulas (U L0.999 ), se obtiene un nivel inferior al residual real con el que se emitió la estructura de bursatilización que fue del 27.9%, éste comparativo puede observarse en el cuadro 10, donde los resultados para las cópulas, son una ponderación entre los niveles de U L0.999 de los cuadros 6 a 9 y el cuadro 2, estos resultados son ligeramente mayores y por consiguiente más conservadores que los resultados obtenidos por el modelo de calificaciones internas (BIS 2006), cuyo valor máximo fue de 23.3%. Se notará que para el caso de las cópulas el resultado no tiene gran variación, esto indica que los parámetros de riesgo considerados son poco sensibles respecto a la cópula empleada. Cuadro 10. Comparativo de estimaciones. Estimación del residual de un bono respaldado por hipotecas... 63 5. Conclusiones Los resultados obtenidos muestran que las estimaciones basadas en el modelo de Basilea II y Cópulas son inferiores al residual real con el que fue emitida la estructura y que fue estimado mediante análisis de escenarios, esto sugiere que el empleo del modelo de la agencia calificadora pudiera sobreestimar el riesgo crédito de la estructura, por lo tanto se considera importante señalar que el uso de modelos estadı́sticos como los empleados en esta investigación, permiten disminuir el tamaño del residual o requerimiento de capital empleando un nivel de confianza de 99.9%, obteniendo aún ası́una sobrecolateralización que proporcione un desempeño satisfactorio de la estructura, ya que los modelos que se emplearon en el presente trabajo, utilizan variables estadı́sticas que reflejan el riesgo crédito de los activos subyacentes de los bonos respaldados por hipotecas. Una caracterı́stica adicional a analizar es el plazo legal del bono el cual es superior a los 25 años y la estrategia de realizar pagos anticipados al principal en los casos donde se presentan excesos de flujos posteriores al pago de los respectivos cupones, disminuye significativamente el plazo de la estructura que de acuerdo a las caracterı́sticas del escenario base de la proyección de su amortización, puede llegar a ser hasta de 10 años generando un riesgo de prepago, que se presenta al amortizar anticipadamente el principal del bono cuando las tasas de reinversión en el mercado son inferiores a la que paga dicho instrumento financiero. Esta particularidad disminuye el riesgo de crédito del bono respaldado por hipotecas, ya que al amortizar anticipadamente las obligaciones del fideicomiso, disminuye la exposición que éste tiene ante un eventual incremento de la tasa de incumplimiento de los activos subyacentes de la estructura en el futuro, éste efecto de prepago y su efecto en el residual, no se ha analizado a profundidad de lo que se puede desprender una investigación posterior. 6. Referencias Artzner, P.; Delbaen, F.; Eber, J. M.; Heat, D. 1999. Coherent measures of risk. Mathematical Finance. Bank for International Settlement (BIS). 2006. International convergence of capital measurement and capital standards. Basel Committee on Banking Supervision. Cherubini, U; Luciano, E. 2000. Value at risk trade-off and capital allocation with copulas. Turin. Davidson, Andrew; Sanders, Anthony; Wolff, Lan-Ling; Ching, Anne. 2003. Securitization: Structuring and investment analysis. Wiley. Demarta, Stefano; McNeil, Alexander J. 2004. The t copula and related copulas. Department of Mathematics ETHZ Zürich. Frey, Rüdiger; McNeil, Alexander J. 2002. Var and expected shortfall in portfolios of dependent credit risks: conceptual and practical insights. Frey, Rüdiger; McNeil, Alexander J. 2001. Modeling dependent defaults. Genest, Christian; Favre, Anne-Catherine. 2007. Everything you always wanted to know about copula modeling but were afraid to ask. Journal of Hydrologic Engineering. Pag 347-368. Gordy, Michael B. 2003. A risk-factor model foundation for ratings-based bank capital rules. Journal of Financial Intermediation. Pag. 199-232. 64 Revista de Administración, Finanzas y Economı́a Kojadinovic, Ivan, Yan, Jun. (2010). Modeling multivariate distributions with continuous margins using the copula r package. Journal of Statistical Software, 34(9), 1-20. URL http://www.jstatsoft.org/v34/i09/. Kraskowitz, David; Kipkalov, Alexander; Lundstedt, Kyle; Mongo, John. 2002. Best practices in mortgage default risk measurement and economic capital. Washington Mutual Inc. Li, David X. 2000. On default correlation: a copula function approach. The RiskMetrics Group. Merton, Robert C. 1974. On the pricing of corporate debt: the risk structure of interest rates. Journal of Finance. Pag. 449-470. Nelsen, Roger B. 1999. An introduction to copulas. Springer. Vasicek, Oldrich Alfons. 2002. The distribution of loan portfolio value. Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and Economics), vol. 5, núm. 1 (2011), pp. 65-76. Capital Investments and real options: news proposes Beatriz Mota Aragón ∗ Recibido 25 de mayo de 2010. Aceptado 26 de octubre de 2010 Resumen La aportación más importante de este trabajo está orientada a la Teorı́a de Opciones Reales. La investigación sostiene que el Valor Presente Neto (V P N ) es un proceso estocástico. Se sugiere un modelo de opciones reales a través de un “modelo extendido” de Vasicek y Cox-Ingersoll-Ross (1985) para la tasa de interés en el V P N , en el cual se consideran variables de control externas (Zt ), mismas que cambian el curso de los flujos netos de efectivo. El VPN modificado sugiere un valor presente neto más exacto al valuar V P N (Zt ) + φ, donde φ es la opción real. Abstract The main contribution of this research to directed on Real Option Theory. Research asserts that Net Present Value (N P V ) is stochastic processes. A model for the real options is suggest where is constructing a continuous model for net present value named “Vasicek extended ”and the Cox-Ingersoll-Ross (1985) model for interest rate is examined. In the model is considering external control variables (Zt ) which change the N CF course. The modified N P V (Zt ) this gives a more accurate value for valuating V P N (Zt ) + φ, where φ is the real option. Clasificación JEL: Finance 0508 Palabras Clave: Capital Investments Theory, Net Present Value, Net Cash Flow, Interest Rate, Real Options Theory, Options Financial Theory, Stochastic Processes. Asymmetric Information. 1. Introduction This research suggested a different point of view about on the real options theory. The orthodox capital investment theory is considered and thinking about assumptions the Net Present Value (NPV), such as the assets price follows a discrete process, or that the interest rate is constant. The research presented assumptions a different way, at the stochastic processes theory. The work is proposing a continuous model which explains the Net Present Value (NPV) random evolution. And their effects on the valuation on the real options theory. The financial options theory is considered too. ∗ Profesora Titular “C” de Tiempo Completo en la Universidad Autónoma MetropolitanaIztapalapa. E-mail: [email protected]. 66 Revista de Administración, Finanzas y Economı́a The first section presents a real option theory extended review is made and observed the several fields the action. Second, the fundamental concepts the financial option valuation theory and real option theory are reintroduced. Third, the capital investment theory is review and proposed a continuous model of N P V and the real options model later. The N P V continuous model is defined in the Net Cash Flow (N CF ) with external control variables (Zt ) with Vasicek model (1977) and the interest rate with Cox-Ingersoll-Ross model (1985) for determined the interest rate and finally φ is incorporated in the RO. 2. Literature Review This section expected to show the several works development using real options theory (Mota, 2006). The methodology developed with the real options was first applied to investments in natural resources; nevertheless there are applications in other fields such as Research and Development (R&D), Corporate Strategies, Mergers and Acquisitions (M&A), Innovation and High Technology, Intellectual Property Rights, Interest Rate, Capital Risk, among others, Schwartz and Trigeorgis (2000). See table 1. Copeland and Vladimir (2001) stated that real options may be applied on almost any situation where it is possible to estimate a Net Present Value (NPV) project. Merton (1988) presents an excellent review showing the ample scope of applications that the real options theory has had. Dixit and Pindyck (1995), Amram and Kulatilaka (1999) and Trigeorgis (1988) provide conceptual arguments to develop real options on capital investment decisions. Other conceptual works are presented by Trigeorgis and Mason (1987), Brealy and Myers (2000). As well as Merton (1977) and Mason and Merton (1985) discuss connections among financial options and investment decisions. Real options quantitative origins derivate form the works on financial options by Black-Sholes (1973) and Merton (1973). And other way, Cox, Ross and Rubinsteins (1979) study and made possible the use binomial lattices to evaluate options in discrete time. Another important work is the one of Geske (1979) who evaluates compound options with differential equations. Kulatilaka and Trigeorgis (1994) present a model in discrete time to interchange options. Dixit (1992) presents a discrete model to valuate the expected value. Pindyck (1988) shows in a continuous expected value model using dynamic programming. Dixit and Pindyck (1994) study the cost function and implication as diffusion processes; also see Quigg (1993). Cortazar (1992) makes a simulation and other numerical approximations to valuate an European real option. Among others, as we can see, there is an important number of works in real options literature which are focused in quantitative valuation, the ones mentioned are important for this research. In the following table we might observe according to their area, some of the works developed using real options theory. Capital Investments and real options: news proposes 67 Table 1 Real options: Topics and some Application Areas Source: Lander y Pinches (1988), Schwartz (2001) y Mota (2006, 2008). 68 Revista de Administración, Finanzas y Economı́a The review of the literature shown in the table above to show the fact that real options may be used in several fields related to investment project evaluation. 3. Fundamental concepts As well known, the financial option valuation theory was written in the 1970s by Black-Sholes and Merton (1973), they got a close solution for the equilibrium price of a call option; since then, hundreds of articles and empirical studies have been written in this direction and have been linked to the real options theory. Myers (1977) stated that corporative assets may be seen as growth options (as a call option) and through this he applies financial options concepts to real assets. Brabazon (1999) states that the real options concept comes from financial options research, among others. A definition accepted for a real option purchase is the right, but not the obligation of investing, postponing, expanding, contracting or quitting an investment project in the future. This decision has a predetermined cost called exercise price which will be paid in a determined date and which exists during the whole option life long (Copeland and Antikarov, 2001). While exercising, the option utility is the difference between the underlying assets value and the exercise price, and considering that in general terms real options theory is an extension of the financial options theory applied to the non-financial real assets valuation, so to the capital investment (Amram and Kulatilaka, 1999), therefore we find some adaptations on the parameters to consider the valuation. The parameters that compose a financial option are: The underlying asset price Sf , the exercise price K, the underlying volatility σ, the risk-free rate r and the option T − t expiration date. Table 2 Real and Financial Options Parameter Valuation Source: Mota (2006). Adapted of Venegas, F. (2006). Riesgos Financieros y Económicos. Thomson, México. Chapter 69, p. 801. At the real options language: Sf is the cash flow present value expected in t; K is the cost at present value of the project investment in t; σ is the project cash flow volatility; r is the risk-free rate and T −t is the project maturity time. Capital Investments and real options: news proposes 69 Finally, some methodology advantages are: first, it considers uncertainty, which to get any type of growth opportunity, diversification or risk (Smith and Triantis, 1998). Thus an important methodology value is given by the possibility of according administratives abilities that from the traditional method valuation perspective of NPV is impossible to evaluate. Second, real options integrates technological and strategic factors inside a general valuation model (McGrath and McMillan, 2000), it to make possible to manage administratives abilities. Third, from the methodological viewpoint a decision process based on real options offers a systematic approximation to invest and evaluate in a high uncertainty and competence environment, creating subsequent investment opportunities, evaluated as cash flows plus a group of options (Amram and Kulatilaka 1999). Mota (2006). 3.1 Real options versus financial options For ended, and assuming that the Real Option (RO) takes their base from the Financial Option (F O) theory, it is important to mention differences between them because they change the RO models mathematical structure. The F O had been used for periods, while the RO have a recent development. The RO have a long term life, T − t = years, and the F O have a short term life, usually T − t = months. The underlying asset in F O is the asset price; while in RO there is an infinite variables quantity, in our case they are the net cash flows. Since the analysis of RO considers physical assets (real), we might be careful at the underlying variables selection, because the mentioned volatility refers to the underlying asset. The OF are regulated, although in theory, stockholders manipulate asset price for their sake. The RO are created by the enterprise and their decisions may increase the project value. The F O have relatively got a lower value (hundreds or thousands dollars per option), while the RO worth thousands, millions or billions dollars per project (strategic option), Mun (2002). Both option types may fuse by using similar approximations; close solutions, finite differences; Brennan (1979), partial differential equations; Geske (1979), binomial and multinomial lattices; Cox, Ross and Rubinstein (1979), Trigeorgis (1991), Hull and White (1988) and Boyle (1976), who include the Monte Carlo simulation. The FO models are based in a formal market, which make assets prices to be transparent; thus model construction is more objective. The RO are not negotiated at a formal market and financial information is just available for the administration, therefore model designing becomes subjective. Hence, the enterprise assumes the key is to valuate RO not F O. Having a particular project issued, the enterprise may create strategies that might provide by themselves future options, whose value could vary depending on how they are constructed, (Mun, 2002). In short, fundamental characteristics and differences of RO and F O are presented in table 3. 70 Revista de Administración, Finanzas y Economı́a Table 3 Differences between Real Options and Financial Options Source: Mota (2006, 2008). Adapted from Mun, J. (2002): Real options, Analysis. J. Wiley, USA. Chapter 5, p. 100. 4. Capital investments Is time to review the capital investment theory and proposing a continuous model of Net Present Value and the real options model later. Literature about capital investments may be divided in two groups; the one formed by independent investment opportunities, situations where investments considered are substantial and another which includes some models studying sequential irreversible investments, Pindyck (1988). Dixit and Pindyck (1994), Dixit (1995), Bertola (1998), Ingersoll and Ross (1992) were the first ones who considered the stochastic interest rate impact over investment opportunities. Alvarez and Koskela (2006) extended Ingersoll and Ross (1992) analysis for different interest rates and uncertain income joints. The question is: How does this work impact the real options theory? This research to assume that in order to understand nowadays enterprise problems we must exclude the orthodox NPV, and it shows the requirement to include stochastic processes in N CF and N P V valuation. The principal condemnation to the traditional N P V method is that it produces a simple estimation, and this is a disadvantage, because the events that affect cash flow forecasts are highly uncertain; Myers (1987), Trigeorgis (1993), (Copeland and Vladimir, 2001). Other remarks are in Hayes and Garvin (1982) and Hayes and Abernathy (1980), who recognize that the N P V criteria sub estimates investment opportunities. Capital Investments and real options: news proposes 71 Brennan and Schwartz (1985) support that the NCF presents deep limitations due to prices volatility. Paddock, Siegel and Smith (1988) list NPV technique disadvantages. On the other hand, Dixit and Pindick (1994) assure that: “The simple N P V rule is not just wrong; it is often very wrong ”, (see chap. 5:136). One of the fundamental drawbacks observed at the traditional N P V technique is that N CF estimation depends on a constant benefit rate and static expected flows. On several works, the method selected to solve the expected project cash flow estimation problem consists of inferring that the project generates perpetual rents in constant terms identical to the ones generated on the last exercise, and the interest rate with which they discount expected cash flows follows the CAM P rules. Copeland and Antikarov (2001), D´ iaz (1999, 2000), Kester (1984), Gil (1991), and Smith (2001), Mota (2006, 2008, 2009), among others. Motivated by the argument previously exposed, we to suggest the Net Present Value continuous model, which defined the Net Cash Flow with external control variables (Zt ), and confirmed that N CF and interest rate are not constants. A criterion distant to the one we find at ultra-traditional environment. His expression is, Mota (2006, 2009): "Z # T NP V = E N CF (t)e−r(t)t dt 0 NP V = NP V + φ The discrete version of the model to explain the Net Cash Flow and its internal dynamics with variables (Zt ) and random interest rate, is presented in the description follow, see Mota (2006): Table 4 72 Revista de Administración, Finanzas y Economı́a The important point in this research is that now NCF is a stochastic process that the administration council looks forward and guides the evolution. We have used diffusion processes with control variables (Zt) and showed that these processes not only explain NCF evolution, but also guides it. The analysis about how to use control variables on diffusion processes is of the form: dN CFt = µ(Zt , N CFt, t)dt + σ(Zt , N CFt, t)dWt In this work we have used the Vasicek model (1977) which is a diffusion process and due to its affinity with the purpose of this work had showed been applicable, but the possibility of studying more processes and proposing new ones is not excluded, still more. Only by focusing in the component F (Zt ) formulation, proposing non-linear relations, we get the possibility of entering upon complex schemes. In short, the modified real option is: "Z # T RO = N P V = E N CF (t)e−r(t)t dt > 0 0 In order to review the impact on a real option value and therefore on real options theory, it would be enough to apply modified N P V with external variables (Zt ) on a capital investment opportunity; we take back the idea that a real option is: NP V = NP V + φ > 0 and we ask whether the real option is such that N P V < 0, φ is call/put option such that N P V = N P V + φ > 0. We change the path by taking more steps before a decision is reach, instead we see the relation: N P V (Zt ) = N P V (Zt ) + φ and we start in the same place with N P V < 0, and φ is a call/put option, now we suggest: 1.- Find a suitable Zt such that N P V (Zt ) > 0. 2.- If for all possible sets {Zt } N P V < 0, then find a couple {Zt , φ} such that N P V (Zt ) = N P V (Zt ) + φ > 0 The simple idea that takes traditional NPV ignores: 1. The {Zt} set is actually acting over the cash flow estimates. 2. N P V is a stochastic processes not a deterministic one. The typical questions emerged from administration council while making a capital investment decision can be answered from traditional viewpoint: V P N > 0, from real options perspective traditional: V P N + φ > 0, or even from a new approach proposed in this research; V P N (Zt ) + φ > 0 as information joint associated to Zt . Classical real options inquiries investing in research and development; expanding or not annual production; postponing an investment project, etc. these are questions on the structure N P V (Zt )+φ > 0. With this approach, accepting or rejecting an investment project depends on variables Zt trajectories. Capital Investments and real options: news proposes 73 The rationale behind is that with the model proposed we go into a more accurate value rather than just doing a real option valuation. Now since N P V is stochastic and is possible to manage its behavior through a wise use of the control variables, now the firm has to set the level of Zt in N V P = N P V (Zt ), which says the ability to generate wealth in the firm depends on the decisions of the board setting the level of control (Zt ). 5. Conclusions The work was written on the continuous objective to contribute in Real Options Theory with news proposes. We have been proposed that the Net Present Value is a stochastic process because we should consider a continuous models Net Cash Flow and interest rate. The considering external control variables (Zt ) which change the Net Cash Flow course and modified the traditional N P V for N P V (Zt ) and addition φ, where φ is the real option are some contributions. Mota (2006, 2008, 2009). In this research was important raised that multiples questions emerged from administration council while making a capital investment decision can be answered from approach proposed: V P N (Zt ) + φ > 0 as information joint associated to Zt and these are questions on the structure N P V = N P V (Zt ) + φ > 0. With this approach, accepting or rejecting an investment project depends on variables Zt trajectories. In short, we find a suitable Zt such that N P V (Zt ) > 0 and if for all possible sets {Zt }, N P V < 0 then find a couple {Zt , φ} such that N P V = N P V (Zt ) + φ > 0. As can see, for the Investment Capital Theory this work is significant for investment project area because the model proposed is able to offer a more accurate valuation the real option. 6. References Amram, M. and N. Kulatilaka (1999). Real Options Managing Strategic Investment in an Uncertain World. Boston, Massachusetts: Harvard Business School Press. Brabazon, T. (1999). Real Options: Valuing Flexibility in Capital Investment Decisions. Accountancy Ireland, 31 (6): 16-18. Breeden, D. (1979). An Intertemporal Asset Pricing Model with Stochastic Consumption and Investment Opportunities, Journal of Financial Economics, 7, 265-296. Brennan, M. (1979). The Pricing of Contingent Claims in Discrete Time Models, Journal of Finance, pp.53-68. Brennan, M., and E. Schwartz (September 1978). Finite Difference Methodos and Jump Process Arising in the Pricing of Contingent Calims: A Synthesis, Journal of Finance and Quantitatve Analysis, pp. 461-474. Brennan, M., and E. Schwartz (Spring 1985). Evaluating Natural Resources Investments, Journal of Business, 58, 135-157. Boyle, P. (May 1977). Options: A Monte Carlo Approach, Journal of Financial Economics, 323-338. 74 Revista de Administración, Finanzas y Economı́a Campbell, J., A. W. Lo and A. C. MacKinlay (1997). The Econometrics of Financal Markets. Princenton, New Jersey: Princenton University Press. Copeland, T. and V. Antikarov (2001). Real Options: A Practitioner’s Guide, New York, N.Y.: Thomson Texere. Cox, J. J. Ingersoll and S. Ross (1985). An Intertemporal General Equilibrium Model of Asset Prices. Econometrica, 53, 363-384. Cox, D. R. and H. D. Miller (1965). The Theory of Stochastic Processes: Chapman and Hall. Chiang, A. (1984). Fundamental Methods of Mathematical Economics. (3a. ed.). USA: McGraw Hill. Dixit, A. and Pindyck, R. (May-June 1995). The Options Approach to Capital Investment. Harvard Business Review, 105-118. Dixit, A. and Pindyck, R. (1994). Investment Under Uncertainty. New Jersey, Princeton University Press. Dohan, U. (1978). On the Term Structure of Interest Rates. Journal of Financial Economics 6, 59-69. Engle, R. and Ng, V. (2000). Measuring and Testing the Impact News on Volatility, in ARCH Selected Readings, Edited for Engle, R. and Ng, V. (2000). Oxford University Press. Geske, R. (1979). The Valuation of Compounds Options. Journal of Financial Economics 7 (1): 63-81. Glasserman, P. (2004). Monte Carlo Methods in Financial Engineering: Verlag. Glosten, L. R., R. Jagannathan, and D. E. Runkle (1993). On the Relation Between the Expect Value and the Volatility of the Nominal Excess Return on Stocks. Journal of Finance, 48, 1779-1801. Gourieroux and Jasiak (2001). Financial Econometrics: Diffusion Process, USA: Princeton Series in Finance. Heath, D., R. Jarrow, and A. Merton (1990). Bond Pricing and the Term Structure of Interest Rates: A Discrete Approximation. Journal of Financial and Quantitative Analysis, 25 (4): 419-440. Heath, D., R. Jarrow, and A. Merton (1992). Bond Pricing and the Term Structure of Interest Rates: A New Methodology for Contingent Claims Valuation. Econometrica, 60 (1): 77105. Herath, H., and C. Park (2001). Real Options Valuation and its Relationship to Bayesian Decision Making Methods: The Engineering Economist, 46 (1), 1-32. Ho, T. and S. Lee (1986). Term Structure Movements and Pricing Interest Rate Contingent Claims. Journal of Finance, 42 (5), 1011-1029. Hughston, L. (1996). Vasicek and Beyond: Approaches to Building and Appliying Interest Rate Models. London: Risk Publications. Hull, J., (1993). Options, Futures and other Derivative Securities, (2nd ed.). USA: Prentice Hall. Hull, J. and A. White (1988). The Use of the Control Variate Technique in Option Pricing. Journal of Financial and Quantitative Analysis, 23 (3): 237-251. Ingersoll, J., and S. Ross (1992). Waiting to Invest: Investment and Uncertainty, Journal of Business, 65 (1): 1-29. Kaplan, S. and R. Ruback (1995). The Valuation of Cash Forecast: An Empirical Analysis. The Journal of Finance, 50 (4):1059-1092. Capital Investments and real options: news proposes 75 Kester, W. C. (1984). Today’s Options for Tomorrows Growth. Harvard Business Review, 62 (2): 153-160. Kogut, B., and N. Kulatilaka (2001). Strategy, Heuristics, and Real Options. The Oxford Handbook of Strategy. Kulatilaka, N., and E. Perotti (1998). Strategic Growth Options. Management Science, 44 (8), 1021-1031. Kulatilaka, N., and L. Trigerorgis (1994). The General Flexibility to Switch: Real Options Revisited, International Journal of Finance, 6 (2): 27-54. Lamberton, D. and B. Lapeyre (1997). Introduction to Stochastic Calculus Applied to Finance. (First ed.) Great Britain: Chapman & Hall. Lander, D., and G. Pinches (1998). Challenges to the Practical Implementation of Modeling and Valuing Real Options. The Quarterly Review of Economics and Finance, 38, 537-567. Majd, S., and Pindyck, R. (March 1987). Time to Build, Option Value, and Investment Decisions, Journal of Financial Economics 18: 7-27. McDonald, R., and Siegel, D., (1985). Investment and the Valuation of Firms When There is an Option to Shut Down. International Economic Review 26 (2): 331-349. Mcgrath, R., and I. Mac Millan (2000). Assessing Technology Projects using Real Options Reasoning. Research Technology Management, 43 (4), 35-49. Merton, R. C., (1970). Optimum Consumption and Portfolio Rules in a Continuous-Time Model. Working Papers 58, Massachusetts Institute of Technology (MIT), Departments of Economics. Merton, R. C., (1973). Theory of Rational Option Pricing. Bell Journal of Economics and Management Science, 4, 141-183. Merton (1998). Applications of Option-Pricing Theory: Twenty-Five Years Later. American Economic Review, 88(3): 336-340. Moel, A., and P. Tufano (2000). When are Real Options Exercised? An Empirical Study of Mine Closings. Review of Financial Studies, 15, 35-64. Mota, B. (2006). La teorı́a de Opciones Reales, los Proyectos de Inversión y las Decisiones Estratégicas de Negocios, Denarius 13: 245-266. Mota, B. (2008). Proyectos de Inversión: Una Visión Iberoamericana. La Teorı́a de Procesos Estocásticos en el análisis de los Flujos de Efectivo de un Proyecto de Inversión, Cap. 7: 255, FCA-UNAM, México. Mota, B., Ludlow, J. Williams, F. (2008). Stochastic Processes. A Critical Synthesis. Análisis Económico, Vol. XXIII, No. 53. México. Myers, S. (1977). Determinants of Corporate Borrowing. Journal of Financial Economics, 5: 147-175. Mun, J. (2002), Real Options Analysis, Tools and Techniques for Valuing Strategic Investments and Decisions, New Jersey: John Wiley Sons, Inc. Myers, S. and Majad, S. (1990). Abandonment Value and Project Life. Advances in Futures and Options Research, 4: 1-21. Natenberg, S. (1994). Option Volatility Pricing. Cambridge, England: Probus Publishing Company. Neftci, S. N., (2000). An Introduction to the Mathematics of Financial Derivatives. (2a. ed.), New York, N.Y.: Academic Press. Paddock, J. Siegel, D. and Smith, J. (1988). Option Valuation of Claims on Physical Assets: The Case of Offshore Petroleum Leases, Quarterly Journal 76 Revista de Administración, Finanzas y Economı́a of Economics 103, 479-508. Pindyck, R. (1988). Irreversible Investment, Capacity Choice, and the Value of the Firm. American Economic Review 78, 5: 969-985. Quigg, L. (1993). Empirical Testing of Real Option-Pricing Models, Journal of Finance, 48, 621-640.). Rebonato, R. (1996). Interest Rate Option Models. England: John Wiley Sons. Schwartz, E., and L. Trigeorgis (2000). Real Options and Investment under Uncertainty: Classical Readings and Recent Contributions. MIT Press. Schwartz, E., and C. Zozaya-Gorostiza (2000). Valuation of Information Technology Investments as Real Options. AFA 2001, New Orleans Meetings. Smith, K., and A. Triantis (1998). The Value of Options in Strategic Acquisitions, in Trigeorgis, L. (1999): Real Options and Business Strategy: Applications to Decision-Making, Risk Books. Trigeorgis, L., and Mason, S.P., (1987). Valuing Managerial Flexibility. Midland Corporate Finance Journal 5 (1): 14-21. Trigeorgis, L. (1988). A Conceptual Options Framework for Capital Budgeting. Advances in Futures and Options Research 3, 145-167. Trigeorgis, L. (Autumm, 1993). Real Options and Interactions with Financial Flexibility, Financial Management 22 (3): 202-224. Trigeorgis, L. (Autumm, 1993). The Nature of Option Interactions and the Valuation of Investments with Multiple Real Options, Journal of Financial and Quantitative Analysis, 28 (1): 1-20. Trigeorgis, L. (1991). A Long Transformed Binomial Numerical Analysis Method for Valuing Complex Multi-Option Investments. Journal of Financial and Quantitative Analysis, 26 (3): 309-326. Trigeorgis, L. (1998). Real Options, Managerial Flexibility and Strategy in Resource Allocation, Cambridge, The MIT Press. Vasicek, O. (1977). An Equilibrium Characterization of the Term Structure. Journal of Financial Economics, 5, 177-188. Venegas, F. (2006). Riesgos Financieros y Económicos: Productos Derivados y Decisiones Económicas bajo incertidumbre. (1 ed.), México, Thomson. Wilmott, P. (2000). Quantitative Finance. England: John Wiley Sons, Inc. Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and Economics), vol. 5, núm. 1 (2011), pp. 77-92. Valuación de Swaptions Bermuda basada en el Modelo LIBOR adaptado a vectores frontera Igor P. Rivera∗ Enzo D’Antonio di Vito D. Andrés Fundia ∗∗∗ ∗∗ Recibido 15 de abril de 2010. Aceptado 09 de septiembre de 2010 Resumen El presente trabajo estudia el cálculo del precio de Swaptions tipo Bermuda, con base en el Modelo Libor (LMM) de tasa de interés adaptado al algoritmo de vectores de frontera de ejercicio para valuar opciones americanas. Dicho algoritmo de la familia de la simulación Monte Carlo, obtiene una frontera de tasas de ejercicio que permite valorar la decisión de seguir en la opción o ejercerla de forma anticipada. Este enfoque tiene la ventaja de ser fácil de implementar y puede obtener un resultado rápido y aproximado del valor de un Swaption bermudano, mejor conocido en el mercado como Swaption Bermuda. Abstract This paper studies the computation of the price of Bermuda Swaptions type, based on the Libor Model (LMM) interest rate vector algorithm adapted to the exercise boundary to value American options. This algorithm about family Monte Carlo, get a border exercise to rate the value of staying in decision option or exercise early. This approach has the advantage of being quickly to implement and get a result about the value of a swaption bermudano, better known swaption market as Bermuda. Clasificación JEL : G10, G14 Palabras clave: Valuación de derivados de tasa de interés, Swaptions Bermuda, Simulación Monte Carlo Introducción Actualmente el uso de derivados sofisticados es cada vez más solicitado en los mercados financieros y entre las razones principales de esta creciente demanda se encuentra la posibilidad de aprovechar y generar oportunidades de negocio ∗ Escuela de Graduados en Administración y Dirección de Empresas Tecnológico de Monterrey, Campus Ciudad de México, EGADE. Calle del Puente 222, Aulas 4-Piso 4, Ejidos de Huipulco, Tlalpan, D.F. 14380, e-mail: [email protected] ∗∗ ∗∗∗ Departamento de Estructuración BBVA Bancomer (México) Departamento de Riesgos Infonavit, México 78 Revista de Administración, Finanzas y Economı́a que se derivan de la evolución y cambios de las necesidades de los clientes y participantes de los mercados. Entre los productos más comunes en el mercado de derivados de tasas, se encuentran los caps, floors y los swaps. Los caps son opciones de tasas de interés que le garantizan al tenedor que una tasa variable no exceda de un nivel especı́fico; los floors, contrario a los caps, garantizan al tenedor que una tasa variable no disminuya de un cierto nivel. La cotización de ambos en el mercado generalmente se realiza en términos de volatilidad de tasas. Por otra parte, los swaps son contratos en el que las contrapartes acuerdan el intercambio de flujos futuros en una misma o en diferentes monedas y a tasas fijas o flotantes. Dado que el uso de swaps en los mercados se ha hecho tan común, que ha generado la necesidad de utilizar derivados sofisticados que tengan como subyacente a los swaps, entre ellos estan los swaps adelantados, los futuros sobre swaps y las opciones sobre swaps, mejor conocidas en el mercado como swaptions. Los swaptions contratos que otorgan a su tenedor el derecho de entrar en un swap, para recibir o pagar una tasa fija. Al igual que las opciones de tasas de interés, los swaptions cotizan en términos de volatilidad de tasas y la tasa de ejercicio está dada por la tasa fija del swap subyacente al que se puede entrar. También, como en el caso de las opciones tradicionales, los swaptions pueden ser de tipo europeos o americanos aunque también son muy común los de tipo bermudano. Los swaptions europeos pueden ejercerse únicamente a su vencimiento, mientras que los americanos pueden ser ejercidos en cualquier momento antes del vencimiento. Entre dichos extremos, existe una variante, llamada opción bermuda que permiten ejercer el derecho asociado en un calendario de fechas definido antes del vencimiento. Los vencimientos tı́picos de un swaption pueden ir desde unos cuantos meses hasta varios años. En el caso de los swaptions, la analogı́a entre opciones de compra (calls) y de venta (puts) se define en términos de la clase de tasa de interés que al tenedor corresponderı́a pagar en caso de ejercer su derecho de entrar al swap: en un call swaption, mejor conocido como payer swaption, el tenedor tiene el derecho de entrar al swap pagando flujos a tasa fija, mientras que en el put swaption, tı́picamente denominado receiver swaption, el tenedor queda habilitado para entrar al swap erogando los flujos a tasa variable si decide ejercer la opción. Si bien los swaptions bermudanos pueden ser utilizados con objeto de negociación y especulación, han cobrado gran importancia al usarse como instrumentos de cobertura. De hecho, los swaptions bermudanos generalmente están implı́citos en swaps que pueden ser cancelables (conocidos como callable swaps) los cuales la mayorı́a de las veces forman parte de canastas de activos o de bonos cancelables en las campañas de financiación corporativa. Por ejemplo, en perı́odos de baja volatilidad, intermediarios financieros y tesorerı́as bancarias, podrı́an tomar posición larga en swaptions para compensarla en perı́odos posteriores de mayor volatilidad; bajo esquemas de esta naturaleza generalmente se negocian swaptions tipo europeo y en estrategias básicas. Incluso, una tesorerı́a bancaria podrı́a utilizar un swaption para cubrir niveles de volatilidad provocados por posiciones propias o de clientes. Existen en la literatura diversas referencias sobre los efectos de noticias y avisos macroeconómicos tanto en el mercado de contado de tasas de interés, como en su mercado de derivados; se sugiere al lector el trabajo de Forniari Valuación de swaptions Bermuda ... 79 (2004) como compendio sobre el tema. Ante tales circunstancias, es común que una tesorerı́a bancaria necesite ajustar el desbalance de duración que se genera ante eventos de prepago de sus créditos de mediano y largo plazo. Por ejemplo, suponga que el banco otorgó un crédito a tasa fija en el que el cliente pueda prepagar de forma anticipada; si bien el crédito puede cubrirse por un swap, simultáneamente el prepago puede cubrirse con la compra de un swaption que otorgue el derecho de recibir la tasa fija. Ası́, en el caso de que el cliente decida prepagar el crédito (esto asume que el prepago se realiza por ventajas en el mercado), la cobertura instituı́da en forma del swap deja de tener sentido, de modo que el banco debe ejercer el swaption a fin de compensar el swap mediante la sustitución de los flujos. a tasa fija que proporcionaba el antiguo acreditado. El siguiente cuadro muestra un ejemplo de cobertura contra el riesgo de prepago por medio de un swaption. Para el caso de los swaptions europeos, es posible obtener una solución cerrada a la ecuación diferencial parcial del precio del swaption, en la forma de una ecuación del tipo Black-Scholes-Merton. Sin embargo, esto no es posible en el caso del swaption Bermuda por lo que en este trabajo emplearemos métodos originalmente pensados para la valuación de opciones americanas para obtener una aproximación al precio del swaption bermudano. Si bien, existe literatura relacionada con esta conjetura (p.e. Andersen (2000)), el enfoque que en este trabajo presenta se caracteriza por su fácil implementación. El modelo Libor 80 Revista de Administración, Finanzas y Economı́a para determinar las tasas de mercado tanto porque se apega a los datos estilizados sin recurrir a parámetros no observables y porque es compatible con el uso del método Monte Carlo. El trabajo está organizado de la siguiente forma: en la sección 2 abordamos las técnicas más comunes de valuación de swaps; en la sección 3 mostramos como la simulación Monte Carlo permite manejar la dependencia con la trayectoria del modelo Libor de mercado, al mismo tiempo que permite incorporar vectores frontera para hacer frente al ejercicio anticipado de las opciones americanas. En la sección 4 se revisa la implementación. En la sección 5 se analizan los resultados y se trazan algunas conclusiones. 2. Técnicas comunes de valuación de swaptions Como se muestra en las figuras 2.1 y 2.2, los derivados de tasas de interés se cotizan tı́picamente en términos de una estructura de plazos de la volatilidad implı́cita calculada con base en un modelo de Black (1976) bajo el supuesto de una dinámica lognormal de la tasa de interés. Figura 2.1. Cotización de caps y floors sobre la Libor del USD (Fuente: Bloomberg, L.P.) Con el fin de obtener una ecuación para valuar un swaption como el del ejemplo en las figuras 2.1 y 2.2, considere primeramente al swap subyacente con una estructura de pagos, dada por el plazo θ que empezarı́a a correr si y sólo si el swaption hubiera sido ejercido en la fecha, Tk . Dicho swap tendrı́a su vencimiento en Tm . La condición a alcanzar al vencimiento serı́a la tasa swap adelantada fuera mayor que la tasa de ejercicio, i.e. rsw,fwd > rk . En dicho Valuación de swaptions Bermuda ... 81 caso, el precio del receiver swaption descontado a Tk estarı́a dado por: RSW PTk = θmax(rk − rsw,fwd, 0) n X B(Tk , Tk + θi) i=1 donde n = (Tm −Tk )/θ y B(Tk , Tj ) serı́a el precio en Tk de un bono sin cupones con vencimiento en Tj . La suma del precio de dichos bonos, una anualidad, será utilizada como numeraria y cuya medida de probabilidad rsw,fwd > rk es martingala, de modo que: RSW P0 = θE[max(rk − rsw,fwd , 0)]B(0, Tk + θi) Figura 2.2. Cotización de swaptions sobre la Libor del USD (Fuente: Bloomberg, L.P.) Al transformar este resultado en una expresión tipo Black-Scholes-Merton obtenemos un resultado conocido tal como: RSW P0 = θ[rk Φ(−d2 ) − rsw,fwdΦ(−d1 )]B(0, Tk + θi), donde d1 = 2 ln(rsw,fwd /rk ) + 0.5Tk σsw σsw (T − k)1/2 y d2 = d1 − σsw (T − k)1/2 con σsw como la volatilidad de la tasa swap adelantada. 82 Revista de Administración, Finanzas y Economı́a En virtud de que los swaptions americanos no son tan comunes como los europeos, no profundizaremos en su valuación, sino en la de opciones americanas. Wilmott (2001) y Hull (2006) establecen que los árboles binomiales son muy comunes en la valuación de opciones americanas. Un árbol binomial representa un diagrama de diferentes trayectorias recombinantes que pudieran seguir los precios del bien subyacente durante la vida de la opción, partiendo del supuesto de que el subyacente en cada perı́odo de tiempo se mueve hacia arriba o hacia abajo en una magnitud determinada con sendas probabilidades de ocurrencia como se muestra en la figura 2.3. Una vez trazado el árbol la forma de trabajar es partiendo del final del árbol hasta el principio, probando cada uno de los nodos para ver donde es óptimo ejercer antes del vencimiento. En general es un modelo muy recurrido para el cálculo de este tipo de opciones, el cual comienza a complicarse si la función de pago de la opción depende de la trayectoria que sigue el subyacente y no sólo del valor final en cada uno de los pasos, además de complicarse con problemas de más de dos dimensiones. Las simulaciones Monte Carlo, en cambio, se adaptan fácilmente al problema de alta dimensión, como lo establecen Broadie and Glasserman (1997). Figura 2.3. Árbol binomial de tres pasos. En las simulaciones Monte Carlo pueden incorporarse dependencias de trayectoria, esto dado que, como se muestra en la figura 2.4, se generan diferentes trayectorias aleatorias independientes con algún proceso estocástico definido para el subyacente, se calcula la función de pagos para cada trayectoria y posteriormente se pueden combinar linealmente y promediar para estimar el valor esperado de la función de pagos del derivado. A pesar de que en Wilmott (2001) y Hull (2006) se considera como difı́cil manejar la posibilidad de ejercicio anticipado de las opciones americanas a Valuación de swaptions Bermuda ... 83 través de la simulación Monte Carlo, existen diversas referencias tales como Brodie y Glasserman (1997), Dupire (1998), Fundia (2002) y Rivera (2005) en las que se proporcionan indicios y ejemplos de cómo emplear el método Monte Carlo para la valuación de opciones americanas. Figura 2.4. Trayectorias de precio simuladas por Monte Carlo. 3. Modelo Libor, vectores frontera para valuar opciones americanas En la presente sección se presentará la forma de utilizar el método Monte Carlo para manejar la dependencia de trayectoria requerida por el modelo Libor de mercado a las vez que los vectores frontera permiten incorporar el ejercicio anticipado, tı́pico de opciones americanas. Recuérdese ante todo que los modelos de tasas de interés pretenden describir la evolución de las tasas de interés a través del tiempo; algunos describen una estructura temporal de tasas basados en el comportamiento de la tasa de corto plazo, mientras que otros se basan en procesos que siguen tasas adelantadas instantáneas, las cuales no son observables en el mercado. Hull (2006) aborda estos modelos con profundidad intermedia mientras que la revisión detallada de dichos modelos se puede encontrar en Brigo and Mercurio (2001). Diversos autores como Brace, Gatarek y Musiela (1997), Jamshidian (1997) ası́ como Miltersen, Sandmann y Sondermann (1997) han abordado la no observabilidad de la tasa forward instantánea mediante lo que en forma unificada se conoce como LMM, por sus siglas en inglés Libor Market Model, el cual puede expresarse en términos de las tasas “forward ”que se observan en los mercados actuales. Resulta conveniente usar este modelo sobre las tasas aplicables a los derivados de tasas de interés en los perı́odos lı́quidos, que son de por lo menos un mes y comúnmente de tres y seis meses resultando su uso menos complicado que las tasas instantáneas no observables. Como lo describen Hull (2006) y Jamshidian (1997) este modelo se puede utilizar en la valuación de productos comunes del mercado de derivados de 84 Revista de Administración, Finanzas y Economı́a tasas de interés, como caps y floors, bajo el supuesto de que las tasas forward siguen una distribución lognormal. Comúnmente la implementación requiere de la simulación Monte Carlo. Existen diferentes modelos para el cálculo de primas de opciones americanas utilizando simulación Monte Carlo; en general se caracterizan por utilizar métodos numéricos y en algunos casos métodos iterativos; a continuación revisaremos los principales. Longstaff y Schwartz (2001) proponen una aproximación por mı́nimos cuadrados para la valuación de opciones americanas. Bajo este enfoque es necesario elegir en cada posible punto de ejercicio entre continuar con la opción o ejercer. El método consiste en generar un gran número de trayectorias y analizar los posibles valores del subyacente para cada periodo de ejercicio en cada una de las trayectorias. Se compara el valor de ejercicio en cada punto con el valor de no ejercer: V = a + bS + cS 2 donde S es el precio del subyacente en el i-ésimo perı́odo y V es el valor de no ejercer calculado al tiempo correspondiente, es decir, el valor de ejercer en el siguiente periodo descontado al periodo i-ésimo. Para todos los valores se encuentran a, b y c tal que se determine el mı́nimo de la suma X (Vi − a − bSi − cSi2 ) a través de mı́nimos cuadrados. Se realiza de atrás hacia delante hasta obtener el valor de ejercer inmediatamente. Este modelo podrı́a llegar a complicarse cuando el precio de la opción se vea afectado por más de un factor, resultando la aproximación ordinaria por mı́nimos cuadrados impráctica para el cálculo de la función condicional V ; en tal situación, resulta más eficiente utilizar otras técnicas como mı́nimos cuadrados ponderados o mı́nimos cuadrados generalizados entre otros. Podrı́a también encontrarse algunas otras implicaciones numéricas para la significancia estadı́stica de las regresiones de mı́nimos cuadrados al definir la función condicional, como se resume en Longstaff y Schwartz (2001). Por su parte Andersen (2000) propone una aproximación en la que se genera un número considerable de trayectorias Monte Carlo, y en el que la frontera de ejercicio es parametrizable. Primeramente se define una función de ejercicio anticipado I(t) que es igual a 1 si el ejercicio anticipado es óptimo en el tiempo t y 0 en otro caso. I(t) es una función con un vector de parámetros, cuyos valores óptimos son determinados iterativamente, iniciando por el vencimiento de la opción hasta el inicio. Después, se prueban cada uno de los valores del precio S del subyacente, en cada perı́odo t de las diferentes trayectorias, y en el que el valor esperado de ejercicio sea mayor/menor dependiendo del tipo de opción, es decir, el valor que maximice el precio promedio de la opción se definirá como punto frontera. Se obtiene el punto frontera para cada perı́odo t y ası́ hasta llegar a t = 0 como se sugiere en Hull(2006) o Broadie y Glasserman (1997). En este modelo la parametrización de las fronteras es única para cada tipo de operación; y en ocasiones podrı́a resultar complicada la forma en que debe ser parametrizada la frontera de ejercicio anticipado. Valuación de swaptions Bermuda ... 85 En Fundia (2002), los vectores frontera se calculan iniciando por el vencimiento de la opción hasta el inicio, es decir haciendo el recorrido hacia atrás en el tiempo. En el tiempo final N , el vector está determinado por el precio de ejercicio de la opción, y para encontrar sus valores en cualquier tiempo k es necesario haber obtenido los valores futuros, es decir entre el tiempo k y N . En cada uno de los perı́odos primeramente debe definirse el techo y el piso de la frontera y se define a y como el punto medio de dichos puntos; entonces, la pregunta que debe responderse es si la función de pago es mayor o igual al valor estimado de continuar con la opción; con base en la respuesta, y será el nuevo piso o techo del perı́odo k. Para responder a esas preguntas, se define primero la función de valor de la opción si el tenedor decide no ejercer. Se simulan trayectorias desde el tiempo k hasta el tiempo N ; en cada una de ellas se obtiene un valor observado. Para las n trayectorias que se calculan, se obtienen valores observados de los que al obtener la media (estimador) se obtendrá el valor esperado de continuar en la opción; las posibles respuestas en el punto de decisión son: a) ejercer si la función de pago es mayor o igual al valor estimado de continuar, b) no ejercer si la función de pago es menor al valor estimado de continuar. El proceso se repite hasta que el valor del piso y del techo coincidan (i.e. hasta que difieran en un valor no mayor a ). Una ventaja de este modelo es que es un método iterativo y con alta velocidad de cálculo. De hecho, el algoritmo descrito anteriormente es el que se implementó en el presente trabajo, siendo la base para el desarrollo en VBA. En la siguiente sección se describirá con mayor detalle la implementación. 4. Implementación En esta sección, se revisrá una descripción general del algoritmo a seguir para el cálculo de la frontera de ejercicio, que combinado con el modelo Libor de tasas, conformará un método alternativo a los ya existentes; posteriormente se explicará a detalle tomando como ejemplo un swaption semestral con plazo de 10 años. La idea fundamental que se propone consiste adaptar el modelo “Fast Monte Carlo American Option Pricing”de Fundia (2002), para obtener una aproximación de la frontera de ejercicio de tasas swaps que permita calcular el valor de un swaption Bermuda. La implementación incluye la combinación de dicho método de aproximación para opciones americanas con el modelo Libor de mercado. Es importante señalar que el ejemplo implementado con fines experimentales para el cálculo de la frontera, tiene como supuestos: a) que se considera la curva de tasas libres de riesgo como plana en todos los plazos para este ejemplo en particular b) que la Curva de volatilidad se considera plana para todos los plazos para este ejemplo en particular c) que es un modelo de una sola dimensión. Sin embargo destacamos que la gran ventaja de implementar esta metodologı́a es que puede aplicarse de manera general para swaps de cualquier plazo tal y como se observan en el mercado, además de que puede generalizarse fácilmente 86 Revista de Administración, Finanzas y Economı́a a estructuras temporales de tasas observadas y volatilidades incluso si éstas no son deterministas. Como se mencionó, el algoritmo se centra en calcular los vectores frontera iniciando por el vencimiento de la opción (i.e. al tiempo N ) hasta el inicio. Al tiempo N el valor de la frontera está determinado por el precio de ejercicio de la opción, y para encontrar este valor en cualquier tiempo k es necesario haber obtenido los valores futuros, es decir entre k y N . En cada uno de los perı́odos primeramente debe definirse el techo y el piso de la frontera, los cuales pueden ser 0 y un número B, con una realización única u que pertenezca al intervalo (0, B) y tal que (x, u∗) sea un vector frontera. Entonces, se define a y como el punto medio del piso y techo dados por (0, B) y la pregunta que debe responderse es si y ≥ u∗ ; dependiendo de la respuesta y será el nuevo piso o techo de u∗ ; el proceso se repetirá hasta que la diferencia entre el piso y el techo no sea mayor al nivel de precisión dado por . Para abordar el proceso, se define primero a gk como el valor de la opción si el tenedor decide no ejercer. Se simulan trayectorias comenzando en Sk , es decir, se obtienen los valores (Sk , Sk+1 , ..., SN ) con cada una de ellas se obtiene un valor observado Gk que se define como: Gk = Dk,t h(St ) donde t = min(k + 1, ..., N ) si St ≥ V para cualquier V que pertenezca a la frontera de ejercicio, o t = N si St < V , h() representa el valor de ejercer en este instante, y Dk,t es el factor de descuento. De hecho para las n trayectorias que se calculan, se obtienen valores de P Gk ; si se hace que gk = (1/n) Gk , es decir el estimador del valor esperado de continuar, las posibles respuestas a las preguntas antes mencionadas serı́as las siguientes: a) y ≥ u∗ si h(x) ≥ gk , es decir, ejercer si la función de pago es mayor o igual al valor estimado de continuar, b) y < u∗ si h(x) < gk , es decir, no ejercer si la función de pago es menor al valor estimado de continuar. Este procedimiento itera hasta que el valor del piso y del techo coincidan es decir, difieran en un valor no mayor a . El número de trayectorias y el tiempo de simulación dependerán del subyacente sobre el que se esté calculando y del proceso estocástico que se defina para este. A continuación se desarrolla un ejemplo en el que se supone que el producto a valuar es un swaption tipo bermuda sobre un swap con periodicidad semestral, en el que se adquiere el derecho de pagar la tasa fija (“payer”) y con posibilidad de ejercer en cualquier perı́odo de vencimiento de cupón. Antes de iniciar con el algoritmo para construir la frontera de tasas se presentan las caracterı́sticas del instrumento en la tabla siguiente y se describirá el proceso a utilizar con el modelo Libor de mercado, para las simulaciones de trayectoria de tasas. Valuación de swaptions Bermuda ... 87 Como ya se mencionó anteriormente el modelo Libor de Mercado puede ser implementado usando simulación Monte Carlo y expresado en términos de volatilidad. El modelo libor que se utilizará es el proceso definido para tasas forwards, de las cuales pretende obtenerse las tasas swaps; entonces la expresión a utilizar que define el proceso estocástico de las tasas forward, es como sigue: δF (t, j)σ 2 σ2 1/2 − F (t, j + 1) = F (t, j)exp δ + σZδ 1 + δF (t, j) 2 donde a)F (t, j + 1) es la tasa forward para el siguiente perı́odo, b)F (t, j) es la tasa forward para el perı́odo actual, c)δ es la periodicidad de la tasa, d)σ es la volatilidad de la tasa forward, e)y Z es una variable aleatoria con distribución normal estándar. Por medio de la simulación, esta expresión permitirá obtener trayectorias de las tasas forwards de las que derivarán las tasas swaps que formarán parte de la frontera de ejercicio. De acuerdo a la descripción general anterior, se tiene que el algoritmo inicia el cálculo en el vencimiento del subyacente, es decir al tiempo N , en este caso 10 años. Como se ha definido una frecuencia semestral, dicho plazo equivale a 20 perı́odos. En virtud de que el punto frontera en el perı́odo 20 está dado por el precio de ejercicio que es igual a la tasa forward a esa fecha, el primer punto de análisis es al tiempo N − 1, es decir el perı́odo 19 en este ejemplo. El análisis inicia con definir un piso (0) y un techo (B) iniciales, los cuales se irán cerrando a través de un proceso iterativo, hasta hacer convergencia con la tasa forward frontera que se busca. En este ejercicio se definió como techo inicial B = 2K, es decir B = 19%, de modo que el intervalo inicial está dado por los valores (0,19%). Siguiendo con la descripción del modelo hecha anteriormente, se encuentra el punto medio del intervalo (0, B), es decir y = 9.5%, y a partir de este valor se harán simulaciones que permitirán obtener el valor esperado de la tasa forward como se muestra en la gráfica 4.1. Usando el proceso de tasas forward definido con anterioridad, se tiene que: (0.5)(0.095)((0.1215)2 (0.1215)2 − 0.5+0.1215Z(0.5)0.5 F (20i) = 0.095exp 1 + (0.5)(0.095) 2 88 Revista de Administración, Finanzas y Economı́a donde el valor Z es un número aleatorio con distribución normal estándar N (0, 1). Para obtener el valor esperado de F es preciso realizar un número importante de simulaciones; tı́picamente en la industria se harı́an de 10,000 a 100,000 simulaciones dependiendo de la velocidad de los compiladores disponibles como se establece en Dupire (1998). Gráfica 4.1. Simulaciones para el tiempo (N - 1) Para cada valor de F (20, i) debe determinarse el valor Gk dado por: Gk = (F (20, i) − K)F D, donde F D es el factor de descuento dado por la tasa libre de riesgo entre el periodo n Py n − 1. Con base en el número de simulaciones n, se calcula gk = (1/n) Gk y se obtiene el valor esperado de permanecer en la opción si ası́ conviene el tenedor. A partir de la comparación del valor gk con el valor y, en caso de que el valor de permanecer en la opción sea mayor que ejercer; entonces y será el nuevo piso para la siguiente iteración, es decir el procedimiento de cálculo descrito anteriormente se realiza ahora con el intervalo (y, B) ó (9.5%,19%) en este caso. Este proceso se repite hasta que la diferencia entre el piso y el techo sea inferior a , que representa el error con el que finalmente está calculado el valor frontera. Una vez que se calculó el valor en el perı́odo N − 1, es decir el perı́odo 19 en este ejemplo, se debe continuar con el perı́odo inmediatamente anterior N − 2 que en este caso serı́a el perı́odo 18. En este punto se parte nuevamente del piso y techo iniciales definidos anteriormente (0, B), se obtiene el valor medio y , y se harán simulaciones, esta vez desde el perı́odo N − 2 hasta N ; en general, las trayectorias inician en el perı́odo N − i y terminarán en el punto en que se encuentren por arriba Valuación de swaptions Bermuda ... 89 del punto frontera anteriormente calculado o en el perı́odo N . La gráfica 4.2 muestra como se generan las trayectorias desde cualquier punto N −i con i > 1. Gráfica 4.2 Simulaciones para el tiempo N - i. Con los valores Gk generados por medio de las simulaciones, se encuentra el valor esperado gk ; se compara con el punto medio y, y ası́ se procede de forma sucesiva hasta llegar al perı́odo N = 1. Una vez obtenida la tasa forward frontera para cada uno de los puntos; se puede obtener la tasa swap de cada uno de ellos; esto a través de la relación entre estas tasas y que se describe a continuación: Qn−1 j=i (1 + δF (ti )) − 1 Si = Pn−1 Qn−1 j=i k=j−1 (1 + δF (tk )) donde a) Si es la tasa swap para el siguiente perı́odo, b)F (tk ) es la tasa forward para el perı́odo actual, y c)δ es la periodicidad de la tasa. Finalmente el precio de la opción en el perı́odo actual corresponde al valor de permanecer en la opción ya que el tenedor no ejercerı́a de forma instantánea, es decir el valor de gk en t = 0. 5. Análisis de resultados y conclusiones Para el ejemplo anterior, por medio de simulación se obtendrı́an sendas fronteras, de tasas forward y de tasas swap, como las que se muestran en las gráficas 5.1 y 5.2. La interpretación de esta frontera de ejercicio indica que si la tasa observada se encuentra por arriba de dicha frontera, en el caso de un payer swaption, al tenedor le convendrı́a ejercer la opción de forma anticipada. 90 Revista de Administración, Finanzas y Economı́a Para obtener el precio de la opción en el tiempo cero, sólo es necesario calcular el valor de permanecer en la opción como se realizarı́a en cualquier tiempo t. Gráfica 5.1 Frontera de tasas forward. Gráfica 5.2 Frontera de tasas swap. En el ejemplo el precio de la opción resulta 1.75%; este valor parece ser razonable, pero para saber realmente la efectividad del algoritmo, a continuación se presenta un cuadro comparativo del precio de algunos swaptions Valuación de swaptions Bermuda ... 91 tipo bermuda que se cotizan en el mercado y cuyo proceso de cálculo puede tener un grado mayor de sofisticación, aunque no necesariamente de rapidez. Como se muestra en el cuadro anterior, los resultados obtenidos por la metodologı́a sugerida en este trabajo, son comparables con los niveles de compra y de venta que se cotizan en el mercado mexicano. El objetivo del presente trabajo, fue proponer una alternativa eficiente de cálculo para valuar los swaptions de tipo Bermuda, con base en un modelo iterativo para el cálculo de opciones americanas y aplicado al Modelo Libor o de mercado se logró obtener una rápida aproximación del valor de dicho producto. El modelo iterativo, fundado en simulaciones Monte Carlo, permite calcular el valor de permanecer en la opción o de ejercerla en cada un de los perı́odos definidos. El número de simulaciones que después de diferentes corridas se sugiere manejar, es de al menos 10,000; un número menor de simulaciones puede causar desviaciones grandes en el resultado. Por otro lado en cada uno de los puntos, el número de iteraciones sugeridas es 15, es decir el subproceso de definir un nuevo piso o techo para definir el valor frontera, se repite 15 veces. Esto implica que el grado de error, es decir la diferencia entre el piso y el techo es menor a 0.00001. El proceso estocástico utilizado en las simulaciones es el modelo Libor estándar para tasas forward. El algoritmo aquı́ definido encuentra una frontera de tasas forward y a partir de estas es posible encontrar la frontera de tasas swap. Este modelo tiene la ventaja sobre algunos ya existentes, de que es fácil de implementar y se puede obtener un resultado rápido y muy aproximado del valor de un swaption bermuda; entre las desventajas, en esta versión, es que se trabaja en una sola dimensión y el modelo Libor de un factor lognormal. En la comparación de precios realizada al final de la sección anterior, puede observarse que los precios calculados por el modelo de vectores son cercanos a las cotizaciones de compra y venta encontradas en el mercado mexicano; pero si se supone que el precio teórico real, se aproxima al precio promedio entre las posturas de compra y de venta, se puede observar que los precios calculados están subvaluados, esto se atribuye a los supuestos considerados de volatilidad, curva de tasas de interés y de modelo. Con base en estas dos consideraciones, en investigaciones futuras se puede ampliar la precisión del enfoque a través de un modelo multifactorial, ası́ como incorporando dinámicas estocásticas más ricas para la volatilidad. Asimismo, trabajos posteriores podrı́an realizarse desarrollos para el cálculo de sensibilidades y compararlas con otros modelos. Sin embargo cabrı́a mencionar que estudios empı́ricos como el de Driessen, Klaassen y Melenberg (2003) han demostrado que no es necesario utilizar un 92 Revista de Administración, Finanzas y Economı́a modelo de muchos factores para capturar la volatilidad total de los mercados; tres factores son suficientes para explicar en promedio el 97.8% de las variaciones y un sólo factor explica en promedio más del 80% por lo que la eficiencia obtenida con este enfoque de poder calcular un precio en menos de 10 segundos con un compilador de bajo nivel como VisualFortranMR hacen atractivo el resultado. 6. Referencias Wilmott, Paul (2001) Wilmott introduces Quantitative Finance. John Wiley & Sons Ltd. England. Hull, John C. (2006) Options, Futures and Other Derivatives. Prentice Hall. Sixth Edition. New Jersey. Jamshidian, Farshid (1997) Libor and swap market models and measures. Finance & Stochastics. 1,293-330. Andersen, Leif & Andreasen, Jesper (2000) Volatility skews and extensions of the Libor Market Model. Applied Matemathical Finance. 7,1-32. Broadie, Mark & Glasserman, Paul (1997) Pricing American-style securities using simulation. Journal of Economic Dynamics & Control. 21, 13231352. Fundia, Andrés (2002) A Fast Monte Carlo Algorithm for Pricing American Options. REMEF, Revista Mexicana de Economı́a y Finanzas. 1(3). 243253. Andersen, Leif (2000) A simple approach to the pricing of Bermudan swaptions in the multifactor Libor market model. General Re Financial Products. New York. Brigo, Damiano & Mercurio, Fabio (2001) Interest Rate Models. Springer Finance. First Edition. Italy. Litterman and Scheinkman (1991) Common Factors Affecting Bond Returns. Journal of Fixed Income. 1:54-61. Longstaff, Francis A. & SCHWARTZ, Eduardo S. (2001) Valuing American Options by Simulation: A Simple Least-Squares Approach. The Review of Financial Studies. 14(1). pp 113-147. Driessen, Joost, Klaassen, Pieter & Melenberg, Bertrand (2003) The Performance of Multi-Factor Term Structure for pricing and Hedging Caps and Swaptions. Journal of Financial and Quantitative Analysis. 38, 3; ABI/INFORM Global pg. 635 Di Vito, Rivera, Fundia 17. Rivera, Igor P. (2005) Aproximación numérica al precio de las opciones americanas: una evaluación al año de su aparición en MexDer. REMEF, Revista Mexicana de Economı́a y Finanzas. 4(3). 212-222. Fornari, Fabio (2004) Macroeconomic announcements and implied volatilities in swaption markets. BIS Quarterly review. September, 79-86. INSTRUCCIONES PARA LOS AUTORES 1) La Revista de Administración, Finanzas y Economía (Journal of Management, Finance and Economics) recibe trabajos de investigación en cualquiera de las áreas o especialidades de administración, economía, contabilidad y finanzas; en la dirección electrónica: < [email protected]> 2) Los trabajos que se sometan a arbitraje y dictaminación deberán ser inéditos y no podrán ser enviados simultáneamente para su publicación en otro medio. 3) Los trabajos pueden ser escritos en español o inglés. 4) El documento puede ser escrito en cualquier editor de texto (Word, PcTex, MigTex, LaTex) con letra tipo Times New Roman, tamaño 12 a doble espacio. El justificado no se deberá realizar en los primeros párrafos de cada sección o después de una tabla o fórmula. 5) Los títulos y subtítulos de secciones se escribirán de tamaño 14 y en negritas, comenzando siempre con una capitular. Se numerarán empleando la numeración arábiga. La numeración para los subtítulos será una numeración anidada: 2.1., 2.2., 2.3., etc. 6) La primera página del documento deberá contener a) título del trabajo; b) nombre del autor o autores, sin incluir el grado académico; c) institución de filiación; d) resumen de no más de 100 palabras en inglés y en español; palabras claves en Inglés y Español; f) clasificación JEL, disponible en el sitio electrónico: http://www.aeaweb.org/journal/jel_class_system.html#G y g) al pie de página deberán incluirse domicilio, teléfono y correo electrónico del autor o de los autores para recibir correspondencia. 7) Sólo podrá existir un pie de página adicional en la primera hoja. En dicho pie podrán los autores expresar sus agradecimientos o incluir alguna información adicional que consideren relevante. 8) Las ecuaciones deben estar numeradas consecutivamente, al igual que los cuadros, las figuras y las gráficas. 9) Los cuadros, gráficas y figuras deben poseer un título o encabezado que las distinga. Cada cuadro, gráfica o figura deberá incluir alguna referencia, el origen de la fuente de información y siempre deberá presentarse en blanco y negro. 10) La relación bibliográfica deberá presentarse al final del documento, en orden alfabético de autores y éstas deben ser como: Casar, J. I., G. Rodríguez y J. Ros (1985). Ahorro y balanza de pagos: un análisis de las restricciones al crecimiento económico de México. Economía Mexicana, núm. 7, pp. 21-33. Cox, J. C, J. E. Ingersoll, and S. A. Ross (1985). An Intertemporal General Equilibrium Model of Asset Prices. Econometrica, 53(2), pp. 363-384. Fuller, W A. (1996). Introduction to Statistical Time Series. 2nd ed., John Wiley, New York. Granger, C. W. (1980). Long Memory Relationships and the Aggregation of Dynamics Models. Journal of Econometrics, 14(1), pp. 227-238. The Trouble with Rational Expectations and the Problem of Inflation Stabilization, en R. Fredman y E. S. Phelps (comps.). INSTRUCTIONS TO AUTHORS 1) Revista de Administración, Finanzas y Economía (Journal of Management, Finance and Economics) is a peer reviewed scientific journal and receives manuscripts with subject matter in Management, Economics, Accounting and Finance. Articles should be sent to: < raf.ccm@servicios. itesm.mx> 2) Manuscripts will be considered for possible publication provided they are unpublished and not submitted elsewhere. 3) The articles could be written in English or Spanish. 4) The manuscripts could be written in Microsoft Word, PcTex, MigTex, or LaTex format, the font must be Times New Roman, size 12 and pages must be double spaced. Do not use indentation in the first paragraph of each section or after a table or equation. 5) Titles and subtitles of sections should be written in size 14 and bold faces. It should use the arabic numerals. Numerals for the subtitles should be consecutive: 2.1., 2.2., 2.3., etc. 6) The Cover page should include: a) titles of the paper; b) full name of the author(s), no specification of academic grade; c) institutional affiliation(s) ; d) a summary of your …paper in English and Spanish of at most 100 words; e) keywords in English and …Spanish;_f)_JEL_classification,_which_can_be_found_in:_http://www.aeaweb.org/journ …al/j_el_class_system.html#G and g) footnote should has: address, telephone and …electronic mail of the author(s). 7) Only one footnote at the first page is allowed. In the footnote, the author(s) could include some relevant information. 8) The equations should be in consecutive arabic numerals, and the same applies for the tables, figures and graphics. 9) Tables, figures and graphics should have a title. Each table, figure, graphic should include any reference or source. 10) Bibliographical references will be at the end of text with the author(s) in ….alphabetical order, according to the following examples: Casar, J. I., G. Rodríguez y J. Ros (1985). Ahorro y balanza de pagos: un análisis de las restricciones al crecimiento económico de México. Economía Mexicana, núm. 7, pp. 21-33. Cox, J. C, J. E. Ingersoll, and S. A. Ross (1985). An Intertemporal General Equilibrium Model of Asset Prices. Econometrica, 53(2), pp. 363-384. Fuller, W A. (1996). Introduction to Statistical Time Series. 2nd ed., John Wiley, New York. Granger, C. W. (1980). Long Memory Relationships and the Aggregation of Dynamics Models. Journal of Econometrics, 14(1), pp. 227-238. The Trouble with Rational Expectations and the Problem of Inflation Stabilization, en R. Fredman y E. S. Phelps (comps.). EGADE BUSINESS SCHOOL Revista de Administración, Finanzas y Economía (Journal of Management, Finance and Economics) es una revista de investigación científica con arbitraje, sus artículos son responsabilidad de los autores, son ajenos a ella las instituciones que representan, la revista o el Tecnológico de Monterrey. Índice en el que aparece la revista: IDEAS-RePEc. Revista de Administración, Finanzas y Economía (Journal of Management, Finance and Economics) EGADE Business School Calle del Puente 222, Col. Ejidos de Huipulco, Tlalpan. C.P. 14380, México D.F. Aulas III, cuarto piso. Tel.+52(55) 54832020 ext. 1390 y 1392 Correo electrónico: [email protected] Página: http://www.csf.itesm.mx/egade/publicaciones