administración, finanzas y economía

Transcripción

REVISTA DE
Volumen 5
Número 1
Enero-Junio
2011
ADMINISTRACIÓN, FINANZAS
Y ECONOMÍA
(Journal of Management, Finance and Economics)
Artículos
Comité Editorial
Director
José Antonio Núñez Mora
Directores Adjuntos
Carlos Manuel Urzúa Macías
Jorge Fernández Ruiz
Edgar Ortiz Calisto
Cristian Alonso y Eduardo Fracchia
El Emprendedor Shumpeteriano
Aportes a la Teoría Económica Moderna
Linda Margarita Medina Herrera y José Benito Díaz Hernández
Caracterización y modelado de redes: el caso de la Bolsa
Mexicana de Valores
José Carlos Ramírez Sánchez
Humberto Valencia Herrera
Consejo Editorial
Value at risk and return from the use Bayesian methods for stress testing
Alberto Hernández Baqueiro
in a world asset allocation and the 2008-2009 crises
Elvio Accinelli Gamba
José Luis de la Cruz Gallegos
Arturo Cortés Aguilar
Anabella Dávila Martínez
Estimación del residual de un bono respaldado por hipotecas mediante un modelo
Julián Pérez García
de riesgo crédito: una comparación de resultados de la teoría de cópulas y el modelo
Frank Dellman
IRB de Basilea II en datos del mercado hipotecario mexicano
Raúl Moncarz
Isabel Martínez Torres Enciso
Enrique Cásares Gil
Beatriz Mota Aragón
Capital Investments and the real options: new proposes
Carolyn Erdener
Igor P. Rivera, Enzo D’Antonio di Vito D. y Andrés Fundia
Editora de Producción
Valuación de Swaptions Bermuda basada en el modelo LIBOR
Martha F. Carrillo Urbina
adaptado a vectores frontera
EGADE BUSINESS SCHOOL
Directorio
Salvador Alva Gómez
David Noel Ramírez Padilla
María de Lourdes Dieck Assad
Rector del Sistema Tecnológico de Monterrey
Rector del Tecnológico de Monterrey
Rectora de las Escuelas Nacionales de Posgrado:
EGADE Business School & EGAP Gobierno y
Política Pública
Revista de Administración, Finanzas y Economía
Comité Editorial
Director
José Antonio Núñez Mora
EGADE Business School del Tecnológico de Monterrey
Directores Adjuntos
Jorge Fernández Ruiz
Edgar Ruiz Calisto
José Carlos Ramírez Sánchez
Carlos Manuel Urzúa Macías
El Colegio de México
Universidad Nacional Autónoma de México
Universidad Anáhuac
EGAP Gobierno y Política Pública del Tecnológico de
Monterrey
Consejo Editorial
Alberto Hernández Baqueiro
Elvio Accinelli Gamba
José Luis de la Cruz Gallegos
Anabella Dávila Martínez
Julián Pérez García
Frank Dellman
Raúl Moncarz
Isabel Martínez Torres Enciso
Enrique Cásares Gil
Carolyn Erdener
Tecnológico de Monterrey
Facultad de Economía de la UASLP
Tecnológico de Monterrey
Universidad Autónoma de Madrid, España
Universidad de Münster, Alemania
Universidad Internacional de Florida, USA
Universidad Autónoma de Madrid, España
Universidad Autónoma Metropolitana
Kazakhstan Institute of Management Economics
Research, KIMEP
Editora de Producción
Martha F. Carrillo Urbina
Revista de Administración, Finanzas y Economía (Journal of Management, Finance and Economics)
Volumen 5, Número 1, enero-junio 2011, publicación semestral
EGADE Business School
Calle del Puente 222, Col. Ejidos de Huipulco, Tlalpan. C.P. 14380, México D.F.
Aulas III, cuarto piso. Tel. +52 (55) 54832020 ext. 1390 y 1392
Correo electrónico: [email protected]
Página: http://www.csf.itesm.mx/egade/publicaciones
El presente ejemplar se encuentra protegido por la Ley Federal del Derecho de Autor. ISSN en trámite. Se prohíbe la reproducción
total o parcial del contenido en este número sin la previa autorización que por escrito emita el editor.
Artı́culos
Página
Cristian Alonso y Eduardo Fracchia
El emprendedor Shumpeteriano Aportes a la Teorı́a
Económica Moderna .................................................................................1
Linda Margarita Medina Herrera y José Benito Dı́az Hernández
Caracterización y modelado de redes: el caso de la Bolsa
Mexicana de Valores .................................................................................23
Value at risk and return from the use of Bayesian methods for stress
testing in a world asset allocation and the 2008-2009 crises ....................33
Arturo Cortés Aguilar
Estimación del residual de un bono respaldado por hipotecas mediante
un modelo de riesgo crédito: una comparación de resultados
de la teorı́a de cópulas y el modelo IRB de Basilea II en
datos del mercado hipotecario mexicano ...................................................50
Beatriz Mota Aragón
Capital Investments and real options:
news proposes.............................................................................................65
Igor P. Rivera, Enzo D’Antonio di Vito D y Andrés Fundia
Valuación de Swaptions Bermuda basada en el modelo LIBOR
adaptado a vectores frontera........................................................................77
Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and
Economics), vol. 5, núm. 1 (2011), pp. 1-22.
El Emprendedor Schumpeteriano
Aportes a la Teorı́a Económica Moderna
Cristian Alonso ∗
Eduardo Fracchia∗∗
Recibido 13 de septiembre de 2010. Aceptado 16 de diciembre de 2010
Resumen
A un siglo de la primera edición de la Teorı́a del Desenvolvimiento Económico,
las ideas de Schumpeter conservan una vigencia notable que sorprenderı́a al
propio autor. En este artı́culo se propone releer en particular el segundo capı́tulo
de su obra a la luz del contexto actual y analizar en qué modo sus enseñanzas
siguen siendo válidas y cuán consistente fue a lo largo de su vida académica.
Se ensaya también un rápido análisis de su influencia sobre las corrientes de
pensamiento actuales y las teorı́as modernas de innovación y entrepreneurship.
Abstract
One century after the first edition of the Theory of the Economic Development,
Schumpeter’s ideas remain so current that Schumpeter himself would be surprised. In this paper we propose to perform a new reading especially over the
second chapter of the Theory in order to check the validity of his teachings and
his consistency over time. A quick review of Shumpeter’s influence over current
economic research and over modern theory of innovation and entrepreneurship
is also included.
Clasificación JEL : B20, O30
Palabras clave: Schumpeter, Emprendedor, Innovación
Introducción
Schumpeter es un autor imposible de encasillar. Admira a Walras fervientemente pero comparte con los austrı́acos el rechazo al estado estacionario. Cree
inevitable el avance de las economı́as hacia el socialismo pero no por el fracaso
del capitalismo como señalara Marx, sino por su éxito. Schumpeter no forma
parte de ninguna de las grandes escuelas teóricas y, sin embargo (o quizás por
eso mismo), es que puede percibirse su influencia en economistas sumamente
disı́miles. Este trabajo no es una sı́ntesis de la obra schumpeteriana ni una
exposición detallada de cómo ha influido en la teorı́a económica. El objetivo
de este trabajo es simplemente releer a Schumpeter hoy y apreciar qué tan
∗
∗∗
IAE Universidad Austral. E-mail: [email protected]
IAE Universidad Austral. Casilla de correo No.49. Mariano Acosta s/n y Ruta Nacional
8 (B1629WWA) Pilar. Buenos Aires. Argentina. E-mail: [email protected]
2
Revista de Administración, Finanzas y Economı́a
vigentes son sus ideas. Una propuesta que puede sonar atractiva si se considera que pronto se cumplirán cien años de la primera edición de su “Teorı́a del
Desenvolvimiento Económico”. 1
La sección II ofrece una breve introducción biográfica, necesaria dada la
importancia que se le atribuye a ciertos eventos de su vida personal sobre su
trabajo. En la tercera parte se discuten los conceptos que constituyen el núcleo
de su teorı́a; el emprendedor schumpeteriano que, mediante la introducción de
innovaciones, motoriza el proceso de desarrollo no lineal de la sociedad. En
este punto se propone una explicación gráfica de la noción de nuevas combinaciones para mostrar que se trata de un concepto superador al de mero cambio
tecnológico del ideario neoclásico. En la sección IV se discute la tesis de obsolescencia del emprendedor. Y en la sección V se presentan algunas ideas del
pensamiento neo-schumpeteriano. No es la intención de ese apartado presentar
una discusión formal de las distintas ramas, sino simplemente evidenciar que
los conceptos de Schumpeter se encuentran presentes en la actualidad en dos
corrientes de pensamiento opuestas que emplean metodologı́as distintas para
formalizar las mismas nociones. Por último, la sección VI retoma el tema de la
innovación para mostrar la vigencia de las ideas del autor en este tópico.
2. Vida y obra de Joseph Shumpeter
Joseph Alois Schumpeter nació el 8 de febrero de 1883 en el pequeño pueblo
de Triesch, en Moravia (posteriormente parte del Imperio Austrohúngaro y, en
la actualidad, de la República Checa). En el seno de una familia acomodada,
propietaria de una fábrica textil, Schumpeter creció observando la cotidianeidad
del manejo de los negocios. Inició sus estudios de abogacı́a en la Universidad
de Viena, aunque pronto mostró interés por la economı́a. En particular, fue
alumno de Friedrich von Wieser y de Eugen von Boehm-Bawerk, entre otros
eminentes miembros de la escuela austrı́aca, cuya influencia resultará notable
durante toda su carrera. En 1906 obtuvo su doctorado y en 1909 se inició en
la labor docente en la Universidad de Czernowitz como profesor de economı́a y
gobierno.
Con sólo veintiocho años, en 1911 publicó su célebre “Teorı́a del Desenvolvimiento Económico”. En este libro desarrolló el concepto de emprendedor
como un agente irracional que permite, gracias a sus innovaciones en los procesos productivos, el avance de la sociedad. Comulga además con sus colegas
austrı́acos al negar la existencia de un estado estacionario señalando que el
sistema económico justamente avanza gracias a los desequilibrios permanentes
generados de forma endógena. Pero, como gran admirador de Walras que era
(el mayor economista de todos los tiempos, según expresa en su “Historia del
Análisis Económico”), presentó su teorı́a de cambio económico como un complemento a la teorı́a del equilibrio estático walrasiano. Más allá de las correcciones
que fuera desarrollando a lo largo del tiempo, el núcleo de las ideas plasmadas
en esa primera versión de la “Teorı́a del Desenvolvimiento Económico” estarı́a
presente en el resto de su obra.
1
A lo largo de este trabajo se empleará la palabra desenvolvimiento como sinónimo de desarrollo en sintonı́a con la primera traducción al castellano del libro “Theory of the Economic
Development”, aun cuando desarrollo sea el vocablo más usual.
El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna
3
En 1911 comenzó a dar clases en la Universidad de Graz. En 1919 se
desempeñó como ministro de finanzas de Austria durante poco más de medio
año. Y entre 1920 y 1924 presidió un pequeño banco privado, el prestigioso
banco Biedermann. Aunque su labor allı́ era bastante acotada, por lo que
aprovechó ese tiempo para probar suerte como inversor privado amasando una
pequeña fortuna que se evaporó con la crisis de 1924, junto con su trabajo.
Afortunadamente en 1925 recibió un ofrecimiento de la Universidad de Bonn,
con el cual inicia su retorno definitivo a la vida académica. En 1926 aparece
la segunda edición de su “Teorı́a del Desenvolvimiento Económico” en alemán,
una versión reducida y corregida de la anterior sobre la cual se editarı́a la
primera traducción inglesa en 1934. Pero en 1926 sufre la pérdida de su segunda
esposa, de su hijo recién nacido y de su madre y cae en una profunda depresión.
Continúa enseñando en la Universidad de Bonn hasta que, con el ascenso del
nazismo en Europa Central, decide mudarse a Estados Unidos en 1932.
En Estados Unidos fue nombrado profesor en la Universidad de Harvard,
cargo qua mantendrı́a hasta su muerte. En este perı́odo logró la publicación de
otras dos de sus grandes obras; “Ciclos Económicos” en 1939 y “Capitalismo,
Socialismo y Democracia” en 1942, además de infinidad de trabajos menores.
También fue presidente de la Econometric Society entre 1940 y 1941 y de la
American Economic Association en 1948. Luego de su muerte, ocurrida el 8 de
enero de 1950, Elisabeth, su tercera esposa, se ocupó de editar el último gran
trabajo de Schumpeter, “Historia del Análisis Económico”, que fue publicado
en 1954.
3. El emprendedor Schumpeteriano y el fenómeno del desarrollo
La teorı́a del desarrollo económico según la óptica de Schumpeter no se basa
en la especialización y la división del trabajo como indica Adam Smith o en el
cambio tecnológico exógeno como señalan las primeras versiones del modelo de
crecimiento neoclásico. Schumpeter delinea en cambio la figura del emprendedor como agente motor de un proceso de transformaciones contı́nuas en la organización de la producción que configuran un avance no lineal de la sociedad.
De hecho, en Schumpeter y, en particular, en el capı́tulo dos de su Teorı́a, titulado El Fenómeno Fundamental del Desenvolvimiento Económico, los conceptos
de emprendedor y desarrollo económico se encuentran tan ı́ntimamente ligados
que resulta imposible exponer una idea sin simultáneamente expresar la otra.
Schumpeter inicia ese capı́tulo diferenciando dos fenómenos casi antagónicos en
lo que refiere al avance de la sociedad, la adaptación y el desenvolvimiento o
desarrollo. Considera adaptación a todos aquellos cambios que se producen en
el sistema económico en respuesta a alteraciones en el medio externo.
El equilibrio walrasiano de una economı́a puede variar, por ejemplo, por
un incremento de la población; pero este no constituye un cambio cualitativo
del cual la teorı́a deba ocuparse desde que, para determinar sus consecuencias
económicas, basta incluir los nuevos números en el modelo. En contraposición,
el fenómeno de desarrollo es el que encierra toda la riqueza del análisis de la
evolución de los sistemas. En sus propias palabras,
“Por tanto, entendemos por “desenvolvimiento” solamente a los cambios
de la vida económica que no hayan sido impuestos a ella desde el exterior, sino
4
que tengan un origen interno”. 2
El desenvolvimiento es entonces un cambio endógenamente gestado, espontáneo y discontinuo y es en la concepción de esta mutación que emerge la figura
del emprendedor. Es importante notar que para Schumpeter no es necesario que
existan más factores productivos para el desarrollo (en efecto, eso constituye
una simple adaptación); lo que importa es que se hagan cosas nuevas con los
factores existentes, que se los combine de formas más eficientes, que se creen
nuevos productos. El emprendedor es el agente que genera esas innovaciones.
Asimismo Schumpeter tampoco pensaba que el ahorro fuera la clave para
entender el avance de las sociedades ya que, en cuanto a mera formación de
capital, no genera cambios cualitativos en la economı́a,
“El aumento lento, pero continuo en el tiempo, de la oferta nacional de
medios productivos y de ahorro, es indudablemente un factor importante en la
explicación del curso de la historia económica a través de los siglos, pero se
oculta completamente por el hecho de que el desenvolvimiento consiste primariamente en el empleo en forma distinta de los recursos existentes, en hacer
cosas nuevas con ellos, sin que importe si aumentan o no dichos recursos. Y esto
es cierto en forma más tangible en el tratamiento de perı́odos más reducidos.
Los distintos métodos de empleo, y no de ahorro, o de aumentos de la cantidad
de trabajo, han cambiado la faz del mundo económico en los últimos cincuenta
años”. 3
Schumpeter se ocupa entonces de delimitar el concepto de emprendedor o
empresario. No todo aquel que tiene a su cargo una empresa es un emprendedor.
Al contrario, sólo una porción muy reducida lo es, mientras el resto constituye
lo que él denomina meros gerentes de empresa. En la distinción no importa si
el individuo es el dueño o es sólo un dependiente de la empresa. Lo que importa
es cómo desarrolle su trabajo. El gerente de empresa actúa rutinariamente; el
emprendedor actúa innovando, ve con facilidad la existencia de nuevas combinaciones de factores y las implementa. En este sentido, el gerente de empresa
es la expresión tı́pica del homo economicus neoclásico, un agente racional que
contrapesa ingresos y costos y determina el curso óptimo de acción para su
negocio. El emprendedor es, en cambio, un individuo irracional como subraya
Schumpeter promediando el final del capı́tulo,
“Pues a no ser que asumamos que los individuos que nos interesan se hallen
impulsados por un deseo insaciable de satisfacción hedonista, el funcionamiento
de la ley de Gossen harı́a cesar todo esfuerzo posterior por parte de los jefes
de negocios. Pero la experiencia nos muestra que los empresarios tı́picos sólo
se retiran de la arena cuando se ha agotado su fortaleza y no se sienten a la
altura de su función. Esto no parece comprobar la representación del hombre
económico, que compara resultados probables con la desutilidad del esfuerzo y
alcanza a su debido tiempo un punto de equilibrio más allá del cual no desea
pasar”. 4
Es irracional porque las motivaciones de su accionar no se limitan a la maximización de beneficios con un fin hedonista como el de incrementar su consumo
2
Schumpeter (1957), pág. 74.
3
4
5
factible. El emprendedor schumpeteriano persigue, en palabras del autor, una
posición social poderosa, el placer de sentirse independiente y superior a los
demás, el impulso de lucha y conquista constante y la satisfacción de crear. Y
es irracional también porque las innovaciones que incorpora no surgen de un
proceso de estudio riguroso, sino de su propia intuición.
Su comportamiento transgresor no es gratuito en una sociedad más bien
regida por la inercia. Como lo sintetiza Swedberg (2007), los agentes enfrentan
dos fenómenos de resistencia al cambio originados en el instinto de supervivencia
de las sociedades y los individuos. Uno es de naturaleza sociológica, la sociedad
reacciona negativamente si alguien abandona la forma tradicional, conocida y
segura de obrar. El otro, de naturaleza psicológica, proviene del propio individuo, es la resistencia al cambio interna. Cambiar implica riesgos y los individuos, en general, rehúyen al riesgo. Es más fácil permanecer actuando en la
forma conocida antes que embarcarse en nuevas alternativas, donde no existe
un plan de acción acabado para todas las posibles vicisitudes con probabilidad
de ocurrencia. El emprendedor, al decidir aplicar una innovación supera esas
resistencias exponiéndose a la desaprobación general, a la negación de financiamiento o aceptación de su producto o, incluso a la agresión fı́sica.
El emprendedor en Schumpeter es un lı́der nato. En la edición de 1911
se refiere a él como un “Man of Action”, expresión que curiosamente no está
presente en la reedición de 1926, como lo nota Swedberg (2007). No acepta la
realidad tal como es, sino que busca cambiarla y para ello necesita convencer
a otras personas para que lo sigan. Necesita impresionar al banquero para
que financie sus proyectos. Si está introduciendo un nuevo producto, necesita
crear demanda. Conduce los factores productivos y los combina de formas
no tradicionales. Y lidera también al mercado en su conjunto, en cuanto sus
competidores lo seguirán e imitarán en la implementación de innovaciones.
Por supuesto, el autor reconoce que el emprendedor no está innovando
diariamente y que desarrolla ciertas actividades en forma rutinaria. Muchas
veces el emprendedor debe ocuparse de tareas administrativas o técnicas, del
manejo de personal, la liquidación de impuestos, entre muchas otras. Pero lo
que lo define como emprendedor es su vocación por la realización de nuevas
combinaciones. Es irrelevante por tanto el tamaño de la empresa que maneja,
como ası́ también la clase social a la cual pertenezca. Lo único que importa es
que cumpla esa función especial. Por eso Schumpeter señala,
“() y es en consecuencia tan raro que una persona conserve durante toda
su vida el carácter de empresario, como lo es para un hombre de negocios no
ser empresario, ni aun siquiera un momento y en forma modesta, durante todo
el curso de su vida”. 5
Es decir, es bastante improbable que el directivo de empresa nunca implemente un cambio en la forma de producción, comercialización o competencia,
aunque más no sea uno de reducida importancia. Como también resulta improbable pensar que alguien pueda generar innovaciones en forma continua durante
toda su gestión. Lo más razonable es pensar que, en ciertos perı́odos o en ciertas
áreas, el emprendedor tenderá a apegarse a la rutina.
Pero no es función tı́pica del emprendedor la invención, sino sólo su aplicación. Es ası́ como el empresario protagoniza el fenómeno de desarrollo en
5
6
Schumpeter mediante la implementación de innovaciones que benefician a algunos sectores y perjudican a otros en un proceso que dio en llamar destrucción
creativa, término que acuñó en “Capitalismo, Socialismo y Democracia”. De
todos modos, vale destacar que este proceso no es lineal o progresivo, como
el propio autor lo advierte. El empresario es el responsable, con su accionar,
tanto de las expansiones como de las depresiones debido a los efectos desequilibrantes que genera la incorporación de nuevos bienes o procesos productivos
en la economı́a.
Schumpeter da una concepción holı́stica a la innovación, y establece la distinción entre tres fases interconectadas que forman el proceso: invención, innovación y difusión. La invención según Schumpeter es aquel producto o proceso
que se genera en la esfera cientı́fico-técnica, es decir, el descubrimiento propiamente dicho. Ahora bien, la socialización o comercialización de la invención es
el paso decisivo para que se convierta en una innovación. La ciencia debe incorporarse a productos, procesos y/o métodos organizativos para poder difundirse
en el tejido social; siendo el empresario innovador quien hace de nexo entre ciencia y mercado. Es el que, en busca de ganancias independientes al crecimiento
de los factores de la producción, está dispuesto a arriesgarse a incorporar una
innovación. Esto le permitirı́a acceder a beneficios (un lugar monopólico en el
mercado, excedente organizacional, u otros) que harán que otros empresarios se
sumen y ası́ se animará la competencia entre empresas. Una vez difundida la innovación, el ciclo vuelve a empezar, el empresario buscará nuevas innovaciones
para aumentar su beneficio y prestigio personal.
Schumpeter define las innovaciones en general como el hallazgo de nuevas
combinaciones, la incorporación al sistema de conocimiento que es cualitativamente nuevo, no incluı́do en la configuración económica anterior. En particular,
establece cinco tipos de innovación:
a) La creación de nuevos productos o nuevas variantes a productos existentes
b) El desarrollo de nuevos métodos de producción o comercialización
c) El ingreso o apertura de nuevos mercados
d) La obtención de nuevas fuentes de materias primas o insumos
e) La modificación de la estructura de mercado (tı́picamente, la creación
de un monopolio)
Para ejemplificar gráficamente estas ideas se propone comparar la teorı́a
de la firma neoclásica con la schumpeteriana en una variante de la alternativa
propuesta por Winter (1967). El análisis que sigue es un modelo deliberadamente simplificado de equilibrio parcial con el sólo efecto de conseguir una
rápida exposición. Considérese un conjunto de firmas en una industria competitiva que producen el bien Y empleando un único insumo, trabajo, L a
través de una función Y = F (L). Asumiendo que la función de producción presenta rendimientos marginales decrecientes, admitirı́a una representación como
la del Gráfico 1. En la concepción neoclásica esta función separa las combinaciones factibles de las que no lo son. Todo punto por debajo de la frontera es
técnicamente posible, aunque sólo aquellos situados en la curva son eficientes.
Mientras que todas las combinaciones por encima de la función de producción
son inalcanzables, serı́a deseable poder obtener más producto empleando una
cierta cantidad de factor pero, en el estado actual de la tecnologı́a, eso no es
posible.
7
La firma neoclásica en competencia observa la relación de precios insumoproducto vigente en el mercado y determina el nivel de producción dentro del
conjunto de alternativas perfectamente conocidas que maximiza sus beneficios.
En el gráfico que precede, la firma comprarı́a L0 unidades de factor para elaborar Y0 unidades de producto. Si los precios cambiaran la firma sólo tendrı́a
que ajustar las cantidades para conseguir una nueva igualación de los precios
relativos al producto marginal y ası́ seguirı́a maximizando beneficios.
Gráfico 1. Función de producción. Interpretación Neoclásica.
En Schumpeter, sin embargo, más que la diferencia entre planes de producción factibles y no factibles, lo que interesa es distinguir los planes que
son empı́ricamente conocidos de los que no lo son. El Gráfico 2 es útil para
presentar esta idea. Por ejemplo podrı́a pensarse que, aún bajo la misma
función de producción que en el caso neoclásico, no todo el espacio de alternativas alcanzables es conocido por las firmas. Al contrario, las firmas podrı́an
conocer empı́ricamente sólo el área sombreada simplemente porque esos son los
planes que eventualmente han implementado con anterioridad y no tienen un
conocimiento perfecto de la función de producción.
En este caso, si el precio relativo del insumo disminuyera por el simple
incremento poblacional, por ejemplo, el grueso de las firmas maximizarı́a sus
beneficios de acuerdo a su conocimiento histórico de la función de producción
y se situarı́a en el punto (L1 , Y1 ). Este ajuste, un incremento en el nivel de
producto y empleo, constituirı́a lo que Schumpeter denomina una adaptación
de los agentes a nuevas condiciones y no desenvolvimiento.
Pero si alguna de las firmas estuviera dirigida por un emprendedor, un individuo no apegado a la rutina y a lo conocido, podrı́a exhibir un comportamiento
distinto. El individuo podrı́a notar que es posible incrementar la producción
más allá de los niveles reconocidos por el conocimiento histórico y podrı́a animarse a explorar planes productivos por encima de la frontera conocida. Al
hacerlo descubrirı́a que obtiene mayores beneficios si elige producir en el punto
(L2 , Y2 ), generando un mayor nivel de empleo y producto. De este modo el
8
emprendedor habrı́a introducido una innovación al identificar nuevas combinaciones de factores para la obtención del bien final. En el corto plazo su firma
se beneficiarı́a por mayores ganancias respecto al resto de sus competidores.
Mientras que en el largo plazo el beneficio se derramarı́a sobre el resto de la
sociedad también ya que, cuando el resto de las empresas note que este agente
encontró una forma más eficiente de producir, tenderı́an a imitarlo. Las que
ası́ no lo hicieran serı́an eliminadas del mercado. En definitiva, el aporte de
este emprendedor al desarrollo de la sociedad vendrı́a dado por el empleo de los
recursos en la forma óptima al descubrir la verdadera frontera de posibilidades.
Gráfico 2. Función de producción. Interpretación Shumpeteriana.
Gráfico 3. Función de producción. Cambio tecnológico.
9
Otro ejemplo que puede plantearse en este mismo escenario es el del tradicional cambio tecnológico. En este sentido, el emprendedor podrı́a observar la
existencia de herramientas nuevas o, simplemente distintas, que incrementarı́an
la productividad de sus operarios. Al introducirlas a su proceso de elaboración,
su frontera de posibilidades se expandirı́a hasta G(L), lo que le permitirı́a producir mucho más para cada nivel de empleo de insumos.
Si esta ganancia extraordinaria superara los costos de incorporar las herramientas, con el tiempo el resto de las firmas lo imitarı́a; pero mientras tanto
disfrutarı́a de beneficios por encima de los competitivos.
A modo de sı́ntesis, en la teorı́a original del emprendedor schumpeteriano,
este individuo se constituye en el motor de los saltos cualitativos en el orden
económico mediante la introducción de innovaciones en la producción, comercialización o estructura del mercado. Para ello se vale de su intuición más que
del cálculo acabado de costos y beneficios a la hora de detectar posibles nuevas
combinaciones. Del mismo modo que su motivación no se acaba en la persecución hedonista de la maximización del beneficios, sino que encuentra placer
en la actividad creadora y en una posición social poderosa.
4. La tesis de obsolescencia del emprendedor
Hacia el final de su vida algunos autores consideran que Schumpeter perdió
la fe en su emprendedor. En “Capitalismo, Socialismo y Democracia”, predice la
evolución pacı́fica del capitalismo hacia un estadio superior, el socialismo, como
consecuencia de la constante y creciente concentración económica en grandes
firmas que desplazan al emprendedor.
“This social function is already losing importance and is bound to lose it
at an accelerating rate in the future even if the economic process itself of which
entrepreneurship was the prime mover went on unabated. () The romance of
earlier commercial adventure is rapidly wearing away, because so many more
things can be strictly calculated that had of old to be visualized in a flash of
genius. () Thus, economic progress tends to become depersonalized and automatized. Bureau and committee work tends to replace individual action.” 6
Schumpeter señala que esta obsolescencia del emprendedor se explica básicamente por dos fenómenos. Por un lado, la concentración y burocratización
de los procesos de investigación y desarrollo en el seno de las grandes corporaciones. La búsqueda de nuevas combinaciones y los medios para ponerlas en
práctica se convierten en la tarea cotidiana de un grupo de técnicos preparados.
La innovación se torna de este modo una actividad rutinaria. Por otra parte,
tampoco es necesaria ya la voluntad del emprendedor para superar las resistencias, sociológicas y psicológicas, al cambio porque, tras tantas y tan frenéticas
mutaciones económicas (durante la primera mitad del siglo XX, en particular),
sociedades e individuos simplemente se acostumbraron a los cambios.
La predicción de Schumpeter era que las grandes firmas reemplazarı́an a
los emprendedores y a la burguesı́a industrial, en general. Perdida su función
caracterı́stica y con ingresos limitados a un salario por desempeñar una actividad rutinaria, esta clase social tenderı́a a desaparecer. La semilla para el paso
al socialismo quedarı́a ası́ sembrada.
6
Schumpeter (1976), pág. 133
10
Un importante debate se ha producido en la literatura en torno a este
cambio en el pensamiento schumpeteriano o, como se le denomina usualmente,
la tesis de obsolescencia del emprendedor. La corriente principal señala que
el cambio en Schumpeter se produjo cuando abandonó Austria y se instaló
en Estados Unidos. Allı́ fue cuando comprendió la naturaleza del capitalismo
tardı́o al observar las grandes empresas norteamericanas en las cuales la figura
de su emprendedor, bastante realista en el escenario austrı́aco de principios de
siglo, no tenı́a cabida.
Trabajos clásicos en esta lı́nea son los de Phillips (1971), Nelson (1977),
Klein (1977) y Freeman (1982). Todos ellos sugieren que se produjo un cambio
sustancial en la comprensión y descripción schumpeteriana de la economı́a a
tal punto que bien podrı́a considerarse que se trata de dos autores totalmente
distintos, un Schumpeter temprano y uno tardı́o. De hecho, Klein expresa esta
hipótesis de un modo bastante sugestivo:
“Schumpeter expressed very different views in his later writings than in his
earlier works, so much so that one has the impression there were two Schumpeters: Schumpeter the revolter against determinism, and Schumpeter the determinist.” 7
Estos autores destacan el cambio producido especialmente en su concepción
de las innovaciones. En el Schumpeter inicial, las invenciones eran un fenómeno
más o menos exógeno, que se convertı́an en innovaciones comerciales cuando un
emprendedor las aplicaba obteniendo ganancias extraordinarias que motivaban
al resto del empresariado a seguirlo. En el tardı́o, sin embargo, el proceso
exógeno de invención es endogeneizado en el interior de titánicas corporaciones
que requieren de la innovación continua, de la destrucción creativa constante,
para mantener su posición competitiva en el mercado. La intuición del emprendedor se vuelve un don irrelevante en instituciones burocráticas donde
todo se ha racionalizado. Sin embargo, existe otra lı́nea de investigación que
niega que Schumpeter haya modificado su teorı́a al mudarse a Estados Unidos.
Destaca en este sentido el trabajo de Langlois (2002). Langlois intenta demostrar que la teorı́a del emprendedor schumpeteriano mantuvo consistencia,
al menos, desde 1926 en adelante, seis años antes que abandonara Europa. En
efecto, en la última versión de la “Teorı́a del Desenvolvimiento Económico”,
basada en la segunda edición alemana de 1926 puede leerse:
“Sin embargo, cuanto más exactamente lleguemos a conocer el mundo natural y social, tanto más perfecto será nuestro control de los hechos; y cuanto
mayor sea la perfección con que puedan calcularse las cosas, con tiempo y
racionalización progresiva, y en forma rápida y segura, tanto más decrece la
importancia de dicha función. Deberá disminuir, por tanto, la importancia del
empresario, lo mismo que ha disminuido ya la del jefe militar.” 8
La similitud entre este pasaje del Schumpeter temprano y el previamente
citado del Schumpeter tardı́o es innegable. La idea detrás de esta consistencia
implicarı́a que, en situaciones de marcada incertidumbre o ignorancia, la intuición del emprendedor constituye un don muy valioso. Pero, en la medida que
el conocimiento acerca del ambiente externo se acrecienta, es más fácil calcular
7
Klein (1977), pág. 133.
8
11
costos, beneficios y riesgos; y determinar, sobre la base del análisis racional
de estos cálculos, el mejor curso de acción. De esta forma, la intuición del
emprendedor queda relegada a un segundo plano.
Langlois cita además el aporte de Becker y Knudsen quienes, al traducir el
ensayo “Emprendedor”de 1928, indican que efectivamente aprecian un cambio
en la teorı́a del emprendedorismo pero entre 1911 y 1926, y no entre 1926 y 1942.
En su interpretación, de constituir una caracterı́stica psicológica de un pequeño
grupo poblacional en la primera versión de la “Teorı́a del Desenvolvimiento
Económico”, la noción de emprendedor pasarı́a a intentar conceptualizar una
forma de comportamiento más bien despersonalizada, un ideal de individuo
o, quizás incluso, de organización. Estos autores leen entonces una versión
institucionalizada del emprendedor ya en los escritos de 1926. Para Becker
y Knudsen este cambio se debió a un conjunto de eventos y tragedias en la
vida personal de Schumpeter. Para Langlois, se explica más bien por una
intención de compatibilizar su teorı́a con las ideas burocráticas de Max Weber,
que gozaban de notable reconocimiento en la Europa Central de la década del
veinte.
Sin embargo, en repetidos pasajes de la segunda versión de su libro, Schumpeter reitera la definición explı́cita del emprendedor como una persona y no
como una institución, poniendo especial énfasis en la importancia de su intuición. A favor de estos autores podrı́a pensarse que, el propio Schumpeter señala
en el prefacio a la versión inglesa de 1934 que, en la edición de 1926 que sirvió
de base para la traducción, intentó mantener la obra original de 1911 aplicando
sólo alteraciones menores; lo que justificarı́a la persistencia de la figura del emprendedor como individuo. Pero esas alteraciones menores no impidieron que
eliminara un capı́tulo completo y reescribiera el segundo y el sexto intentando
excluir los términos estático y dinámico que, a su juicio, habı́an motivado ciertas
confusiones entre sus lectores. En consecuencia, no parece tan irracional inferir
que, si Schumpeter hubiera estado convencido que el emprendedor ya no era
un individuo sino una institución, habrı́a introducido algunos cambios en este
sentido. En nuestra opinión, la teorı́a schumpeteriana del emprendedorismo
mantuvo una consistencia notable durante toda la obra de este autor. Incluso
Langlois (2002) reconoce esta posibilidad al señalar:
“A more detailed study might well discover that the continuity really goes
back to 1912 or earlier, not merely to 1926.” 9
El emprendedor de 1911 es el mismo que el de 1926 y de 1934; lo que
cambió es el medio ambiente en el que se desarrolla y las herramientas que
utiliza en la toma de decisiones. La resistencia al cambio fue desvaneciéndose
y el desarrollo de nuevas técnicas de gestión y análisis de mercados proveyeron
de mayor información al individuo para manejar la incertidumbre. En este
sentido, el emprendedor se ha racionalizado. Y fue el propio autor el primero
en llamar la atención en este sentido, contrario a lo que afirma Berumen (2007),
por ejemplo. Sin embargo, ningún individuo toma decisiones bajo información
perfecta. En ocasiones, ni siquiera puede emplear toda la información que
podrı́a conseguirse por no disponer del tiempo o los recursos para obtenerla,
como también ya lo notaba Schumpeter. De modo que, la intuición, el talento
9
Langlois (2002), pág. 11.
12
individual, aún cuando reducida en su importancia, sigue siendo una parte no
despreciable del comportamiento emprendedor.
Es cierto que la teorı́a de 1911 fue diseñada especialmente a medida del
capitalismo temprano. Pero también es verdad que el autor entrevió pronto que
el paso a la nueva etapa estarı́a relacionada con un detrimento de la intuición
en pos de la racionalidad. Y es largamente reconocido que no esperaba elaborar
una teorı́a económica universal válida para toda época y lugar. En sus propias
palabras, en su prólogo a la edición española de 1944,
“Se me ha dicho con frecuencia que mi esquema analı́tico se refiere únicamente a una época histórica que está rápidamente llegando a su fin. Y en eso
estoy de acuerdo. En mi opinión la teorı́a económica no podrá ser nunca, en
este sentido, más que la teorı́a de una cierta época histórica.” 10
Probablemente lo que ha motivado este nivel de discusión es el énfasis
particular que Schumpeter otorgó a las grandes corporaciones en “Capitalismo,
Socialismo y Democracia”. Al señalar que, en el lı́mite, estas empresas desplazarı́an totalmente a los emprendedores en cuanto a la endogeneización de
la generación de innovaciones posiblemente estaba considerando que las firmas
crecerı́an y avanzarı́an en forma perpetua gracias a su posición privilegiada en el
mercado, constituyendo una suerte de oligopolio de cı́clopes industriales. Pero
la evidencia demuestra que ese no es el caso. Muchas grandes corporaciones con
centros integrados de investigación y desarrollo han sucumbido por su propio
peso. Mientras que proyectos surgidos en un garaje han revolucionado el mundo
tecnológico.
Es evidente que el emprendedor de la actualidad no es idéntico al arquetipo
schumpeteriano. Pero no es menos cierto que comparte varios de los atributos
más importantes. Es un agente más racional, pero no desprecia la intuición.
Ve oportunidades donde otros sólo ven rutina e implementa innovaciones que
revolucionan el mercado. Afirmar que, como en el pensamiento de Schumpeter,
este emprendedor es la base del desarrollo puede sonar un poco arriesgado. Pero
que juega un papel importante en el proceso es innegable.
5. El pensamiento Schumpeteriano en las corrientes actuales
Tras la muerte de Schumpeter, sus contribuciones en materia de crecimiento
fueron soslayadas. El mainstream se hallaba abocado a la formalización matemática de las teorı́as tras la aparición de los celebrados modelos de HarrodDomar (1946) y de Solow (1956). Las ideas de Schumpeter eran difı́ciles de
expresar en relaciones matemáticas, él mismo durante su vida habı́a intentado
hacerlo a sabiendas que el resto de los economistas teóricos no tomarı́a en serio
su teorı́a del desarrollo hasta que pudiera formalizarla, según lo afirma Klein.
Pero los esfuerzos de Schumpeter y de algunos de sus seguidores inmediatos
no lograron los resultados deseados. Probablemente porque todavı́a no estaban
disponibles las herramientas matemáticas y computacionales necesarias para
hacerlo.
No es la intención de esta sección realizar un análisis detallado de la amplia
gama de autores influenciados por el pensamiento de Schumpeter. Al contrario,
a sabiendas de que se comete la imperdonable omisión de autores notables, esta
10
13
sección simplemente intenta proveer una breve identificación de las dos principales corrientes que fundamentan sus trabajos en los conceptos de emprendedor,
innovación y destrucción creativa, entre otros. A grandes rasgos se clasifica a
estos autores en dos ramas. Por un lado, los neo-schumpeterianos que persiguen
la formalización de las ideas de la “Teorı́a del Desenvolvimiento Económico” a
través de modelos de simulación. Por el otro, economistas neoclásicos que desarrollan modelos de crecimiento endógeno utilizando versiones simplificadas de
tales conceptos. A continuación, una rápida descripción de cada grupo.
De acuerdo a Kwasnicki (2003) fueron el desarrollo de la informática en los
años cincuenta y sesenta y del enfoque de simulación los que permitieron comenzar a estudiar problemas no lineales. El primer modelo neo-schumpeteriano en
emplear simulaciones para emular el comportamiento evolucionista fue el de
Winter en 1964, “Economic Natural Selection and the Theory of the Firm”.
Los esfuerzos en esta lı́nea se intensificaron durante las décadas siguientes hasta
consolidarse en el libro de referencia de la economı́a evolucionista “An Evolutionary Theory of Economic Change” publicado por Nelson y Winter en 1982.
Desde entonces, han proliferado modelos de simulación inspirados en las ideas
del crecimiento schumpeteriano basado en la destrucción creativa.
Estos modelos desplazan totalmente la idea de equilibrio general a favor
la modelización evolucionaria. Esto les permite incorporar supuestos mucho
más realistas respecto a los modelos neoclásicos tradicionales. Se consideran,
por ejemplo, heterogeneidad de agentes, racionalidad acotada, mecanismos alternativos de innovación y apropiación, estructuras de mercado alternativas,
aprendizaje en la producción, rendimientos no decrecientes, etc. Pero un punto
particularmente interesante entre estos autores es que complementan su modelo de simulación con el análisis de la experiencia histórica, contrastando sus
resultados con la evidencia empı́rica. Un claro compromiso metodológico con la
visión de Schumpeter para quien la teorı́a económica, la estadı́stica y la historia
debı́an interactuar en la explicación de los fenómenos. Aunque tal compromiso
no implica que los neo-schumpeterianos hayan adoptado los trabajos del maestro como dogma. Al contrario, como lo señala Freeman (1998) es sorprendente
la variedad de enfoques que ha proliferado en el marco de esta corriente, muchos
de ellos incluso criticando al propio Schumpeter.
En general, los autores neo-schumpeterianos comparten la visión del capitalismo como un fenómeno evolutivo que muta en el tiempo a través de innovaciones productivas, comerciales o estructurales. Partiendo de ese denominador
común, se ha sometido al análisis y formalización a la mayor parte de las ideas
de Schumpeter y se han explorado áreas sobre las que el autor no habı́a trabajado como es el caso del comercio internacional, subdesarrollo y desarrollo
regional. Aunque también es cierto que otras áreas relevantes han sido excluidas del análisis, por ejemplo, teorı́a del consumidor. Para un excelente repaso
de esta literatura se sugiere Freeman (1998).
Una última caracterı́stica notable de los modelos neo-schumpeterianos es
que centran su estudio en la innovación microeconómica a nivel de firmas o industria y no a escala macroeconómica donde la teorı́a del desarrollo se encuentra
estancada en un callejón sin salida. Estudios notables se han llevado a cabo
tomando las caracterı́sticas especı́ficas de la industria sobre el avance técnico
en agricultura, minerı́a y, especialmente, actividades manufacturares. Sin embargo, se ha dejado de lado al sector más importante de la economı́a global y al
14
más afectado por los avances tecnológicos, el de los servicios. Por otra parte, las
innovaciones estudiadas se han concentrado en cambios tecnológicos en la producción pero escasas investigaciones se han llevado a cabo sobre innovaciones
en organización. Aunque justo es reconocer el elevado grado de dificultad que
la modelización de estos avances impone.
En otra lı́nea de sucesión, ya sobre la década del noventa, las ideas de
Schumpeter encontraron cabida en el marco de los modelos de crecimiento
endógeno. Estos autores no son neo-schumpeterianos en el sentido que se le ha
dado al término en los párrafos anteriores desde que no emplean la metodologı́a
evolucionista de los modelos de simulación. En cambio, emplean modelos de
corte neoclásico para formalizar las ideas de Schumpeter acerca de la endogeneización de las innovaciones, la competencia como fenómeno evolutivo que
expulsa a quienes no se ajustan a las nuevas condiciones de mercado, la destrucción creativa, entre otros.
A partir de los trabajos fundacionales de Romer y Lucas, en 1992 llegó el
destacado aporte de Aghion y Howitt, quienes desarrollaron un modelo de crecimiento endógeno basado en la idea schumpeteriana de la destrucción creativa.
Propusieron una economı́a constantemente sometida a innovaciones tecnológicas
que benefician a algunos sectores y perjudican a otros y donde la competencia se ocupa de eliminar a los que no tienen éxito desarrollando o imitando
innovaciones. En este sentido se diferencian de la teorı́a AK convencional que
considera al progreso tecnológico simplemente como otro modo de acumulación
de capital ignorando la posible existencia de conflictos interpersonales. Este
trabajo original fue continuado en la misma tradición generalizando el modelo básico y desarrollando nuevas alternativas. A continuación se propone un
repaso breve de aquella versión.
Aghion y Howitt (1992) constituye una primera aproximación al crecimiento endógeno bajo la concepción schumpeteriana en un contexto de incertidumbre. Para ello modelizan las innovaciones como una secuencia aleatoria
de mejoras únicamente en la calidad de los productos, por lo que constituye un
modelo de innovaciones verticales ya que estas vuelven obsoleta la tecnologı́a
anterior. Ası́ intentan formalizar parcialmente el concepto de destrucción creativa. Adicionalmente suponen que las investigaciones son llevadas a cabo por
las firmas quienes gozarı́an de un monopolio sobre las eventuales invenciones.
Para operacionalizar estos supuestos, Aghion y Howitt suponen que el trabajo
en una economı́a puede destinarse a investigación y desarrollo o a producir
un insumo del cual se obtiene un bien final. Cuando una empresa incorpora
una innovación monopoliza la producción del insumo y goza de beneficios extraordinarios hasta que otra empresa desarrolle otra innovación y la desplace.
Por último, las innovaciones se suponen idénticamente distribuidas Poisson con
parámetro λ.
Con esta estructura el monopolista (actual y potencial) maximiza beneficios llegando a una ecuación de arbitraje. Aparece luego una relación negativa
entre la investigación corriente y la futura porque si se advierte que existirá
mucha investigación en los próximos perı́odos, las rentas creadas por la investigación actual se ven amenazadas, desincentivándola. En virtud de esta
relación negativa el modelo puede tener una única solución de estado estacionario o varias originando posibles senderos de crecimiento cı́clicos e, incluso,
una trampa de no crecimiento donde la innovación se detiene. Aunque vale
15
notar que esta relación negativa se da porque el monopolista no endogeneiza la
externalidad positiva de la investigación corriente sobre la futura. Si se permite
que sea un planificador de Pareto el que toma las decisiones podrı́a alcanzarse
una tasa de crecimiento mayor que bajo descentralización. Para que esto se
produzca los efectos que generan mayores incentivos sociales a la investigación
por el lado de una menor tasa de descuento social respecto a la privada (porque
para el planificador el beneficio de la próxima innovación será para siempre) y
por el problema de la apropiabilidad (el monopolista no puede endogeneizar los
beneficios que producen sus innovaciones sobre las futuras) deben superar al
desincentivo social que resulta de la internalización por parte del planificador
de la destrucción del retorno social de la innovación anterior (que los privados
no interiorizan).
El aporte más significativo de esta lı́nea de trabajo claramente resulta
entonces la modelización de intereses contrapuestos y su impacto sobre el crecimiento. En este sentido el enfoque verdaderamente responde al ideal schumpeteriano aún cuando constituye una simplificación notoria. En palabras de
Howitt respecto a la superioridad de este esquema de trabajo sobre los modelos
AK,
“Our new theory treats innovation as a separate activity from saving, and
it is explicit about who gains from it, who loses, how the gains and losses depend
on social arrangements, and how such arrangements affect society’s willingness
and ability to progress.” 11
Las generalizaciones a este modelo básico desarrolladas en los últimos veinticinco años versan sobre distintas modificaciones a los supuestos. Pero las
que resultan más interesantes son las relacionadas a competencia, polı́tica de
patentes, diferencias de ingresos entre paı́ses y revoluciones tecnológicas. En
términos de competencia, por ejemplo, los modelos de crecimiento señalan que
la competencia reduce la tasa de crecimiento al contraer la tasa de retorno potencial de las innovaciones. Sin embargo, la evidencia empı́rica parece afirmar
lo contrario. Lo que motivó a estos autores a buscar explicaciones alternativas
en el marco del modelo de 1992. Ası́ aparecen modelos incluyendo barreras
de entrada, problemas de principal-agente y maximizaciones sobre los beneficios incrementales y no sobre los absolutos. Para más detalles acerca de las
generalizaciones del modelo de 1992 se sugiere Aghion y Howitt (1998).
6. La Innovación en la Teorı́a Moderna
Las ideas de Schumpeter acerca de las innovaciones también han evidenciado
una revitalización en los últimos años. Probablemente por la gravitación que
ciertos autores neo-schumpeterianos han ejercido sobre organizaciones como
la Organización para la Cooperación y el Desarrollo Económico (OCDE) y
el Fondo Monetario Internacional (FMI) en pos de la estandarización de las
estadı́sticas sobre investigación y desarrollo. En el Manual de Oslo (2005) de la
OCDE puede apreciarse una cierta influencia de Schumpeter cuando se señala
que las innovaciones pueden agruparse en cuatro categorı́as:
11
Howitt (2002), pág. 1.
16
a) La innovación de producto implica cambios significativos en las caracterı́sticas de las mercancı́as o de los servicios. Se incluyen tanto las mercancı́as totalmente nuevas como los servicios y las mejoras significativas
de los productos existentes.
b) La innovación de proceso representa cambios significativos en los métodos de producción y de distribución.
c) La innovación de organización, referida a la puesta en práctica de nuevos
métodos de trabajo, tanto de la organización como del lugar de trabajo
y/o de las relaciones exteriores de la empresa. La innovación de comercialización refleja la puesta en práctica de nuevos métodos de comercialización; desde cambios en el diseño y el empaquetado hasta la promoción
del producto mediante nuevas polı́ticas de precios y de servicios.
Además, el concepto de innovación ha cobrado particular vigor en el marco
de las teorı́as modernas de competitividad. Existen varias estrategias de competitividad, pero no se puede negar que la innovación es el único medio para
lograr que la competitividad de una nación a nivel internacional sea genuina,
sustentable y acumulativa. La capacidad de innovar, de apropiarse de rentas
tecnológicas y de generar economı́as de escala dinámicas y sustentables explican las diferencias entre paı́ses en cuanto a PBI per cápita y distribución de
la riqueza; y explican también el fenómeno de convergencia que se observa en
la actualidad en cuanto la innovación ha cobrado importancia dentro de las
naciones emergentes como puede apreciarse en el Gráfico 4. Los paı́ses emergentes han incrementado el gasto en investigación y desarrollo en relación a
su producto mucho más fuertemente que los paı́ses industrializados intentando
reducir la brecha tecnológica. Liderando esta tendencia aparece China donde
la participación se multiplicó por 2,5 entre 1996 y 2007.
Gráfico 4. Gasto en Investigación y Desarrollo en relación al PIB. Paı́ses seleccionados.
Fuente: Ministerio de Ciencia, Tecnologı́a e Innovación Productiva, Argentina
17
Los niveles de crecimiento y renta de los estados en una economı́a globalizada están determinados por su especialización internacional, y ésta a su vez
depende de las caracterı́sticas de su estructura productiva, las decisiones empresarias y el entorno. Un crecimiento genuino sólo se producirá si el entramado
industrial es capaz de absorber y generar tecnologı́a en un proceso de diversificación de la actividad industrial desde las tecnologı́as más simples a las más
complejas, lo que no implica necesariamente un tipo particular de distribución
sectorial de la producción sino la capacidad de mejorar la productividad y la
complejidad tecnológica de cada uno de los sectores industriales existentes.
El proceso de destrucción creativa lleva al desarrollo de nuevos productos
y procesos empujando al crecimiento de las naciones. Sin embargo, el impacto
de la innovación en el bienestar social de un paı́s puede ser positivo o negativo.
Según Reinert, el progreso técnico puede conducir al desarrollo o puede acentuar el subdesarrollo. El avance tecnológico puede impactar en la sociedad a
través de menores precios, menores salarios y, en consecuencia, un menor bienestar, asociado a desempleo, exclusión y deterioro de la distribución del ingreso
(derrame clásico de la tecnologı́a); o puede generar el efecto contrario (mayores
precios y mayores salarios) y el sector se beneficiará a través de un aumento en
sus ingresos. El rumbo que tomará el desarrollo vendrá dado no sólo por las
caracterı́sticas de la firma sino también por el entorno a nivel macro.
Desde una perspectiva micro, una primera aproximación a la idea de innovación dentro de una empresa es el modelo lineal de innovación que se inicia
con la investigación básica y finaliza con la implementación del nuevo proceso
o la introducción al mercado del nuevo producto. Sin embargo, la realidad
muestra que la innovación no es lineal sino más bien un proceso con mucha
retroalimentación y repetitivo. Las decisiones de las firmas no vienen sólo de
las invenciones cientı́fico técnicas, sino que a estas se le agrega la información
proveniente de la demanda y las posibilidades reales de implementar el cambio.
En otras palabras, ya que el proceso innovador depende de la capacidad de la
firma de generar nuevo conocimiento, la firma deberá sumar a sus fuentes generadoras de conocimiento (internas y/o externas) vinculaciones con sus clientes y
proveedores, más allá de las relaciones comerciales tradicionales. La innovación
surge de la empresa, pero también se da en un contexto histórico, geográfico y
socioeconómico determinado que agregan aún más información y conocimiento.
De modo que también en este sentido valen las enseñanzas de Schumpeter en
cuanto es el emprendedor quien incorpora nuevas combinaciones que son concebidas en su observación del medio en el cual su negocio se halla inmerso.
A todo este proceso de innovación hay que ubicarlo dentro de la estrategia
empresarial que determinará en qué momento del proceso de destrucción creativa ingresará la firma al mercado. Según Porter (1990), se puede distinguir una
estrategia de lı́der o de diferenciación entre las empresas que entran al proceso
en la etapa de introducción del producto (proceso), la estrategia de seguidor
combinada en parte con una estrategia de diferenciación entre las que sigan
con la imitación, y una estrategia de liderazgo en costos entre las que avanzan
en la estandarización del producto y procesos. Dependiendo del objetivo que
tenga y sus acciones, el derrame en el tejido social variará ası́ como lo harán la
cantidad de esfuerzo que deba aportar y la demanda de capacidad a la que esté
exigida. La trayectoria que vaya tomando la firma también tendrá consecuencia
sobre los determinantes del cambio tecnológico, porque la selección, desarrollo
18
y adaptación de la estrategia tendrán un efecto directo sobre la disponibilidad
de la tecnologı́a. Según Pavitt (1984), otra forma de explicar la dinámica del
cambio tecnológico es a partir de la pertenencia sectorial. En este enfoque la
estrategia innovadora de la firma depende de las caracterı́sticas del sector y es
entonces a nivel de la industria donde deben buscarse los patrones de conducta
innovadora. Lall (1992) sigue esta lı́nea y explica la dinámica de acuerdo al
grado de intensidad tecnológica de los sectores industriales medido a partir de
los esfuerzos en I+D. Lo que falları́an en explicar son los diferentes niveles de
conocimiento incorporado que se pueden encontrar en un mismo sector. Pero
en todos estos planteos está presente la idea schumpeteriana de que existen
firmas emprendedoras que toman la iniciativa en la implementación de cambios
y firmas seguidoras que se apresuran a imitarlas para no quedar excluidas del
mercado. Además, de la experiencia se sabe que las firmas innovadoras tienen
menores probabilidades de desaparecer ante crisis económicas, son menores expulsoras de empleo cuando buscan sobrevivir y alcanzan mayores niveles de
crecimiento de las ventas e inserción exportadora. Más aún, presentan mejores
indicadores de desempeño y trayectoria que las firmas no innovadoras, e incrementos en la calidad y cantidad de los recursos humanos. Punto a favor de la
proposición de Schumpeter al señalar que son los emprendedores quienes lideran
el crecimiento de la economı́a.
El efecto positivo de la innovación sobre la performance financiera, medida
por el valor de mercado o el precio de las acciones, aparece como bastante
robusto en la evidencia empı́rica, como discuten Blundell et al. (1999), Griliches
(1984), Hall et al. (2005) y Toivanen et al. (2002).
Existe también abundante literatura documentando los efectos de la innovación sobre el crecimiento y las ganancias de las firmas, aunque no exenta de
ciertas ambigüedades. Geroski et al. (1993) encuentran un impacto positivo de
las innovaciones exitosas de la firma sobre su margen de ganancias. Mientras
que Geroski y Machin (1992) destacan la persistencia y significatividad de las
diferencias en rentabilidad entre compañı́as innovadoras y no innovadoras. Por
su parte, Freel (2000) argumenta que tales diferenciales dependen de factores
como el tamaño de la firma y las caracterı́sticas de la industria.
El trabajo de Adamou y Sasidharan (2007) encuentra que firmas con mayor
ratio I+D a ventas crecen más rápido. Yasuda (2005) llega a un resultado
análogo al estudiar el impacto de los gastos de innovación por empleado sobre
el crecimiento de la compañı́a. Yang y Huang’s (2005), Foray et al. (2007) y
Del Monte y Papagni (2003) arriban a las mismas conclusiones. En cambio,
Hershmati y Lööf (2006) no encuentran impacto significativo de la innovación
sobre el crecimiento de las ventas en una muestra de 930 firmas suizas. Almus
y Nerlinger (1999) concluyen que el crecimiento de una firma es sólo afectado
por su tamaño y edad, pero no por sus actividades de innovación.
Además, las actividades de innovación aumentan la probabilidad de supervivencia de las firmas. Christensen et al. (1998) muestran que la combinación de
estrategias tecnológicas y de mercado son predictores importantes de la probabilidad de supervivencia. Cefis y Marsili (2003) muestran que las firmas jóvenes
y pequeñas son las más expuestas al riesgo de salida y, al mismo tiempo, las
que más se benefician de las innovaciones para permanecer en el mercado.
Por último, y a modo de conclusión y aplicación de estos conceptos, una mirada a la realidad argentina desde esta óptica. La historia económica argentina
19
reciente ha estado signada por la incertidumbre y vulnerabilidad causadas por
los recurrentes desequilibrios macroeconómicos. A la incertidumbre inherente
al proceso de innovación hay que agregarle entonces la del entorno, y esto impacta directamente en los procesos de toma de decisiones de inversión. Los
proyectos de innovación suelen ser de corto plazo para ser capaces de sostener
la competitividad en los perı́odos de crecimiento y minimizar la exposición en
caso de una nueva crisis.
Además, las empresas enfrentan el inconveniente adicional de un mercado doméstico de reducido tamaño que limita las economı́as de escala que
podrı́an obtenerse, desincentivando los gastos en innovación y promoviendo el
gasto en tecnologı́a incorporada (productos de tecnologı́as anteriores a las existentes pero que ya fueron amortizadas en mercados desarrollados) sin esfuerzos
endógenos de generación y apropiación de conocimiento. Esto se combina con
una baja inserción internacional como muestra Porta (2007), de forma tal que
los estándares de competencia del grueso de las firmas locales son justamente los
del mercado local: gustos y preferencias de menor sofisticación relativa, baja demanda de conocimiento, bajo-medio poder adquisitivo y escala reducida. Paralelamente, las interacciones entre los entes públicos como el Sistema Nacional
de Innovación (SNI), el Instituto Nacional de Tecnologı́a Industrial (INTI) y las
universidades y las empresas están lejos de ser las de los paı́ses desarrollados, y
están más asociados a vı́nculos rutinarios asociados al desarrollo de pruebas y
ensayos y al cumplimiento de normas que a la búsqueda de nuevos productos y
procesos como lo expresa Suárez (2007).
7. Conclusiones
Schumpeter fue el primero en señalar que su teorı́a económica carecı́a de valor
universal, del mismo modo que todas las teorı́as económicas carecen ya que sólo
sirven para explicar un perı́odo histórico particular. Sin embargo, a casi un siglo
de la primera edición de la “Teorı́a del Desenvolvimiento Económico” sus ideas
gozan de una validez notable. Evidentemente el emprendedor que describe en
el segundo capı́tulo de su obra no es idéntico al emprendedor actual, pero tiene
muchos puntos en común. Se trata de un agente en búsqueda permanente
de desafı́os impulsado no sólo por el beneficio económico, sino también por el
reconocimiento de la sociedad y por una sensación de superioridad y liderazgo.
En cuanto al modo de incorporar las nuevas combinaciones, seguramente en
la actualidad a cada innovación le antecede un estudio mucho más minucioso,
racional y menos intuitivo que en la Austria de principios del siglo XX. Sin
embargo eso no implica que el talento natural para percibir oportunidades de
negocio constituya un don inútil.
Además en este trabajo se rescata la consistencia, en lı́neas generales, del
pensamiento schumpeteriano durante más de cuarenta años, contrario a la tesis
de obsolescencia que indica que existe un Schumpeter temprano europeo y un
Schumpeter tardı́o americano con posiciones irreconciliables. El autor claramente vislumbró que el emprendedor tal y como lo habı́a descrito en su teorı́a
se transformarı́a en un agente más racional en la medida que mayores herramientas técnicas estuvieran a su alcance. De ese modo el proceso de desarrollo se
tornarı́a más burocrático y despersonalizado. Y esta apreciación aparece ya en
la primera edición de la Teorı́a en 1911, treinta años antes de “Capitalismo,
Socialismo y Democracia”, cuando la expone en profundidad.
20
Por último se intenta mostrar cómo sus principios se hallan presentes no
sólo en la escuela neo-schumpeteriana, sino también en el seno de la escuela
neoclásica donde ha cobrado especial valor como componente de sustancia de
los modelos de crecimiento endógeno, y en las teorı́as contemporáneas de innovación, competitividad y emprendedorismo.
La principal conclusión de este trabajo es que Schumpeter estaba en lo
correcto sólo a medias. Parte de su teorı́a efectivamente cayó en el olvido
como él esperaba. Pero la mayor parte conserva una vigencia envidiable y
se ha constituido en inspiración de economistas tan disı́miles que el propio
Schumpeter se asombrarı́a de los efectos de su obra.
8. Referencias
Adamou, A. y Sasidharan, S. (2007), “The Impact of R&D and FDI on Firm
growth in Emerging-Developing Countries: Evidence from Indian Manufacturing Industries”, from SSRN: http://ssrn.com/abstract=987024
Aghion, P., Howitt, P., “A Model of Growth Through Creative Destruction”,
Econometrica, Vol. 60, No. 2, 1992
Almus, M., y Nerlinger, E., “Growth of New Technology-Based Firms: Which
Factors Matter?”, Small Business Economics, Vol. 13, 1999
Berumen, S., “El legado de Schumpeter al estudio de la administración de empresas”, Cuaderno de Difusión 12 (22), Real Academia de Ciencias Morales
y Polı́ticas, Madrid, 2007
Berumen, S., “Una Aproximación a la Construcción del Pensamiento Neoschumpeteriano: Más allá del Debate entre Ortodoxos y Heterodoxos”,
ICE N 845, España, 2008
Blundell, E., Griffith, R. y Van Reenen, J., “Market Share, Market Value and
Innovation in a Panel of British Manufacturing Firms”, The Review of
Economic Studies, Vol. 66, No. 3, 1999
Cefis, E. y Marsili, O., “Survivor: The Role of Innovation in Firms Survival”,
2003, Disponible en http://www.sussex.ac.uk/Units/spru/events/KP
Conf 03/documents/Cefis Marsili.pdf
Christensen, C., Suarez, F. y Utterback, J., “Strategies for Survival in FastChanging Industries”, Management Science, Vol. 44, 1998
Del Monte, A. y Papagni, E., “R&D and the Growth of Firms: Empirical
Analysis of a Panel of Italian Firms”, Research Policy, Vol. 32, 2003
Dinopoulos, E., Sener, F., “New Directions in Schumpeterian Growth Theory”,
en “Edgar Companion to Neo-Schumpeterian Economics”, Editado por
Hanusch, H. y Pyka, A., Edward Elgar, Capı́tulo 42, Gran Bretaña, 2007
Foray, D., Hall, B. y Mairesse, J., “Pitfalls in Estimating the Returns to Corporate R&D Using Accounting Data”, Paper presented at the First European
Conference on Knowledge for Growth, October 8-9, 2007
Freel, M., “Strategy and Structure in Innovative Manufacturing SMEs: The
Case of an English Region”, Small Business Economics, Vol. 15, No. 1,
2000
Freeman, C., “The Economics of Industrial Innovation”, MIT Press, Cambridge, 1982
Fremman, C., “The Economics of Technical Change”, en “Trade, Growth and
Economics”, Editado por Archibugi, D., Michie, J., Cambridge University
Press, 1998
21
Geroski, P. y Machin, S., “Do Innovating Firms Outperform Non-Innovators?”,
Business Strategy Review, Vol. 3, No. 2, 1992
Geroski, P., Machin, S. y Van Reenen, J., “The Profitability of Innovating
Firms”, RAND Journal of Economics, Vol. 24, No. 2, 1993
Griliches, Z., “Market Value, R&D and Patents”, NBER Chapters in “R&D,
Patents and Productivity”, pp. 249-252, 1984
Hall, B., Jaffe, A. y Trajtenberg, M., “Market Value and Patent Citations”,
Rand Journal of Economics, Vol. 36, No. 1, 2005
Heshmati, A. y LööF, H., “Investment and Performance of Firms: Correlation
or Causality?”, CESIS Electronic Working Paper Series, 2006
Howitt, P., “The Research Agenda: Peter Howitt on Schumpeterian Growth
Theory”, Economic Dynamics Newsletter, Vol. 3, No. 2, 2002
Klein, B., “Dynamic Economics”, Harvard University Press, Cambridge, 1977
Kwasnicki, W., “Schumpeterian modeling”, Wroclaw University, Poland, 2003
Lall, S., “Technological Capabilities and Industrialization”, World Development, Vol. 20, N2, 1992
Langlois, R., “Schumpeter and the Obsolescence of the Entrepreneur”, Working
Paper 2002-19, University of Connecticut, 2002
Nelson, R., Winter, S., “An Evolutionary Theory of Economic Change”, Belknap Press, Cambridge, 1982
Nelson, R., “The Moon and the Ghetto”, Norton, New York, 1977
Organización para la Cooperación y el Desarrollo Económico, “Manual de Oslo.
Guı́a para la Recogida e Interpretación de Datos sobre Innovación”, Grupo
Tragsa, España, 2005
Pavitt, K., “Sectorial Patterns of Technical Change: Towards a Taxonomy and
a Theory”, Research Policy N 13, 1984
Porta, F., “Especialización Productiva e Inserción Internacional. Evidencias
y Reflexiones sobre el Caso Argentino”, Documento presentado al PNUD,
Proyecto FO/ARG/05/012, 2007
Porter, M., “The Competitive Advantage of Nations”, Free Press, New York,
1990
Perelman, M., “Schumpeter, David Wells and Creative Destruction”, The Journal of Economic Perspectives, Vol. 9, No. 3, 1995
Phillips, A., “Technology and Market Structure: A study of the Aircraft Industry”, D.C. Heath, Massachusetts, 1971
Schumpeter, J., “Capitalism, Socialism and Democracy”, Allen & Unwin, Gran
Bretaña, 1976
Schumpeter, J., “History of Economic Analysis”, Editado por Schumpeter, E.,
Allen & Unwin, Gran Bretaña, 1954
Schumpeter, J., “Teor´ ia del Desenvolvimiento Económico”, Traducido por
Prados Arrarte, J., Fondo de Cultura Económica, México, 1957
Suárez, D., “Dinámica Innovativa y Estructura de Vinculaciones en la Industria
Manufacturera Argentina”, Ponencia presentada en ALTEC 2007, 2007
Swedberg, R., “Rebuilding Schumpeters Theory of Entrepreneurship”, Conference on Marshall, Schumpeter and Social Science, Hitotsubashi University,
Japan, 2007
Toivanen, O., Stoneman, P. y Bosworth, D., “Innovation and the Market Value
of UK Firms, 1989-1995”, Oxford Bulletin of Economics and Statistics, Vol.
64, 2002
22
Winter, S., “Economic Natural Selection and the Theory of the Firm”, Yale
Economic Essays, 4, 1964
Winter, S., “Toward a Neo-Schumpeterian Theory of the Firm”, Class at California Institute of Technology, California, 1967
Yang, C. y Huang, C., “R&D, Size and Firm Growth in Taiwans Electronics
Industry”, Small Business Economics, Vol. 25, 2005
Yasuda, T. “Firm Growth, Size, Age and Behavior in Japanese Manufacturing”, Small Business Economics, Vol. 24, 2005
Caracterización y modelado de redes:
el caso de la Bolsa Mexicana de Valores
Linda Margarita Medina Herrera
José Benito Dı́az Hernández ∗∗
∗
Recibido 12 de agosto de 2010. Aceptado 22 de septiembre de 2010
Resumen
En este artı́culo revisaremos las principales herramientas que permiten analizar
las caracterı́sticas estadı́sticas y topológicas de redes financieras. Presentamos
un caso de estudio en la Bolsa Mexicana de Valores que exhibe árboles dinámicos
a lo largo de un periodo de 10 años y analiza los cambios importantes que han
presentado los movimientos de las acciones, impactando la longitud, el centro de
masa y los conglomerados (sectores económicos). Los sectores más importantes
dentro de la red son el de construcción y el de telecomunicaciones.
Abstract
We review the main tools which allow for statistical and topological characterization of financial networks. We present a case study in the Mexican stock
market (Bolsa Mexicana de Valores) displaying dynamic trees over a period of
10 years and analyzes the significant changes that have made the movements
of the stock, impacting the length, center of mass and clusters (economic sectors). The construction and telecommunications sectors are the most important
within the network.
Clasificación JEL: E44, G13.
Palabras clave: redes financieras, árboles dinámicos, portafolio, conglomerados.
1. Introducción
El mercado mexicano de valores es uno de los más importantes en América
Latina y uno de los diez grandes mercados emergentes, posee un número importante de compañı́as que han estado involucradas en fusiones y adquisiciones
en todo el mundo y cada vez está más integrado con mercados de valores internacionales. Esto lo convierte en un interesante caso de estudio. Este artı́culo
está enfocado en la Bolsa Mexicana de Valores (BMV). El objetivo principal
es caracterizar la topologı́a y taxonomı́a de la red formada por las principales
∗
Departamento de Fı́sica y Matemáticas, Tecnológico de Monterrey, Campus Ciudad de
México, Calle del Puente 222, Oficinas 1, Piso 2, Col. Ejidos de Huipulco, Del. Tlalpan,
14380 México, D.F., Teléfono +52(55)54832190, E-mail: [email protected].
∗∗
EGADE, Tecnológico de Monterrey, Campus Ciudad de México, Calle del Puente 222,
Oficinas 3, Piso 4, Col. Ejidos de Huipulco, Del. Tlalpan, 14380 México, D.F., E-mail:
[email protected].
24
acciones que cotizan en la BMV. También estudiamos la estructura dinámica
de las redes en la BMV, que nos da información relevante sobre las principales
empresas y sectores. Calculamos el coeficiente β de dominio, conglomerados,
centralidad, disparidad, nivel de ocupación y fortaleza, para cada vértice y
analizamos el comportamiento de algunos conglomerados en el tiempo. Estos
parámetros nos proveen información en cuanto a la heterogeneidad de la red
y de cuáles sectores son más importantes. Empezando en el 2004 formamos
ventanas móviles de un año (250 observaciones por empresa, aproximadamente).
Estimamos los parámetros para las observaciones de enero-diciembre del 2004,
enero-diciembre de 2005 y ası́ sucesivamente hasta diciembre de 2009. Además
analizaremos una ventana especial para los datos correspondientes a la crisis
de octubre del 2008 al febrero del 2010. Y el árbol total, correspondiente a los
datos del 2004 al 2010.
El estudio de las propiedades topológicas de las redes se ha convertido en
un tema central en la teorı́a de redes. En particular, se ha mostrado que muchos
sistemas naturales y sociales presentan propiedades estadı́sticas inesperadas de
relaciones que conectan diferentes elementos del sistema y que no pueden ser
descritas con gráficas aleatorias.
Investigaciones recientes han mostrado que la teorı́a de redes tiene importantes aplicaciones en el análisis de mercados financieros. El conocimiento del
comportamiento del mercado en el tiempo, permite minimizar el riesgo en los
portafolios y diseñar mejores estrategias de inversión. Es por esto que la descripción de patrones en la bolsa ha llegado a ser un objetivo popular entre
los investigadores en los últimos años. El desarrollo de la teorı́a de redes ha
permitido revelar estos patrones de una manera muy sencilla y clara.
Los trabajos fundamentales en redes financieras aparecen a finales de los
ochenta, el concepto de grafos en el ambiente de mercados financieros fue introducido por Mantenga, Bonano y otros (1989) como un método para encontrar arreglos jerárquicos de acciones a través del estudio de conglomerados de
compañı́as, usando las correlaciones de los rendimientos de las acciones. Bonano (2004) lo emplea para investigar no sólo las acciones de un portafolio, sino
también ı́ndices financieros y volatilidad. Onnela, Chakraborti, Kaski y Kertész
(2002) analizan árboles dinámicos, esto es, con ventanas en el tiempo, para
mostrar que los activos del portafolio óptimo de Markowitz están prácticamente
todo el tiempo en las ramas externas del árbol, los mismos autores (2003) usan
el concepto de vértice central, eligen el nodo más fuertemente conectado del
árbol y definen una medida importante, “el promedio del nivel de ocupación”
que durante las caı́das del mercado aparece con un valor muy bajo.
P. Hage, F. Harary (1995) emplean la noción de centralidad para analizar
grafos en contextos no financieros. M. Barthélemy, A. Barrat, R. PastorSatorras (2005) realizan una revisión de las principales herramientas en el
análisis de árboles financieros. Los artı́culos de Kim, D., and Jeong, H. (2005),
Tabak, B. Serra, T. Cajueiro, D (2010) y Medina, L. Mansilla, R. (2007) muestran evidencia empı́rica de la importancia de los árboles de expansión en el
análisis de los movimientos de los precios en mercados financieros.
No hay evidencia clara de cómo los parámetros que caracterizan una red
cambian en el tiempo. Muy pocas investigaciones de este tipo se refieren a
mercados emergentes y es aquı́ donde esta investigación busca contribuir, caracterizando redes en la Bolsa mexicana de Valores y estudiando sus cambios en
Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores
25
el tiempo. En la sección dos presentamos la definición de los parámetros que
se usarán para analizar las redes. En la tercera sección presentamos los datos
empı́ricos, los árboles dinámicos y las medidas que caracterizan a cada árbol y
en la última sección está constituida por conclusiones y consideraciones finales.
2. Redes financieras
Sea N el número de acciones con precio Pi (t) para el activo i en el tiempo t, con
t = 0, 1, 2, .., T . Tomamos Si (t) como el logaritmo de los rendimientos de los
activos Sit = ln(Pi (t)) − ln(Pi (t − 1)). Las entradas de la matriz de correlación
las calculamos mediante la fórmula de Pearson:
PT
(Sit − S̄it )(Sjt − S̄jt )
ρij = qP t=1
PT
T
2
2
t=1 (Sit − S̄it )
t=1 (Sjt − S̄jt )
donde S̄i es la media.
p
Para construir la red, usamos la distancia euclidiana di j = 2(1 − ρij ).
Debido a que −1 ≤ ρij ≤ 1 se tiene que 0 ≤ dij ≤ 2. Note que si dos acciones
están perfectamente correlacionadas (rij = 1) la distancia entre ellas es 0, y, si
están “anticorrelacionadas” (rij = −1) su distancia es 2.
El árbol de expansión es una gráfica de N objetos (vértices o nodos) unidos
por N − 1 arcos que permiten ir de un vértice a cualquier otro. Si cada arco
representa una distancia o costo, o en general si a cada arco se le asocia un peso
(número real), la suma de los pesos de todos los lados de un árbol, será el peso
total del árbol. Un árbol de expansión mı́nima es un árbol de expansión que
minimiza el peso total del árbol.
Emplearemos varias medidas para caracterizar las redes financieras. Con
el objeto de estudiar la evolución de los parámetros de las redes en el tiempo,
usaremos una ventana móvil de un año de datos, que nos permitirá estimar
y comparar los parámetros a través de los años. Este acercamiento dinámico
permitirá estudiar la evolución de la red en el tiempo.
Revisaremos brevemente las diferentes medidas y parámetros que nos permitirán una primera caracterización estadı́stica de las redes.
Peso: Las propiedades de una gráfica se pueden expresar a través de la
matriz de adyacencia, cuyos elementos toman el valor de 1 si i está conectado
con j y 0 en otro caso (con i,j = 1, , N donde N es el tamaño de la red).
Los árboles con peso usualmente se describen por medio de la matriz wij que
especifica el peso del arco que conecta el nodo i con el j. Si el vértice i no está
conectado con el vértice j, entonces wij = 0.
Grado del vértice: El grado del vértice i, ki , es el número de nodos que
están conectados directamente al nodo i, esto es, el número de elementos que
integran la vecindad de i, (V (i)).
Fortaleza del vértice: Junto con el grado del vértice, una medida muy
significativa de las propiedades de las redes en término de sus pesos se obtiene
analizando la fortaleza del vértice si definida como
si = Σj∈V (i)wij
La fortaleza del vértice integra la información de su conectividad y de la importancia de los pesos de sus vértices conectados.
26
Nivel del vértice: El nivel es la suma de los arcos que hay que pasar sobre
el aŕbol para ir del vértice i al vértice j. Si i = j entonces vij = 0.
Promedio de ocupación: Es importante caracterizar la forma en que se
extienden los nodos en el árbol. Para ello, se define la cantidad “promedio de
ocupación del vértice i” ası́:
l(vi ) =
N
1 X
niv(vij ).
N
j=1
El nodo con promedio de ocupación más baja es el centro de masa del árbol.
Un valor alto de l(vm )refleja una estructura de mercado muy fina, mientras
que en el otro extremo valores bajos se asocian con crisis en el mercado.
El vértice central: El vértice central vc es considerado como el padre de
todos los vértices del árbol o también como la raı́z del mismo. Este se usa como
punto de referencia en el árbol, contra el cual la posición de los demás vértices
es relativa. Hay un poco de arbitrariedad en la elección del vértice central, sin
embargo los siguientes criterios pueden ayudar a escoger al mejor candidato:
i) El vértice de mayor grado.
ii) El vértice de mayor peso.
iii) El centro de masa.
Centralidad: La centralidad de la gráfica nos permite comparar la centralidad del vértice central con la de los demás vértices. Si consideramos la
distancia sobre el árbol de un vértice fijo k a cada vértice h en el árbol G y encontramos R = maxh∈G dG(k, h). Podemos considerar que el árbol est inmerso
en un cı́rculo de radio R con centro en k. La centralidad es la curvatura del
cı́rculo
1
C(k) =
maxh∈G dG (k, h)
El árbol con mayor curvatura es más central.
Coeficiente del peso del conglomerado: Los conglomerados topológicos no
tienen en cuenta el hecho de que algunas vecindades son más importantes que
otras. Es por esto que se introduce una medida para los conglomerados que
combina la información topológica con la distribución de los pesos del árbol. El
coeficiente del peso del conglomerado se define como
cw (i) =
X wij + wih
1
aij aih ajh ,
si (ki − 1)
2
j,h
esta medida tiene en cuenta cada tripla que se forma en la vecindad del vértice
i. El factor de normalización si (ki − 1) asegura que 0 ≤ cw (i) ≤ 1 y que cw (i)
recupere el coeficiente topológico del conglomerado cuando wij sea constante.
Una de las aplicaciones importantes de los árboles se encuentra en la optimización de portafolios. La localización del activo con respecto al vértice central
juega un papel importante a la hora de medir el riesgo y los rendimientos.
Si rm y rM son los rendimientos mı́nimo y máximo de un portafolio P ,
respectivamente. El rendimiento esperado varı́a entre estos dos extremos, y se
puede expresar como
rP,θ = (1 − θ)rm + θrM
27
donde 0 ≤ θ ≤ 1. Se define el promedio ponderado del portafolio de la siguiente
manera:
X
lP (θ) =
wi niv(vci )
i∈P
PN
donde i=1 wi = 1 y vc es el vértice central.
Los activos que minimizan el riesgo de un portafolio se encuentran en las
ramas exteriores del árbol, por lo tanto, se espera que árboles largos (con l
grande) tengan mayor potencial de diversificación, esto es, la oportunidad del
mercado financiero para eliminar un riesgo especı́fico del portafolio de riesgo
mı́nimo.
A medida que se incrementa θ hasta llegar a la unidad, el riesgo del portafolio en función del tiempo empieza prontamente a comportarse muy diferente del
promedio de ocupación l. Consecuentemente, ya no es útil para describir la diversificación potencial del mercado. Sin embargo, emerge otro resultado interesante: el promedio ponderado del portafolio lp (θ) decrece cuando θ aumenta su
valor. Esto significa que de todos los posibles portafolios de Markovitz, las acciones del portafolio de riesgo mı́nimo están localizadas lo más lejos posible del
vértice central, y a medida que se mueve hacia portafolios con altos rendimientos esperados, las acciones incluidas en ese portafolio estarán localizadas cerca
del vértice central.
3. Árboles empı́ricos
Las series de tiempo que conforman la base de datos para este estudio están
formadas por los precios de cierre diario de 68 empresas que cotizan en la BMV,
en el periodo comprendido entre el 1/03/00 y el 2/23/10. Para la elección de
las empresas y la longitud de la serie se tuvo en cuenta la bursatilidad, capitalización y mantenimiento de las mismas. La longitud final de las series es
de 2553. Dentro de las 68 empresas seleccionadas para el estudio se encuentran representados todos los sectores económicos, las empresas elegidas tienen
la mayor bursatilidad de cada sector y juntas representan más del 90% de participación en el IPC y el 100% del ı́ndice México (INMEX). Todas las acciones
incluidas han permanecido activas en el periodo seleccionado para el estudio.
Construimos la matriz de distancia a partir de los coeficientes de correlación
y el árbol de expansión mı́nima usando el algoritmo de Kruskal. Calculamos las
medidas presentadas en la sección 3 para cada vértice (acción) y analizamos el
comportamiento de los sectores económicos. También estudiamos la evolución
de las redes en el tiempo construyendo ocho árboles. Un árbol con los 2553 datos
(del 2000 al 2010), seis árboles dinámicos para los años del 2004 al 2009 y un
árbol correspondiente a la crisis del 2008 (con datos de octubre del 2008 a febrero
del 2010). Calculamos todas las medidas en cada árbol y las promediamos por
sector económico.
La Tabla 1 muestra los cálculos obtenidos para el centro de masa, grado
y fortaleza para las empresas que obtuvieron los mejores parámetros en cada
año.
Las empresas sombreadas fueron seleccionadas como el vértice central del
año correspondiente. El vértice central del árbol completo es CEMEX siendo
el vértice con mayor fortaleza en el tiempo, el vértice con grado más alto y una
posición cercana al centro de masa. CEMEX, una de las empresas lı́deres en
28
la rama de la construcción, tiene una de las participaciones más altas del IPC,
siendo de alta bursatilidad.
GEO, la compañı́a de vivienda más rentable en el sector de la construcción,
aparece como vértice central en varias ventanas del tiempo: en el 2005 y en los
años de crisis, finales del 2008 a principios del 2010. El 2005 es el año que exhibe
el mayor promedio de ocupación, donde el árbol se despliega y el mercado
muestra cierta recuperación y los conglomerados por sectores económicos se
muestran más separados, permitiendo cierta diversificación.
En los años de crisis, el vértice central puede mostrar el sector económico
más afectado. Las empresas que aparecen en la tabla, disputándose el tı́tulo de
vértice central son todas de alta bursatilidad, juntas aportan alrededor del 80%
al IPC.
Tabla 1. Vértice Central.
América Móvil (AMX), la principal compañı́a de telecomunicaciones de
América Latina, es la empresa con mayor fortaleza promedio, las empresas
unidas a éste vértice tienen correlaciones altas, y permanecen muy cerca del
vértice central, son empresas con altos rendimientos.
En la figura 1 mostramos el promedio de ocupación, el cual oscila entre 3.16
y 4.28. El promedio de ocupación más bajo lo obtuvo el árbol correspondiente
a la crisis económica que empezó en el 2008, mostrando que efectivamente hubo
contracción en el mercado. El promedio de ocupación más alto corresponde al
año 2005.
El pico que apreciamos en el 2005 podrı́a ser explicado por algunas condiciones económicas presentes en ese año que favorecieron a la estabilidad financiera: se mantuvo la orientación a la prudencia fiscal y monetaria de la
polı́tica económica. Las tasas de interés descendieron en la segunda parte del
año y el tipo de cambio se apreció ligeramente en términos reales, lo que favoreció la baja de la inflación.
En los años estudiados, las bolsas financieras americanas mostraron un
promedio de ocupación entre 3 y 9.8, manteniéndose la mayorı́a del tiempo por
encima de 4. El rango en el que oscila el promedio de ocupación de la BMV
29
(3.16, 4.28) nos muestra que el mercado mexicano es aún un mercado en desarrollo, uno donde el comportamiento del sistema es todavı́a muy homogéneo.
El árbol con mayor centralidad corresponde a los años de crisis, confirmando la contracción en el mercado, una centralidad alta representa un árbol
sumergido en un cı́rculo pequeño, es por esto que el árbol muestra la pérdida
de conglomerados por sectores económicos. Las ramas exteriores cerca de las
interiores dificultan la clasificación de las empresas en cuanto al riesgo y los
rendimientos.
Figura 1. Variación del Promedio de ocupación en el tiempo.
Figura 2. Variación de la centralidad en el tiempo.
El árbol del 2005 (figura 3) tiene la centralidad más baja de todas las ventanas, muestra claramente las ramas exteriores del árbol (las acciones de riesgo
mı́nimo) y los vecinos del vértice central (las acciones de mayor rendimiento).
30
El árbol del 2005 es el que presenta coeficientes de peso de conglomerado
más altos, obteniendo tres conglomerados importantes: el de la construcción
con centro en GEO (figura 4), el de telecomunicaciones con centro en AMX y
el de siderurgia y metalurgia con centro en SIMEC.
Figura 3. Izquierda: Ventana Octubre 2008 - Enero 2010. Derecha: Ventana 2005.
Figura 4. Conglomerado de construcción en el árbol 2005.
A lo largo del tiempo sólo se conservan dos conglomerados: el de construcción con un coeficiente de peso de conglomerado tres veces mayor que el
siguiente conglomerado, el de telecomunicaciones. Las empresas con mayores
rendimientos son precisamente las que aparecen en la Tabla 1 y en las ramas
exteriores se mantienen a lo largo del tiempo la hotelera POSADAS, el Grupo
POCHTEC, dedicado a la producción y comercialización de productos quı́micos,
HILASA y VASCONI.
4. Conclusiones
El árbol de activos se puede ver como una poderosa herramienta en el análisis
del movimiento de las acciones en la Bolsa Mexicana de Valores, pues aunque
parece estar fuertemente reducido, contiene información esencial del mercado y
se puede usar para añadir un juicio subjetivo al problema de optimización de un
portafolio. La evidencia nos muestra que el mercado financiero mexicano forma
conglomerados en el sector de la construcción y el de telecomunicaciones. Las
31
ramas exteriores y los centros de los árboles permanecen estables en el tiempo,
el mercado es homogéneo. Los árboles mostraron ligeras contracciones en la
crisis y extensiones en el 2005.
Las medidas de las redes sugieren que los sectores de construcción y telecomunicaciones son los sectores relativamente más importantes en los árboles
con una gran influencia sobre los demás sectores. En este artı́culo mostramos
que algunas caracterı́sticas de las redes cambian con el tiempo, más aún, la
importancia relativa de sectores especı́ficos cambia. Investigaciones posteriores
podrı́an explotar las medidas de los árboles para crear y analizar ı́ndices como
el IPC, también está abierto el tema para comparar comportamientos de bolsas
internacionalmente y de otros instrumentos financieros.
5. Referencias
Batagelj, V. and Mrvar, A. (2005) Pajek. Program for Analysis and Visualization of Large Networks. Reference Manual. http://vlado.fmf.uni-lj.si/pub/networks/pajek/.
Bonanno, G., Caldarelli, G., Lillo, F.,and Mantenga, R.N. (2002) Topology
of correlation-based minimal spanning trees in real and model markets,
Physical Review E 68 (2003) 046130.
Bouchaud, J.P., and Potters, M. (2003) Theory of Financial Risks -from statistical physics to risk management-. 2ed. Cambridge University Press,
Cambridge.
C. Eom, G. Oh, Woo-Sung Jung, H. Jeong, S. Kim, Topological properties
of stock networks based on minimal spanning tree and random matrix
theory in financial time series, Physica A: Statistical Mechanics and its
Applications 388 (2009) 900906.
J. Saramaki, M. Kivela, J. Onnela, K. Kaski, J. Kertesz, Generalizations of the
clustering coefficient to weighted complex networks, Physical Review E 75
(2007) 027105.
Kim, D., and Jeong, H. (2005) Systematic analysis of group identification in
stock markets. . e- print. http://xxx.lanl.gov/physics/0503076v1
Lee, W. (2000) Theory and methodology of tactical asset allocation. F.J.
Fabozzi Associates, New Hope, Pennsylvania.
M. Barthlemy, A. Barrat, R. Pastor-Satorras, A. Vespignani, Characterization
and modeling of weighted networks, Physica A 346 (2005) 3443.
Mantegna, R. (1998) Hierarchical Structure in Financial Markets. Eur. Phys.
J. B, 11, 193-197.
Mantegna, R., and Stanley, H.E. (2000) An Introduction to Econophysics correlations and complexity in finance. Cambridge University Press, Cambridge.
Mantegna, R. et al. (2004) Networks of equities in financial markets. e-print
http://xxx.lanl.gov/cond-mat/041300v1
Marsili, M. (2002) Dissecting financial markets: sectors and states. Quantitative Finance, 2, 297- 302.
Medina, L. Mansilla, R. Un árbol de expansión mı́nima en la Bolsa Mexicana
de Valores. Revista de Administración, Finanzas y Economa (Journal of
Management, Finance and Economics) (2007) vol. 1, issue 2, pages 116-124
M. Tumminello, T. Aste, T. Di Matteo, R.N. Mantegna, Correlation based
networks of equity returns sampled at different time horizons, EPJB 55
32
(2007) 209217.
Onnela, J.-P., Chakraborti, A., and Kaski, K. (2003) Dynamics of market correlations: Taxonomy and portfolio analysis, Physical Review E 68 056110.
Onnela, J.-P., Chakraborti, A., and Kaski, K. (2003) Dynamic asset trees and
black monday, Physica A: Statistical Mechanics and its Applications 324
247.
P. Hage, F. Harary, Eccentricity and centrality in networks, Social Networks
17 (1995) 5763.
Tabak, B. Serra, T. Cajueiro, D. Topological properties of stock market networks: The case of Brazil. Physica A 389 (2010) 3240-3249
Tumminello, M., Mateo, T., and Mantegna, R.N. (2005) A new tool for filtering information in complex systems. E-print http://xxx.lanl.gov/cond
mat/0501335v1
V. Tola, F. Lillo, M. Gallegati, R.N. Mantegna, Cluster analysis for portfolio optimization, Journal of Economic Dynamics and Control 32 (2008)
235258.
Value at risk and return from the use of Bayesian
methods for stress testing in a world asset
allocation and the 2008-2009 crises
∗
Recibido 22 de julio de 2010. Aceptado 30 de septiembre de 2010
Resumen
El rendimiento y el valor en riesgo de una propuesta asignación de activos
obtenida usando métodos de carteras Bayesianas tipo Black-Litterman y Markowitz aplicado a una cartera mundial de ı́ndices es fuertemente dependiente del
parámetro de escala de las distribuciones de retornos a priori. Sin embargo, el
rendimiento y valor en riesgo observado con la cartera recomendada durante el
perı́odo 2008 y 2010 es menos sensible a este parámetro.
Abstract
The return and value at risk return of a proposed asset allocation obtained
using Black-Litterman and Markowitz Bayesian portfolio methods applied to a
world portfolio of indexes is strongly dependent on the scale parameter of the
prior return distribution. However, the observed mean and value at risk during
the 2008 to 2010 period with the proposed allocation is relatively less sensible
to this parameter.
Clasificación JEL : G11, G15
Palabras clave: financial studies, international security markets, Black-Litterman model,
Bayesian portfolio optimization
1. Introduction
The 2008-2009 global financial crises has been described as the worst financial
crises in the United States and many other countries after the great depression of 1929, which was characterized by negative information effects during
the financial panic, which resulted in negative movements and contagion across
funds [Jinjarak and Zheng, 2010], in particular, during September 2008 [Idier,
∗
Humberto Valencia-Herrera is finance research professor at Instituto Tecnológico y de Estudios Superiores de Monterrey, Campus México City. Email: [email protected].
Telephone: 52-55-54832241. Address: Office Building 3, 2nd Floor, Calle del Puente 222,
Ejidos de Huipulco, México, D.F., 14380, México. I thank the comments received from an
anonymous referee, the participants at the Banco de México Economic Research Seminar and
the research assistance of Nayeli Carranco. Any remaining errors are the author’s responsability.
34
2011]. 1 The crises started in the debt market, but extended to other assets
because funds could not be raised easily and quickly, which affected the fundamental values of many assets, which became separated from its real value.
These distortions resulted in real consequences in the economy that affected
many assets far from the toxic subprime mortgage assets, which were the root
of the problem, Krishnamurthy [2010]. These effects not only were limited to
the period of the financial crises. Hall [2010] discuses persistent adverse effects
of a temporary crises that can have adverse effects on employment and output
and they can be fell for many years after the crises, even after the financial
crises subsided.
Here, we propose to use two formulations to incorporate information in
portfolio selection. Bayesian updating applied directly to the Markowitz [1952]
optimization problem and the use of the views in the Black Litterman portfolio model to update information and to incorporate past information in the
portfolio decision. In those frameworks, we explore how changes in the scale
parameters of the prior portfolio distribution modify the asset allocation, the
return, and the value at risk of the forecasted posterior portfolio distribution
and the resulting ones in the 2008 to 2010 period.
1.1. Bayesian updating in the Markowitz optimization problem
The mean variance portfolio optimization problem was initially proposed by
Markowitz [1952], who showed the problem of an investor who minimizes his/her
expected portfolio variance given a desired level of return. An alternative formulation is the problem of an investor who maximizes an expected utility function
of future returns, E(U (RT +τ )), whose probability depends on an expected return vector µ, a covariance matrix Σ and the proportions invested on each asset,
w, that add on to one,
maxω E(U (ω0 RT +τ )) = maxω
Z
U (ω0 RT +τ )pT +τ (RT +τ |µ, Σ)dRT +τ
(1)
subject to ω0 1 = 1. The investor has an expected quadratic utility function of
return a time T + τ of the form
E(U (ω0 RT +τ )) = µp −
A 2
σ
2 p
(2)
where A is the relative risk aversion coefficient, a measure of the rate at which
the investor is willing to accept extra risk for a one unit increase in expected
return.
If there is uncertainty in the parameters, it can be accounted for using a
Bayesian framework. If the next-period excess return data is RT +1 the predictive return density is 2
1
Jinjarak and Zheng [2010] shows contagion an negative feedback in emerging-market
funds during the 2008-2009 period. Idier [2011] shows extreme volatility comovements during
September 2008.
2
For a more extensive discussion, see Rachev et al. [2008]
Value at risk and return from the use of Bayesian...
p(RT +1 |R) ∝ p(RT +1 |µ, Σ)p(µ, Σ|R)dµdΣ,
35
(3)
where R = return data available up to period T , a T × N matrix,
p(µ, Σ|R) = joint posterior density of the two parameters of the multivariate
normal distribution, p(RT +1 |µ, Σ) = multivariate normal density and ∝= proportional to.
Substituting in (1), the predictive density of excess returns (3), the investor’s optimization problem becomes
maxω E(U (ω0 RT +1 )) = maxω
Z
U (ω0 RT +1 )p(RT +1 |R)dRT +1
(4)
subject to ω0 1 = 1.
In this problem, the optimal weights depend on the expected
return vector
P
µ
eT +τ and the inverse of the expected covariance matrix T +τ :
P−1
µ
eT +τ
∗
ω = T +τ
(5)
A
If the investor has informative beliefs about the mean vector and the covariance matrix of excess returns and they can be represented by conjugate
priors, 3 the mean vector will be normal with mean η a variance covariance
matrix (1/τ )Σ and the covariance matrix will be Wishart with parameters Ω
and ν. The prior parameters τ and ν reflect the confidence that the investor
has on the parameters η and Ω, respectively. The larger the τ and ν, the less
confidence the investor has on those values, respectively,
µ|Σ ∼ N (η, (1/τ )Σ)
and
Σ ∼ IW (Ω, ν).
The predictive distribution of next-period excess return is a Student’s t
distribution with mean and covariance parameters, respectively,
e=
Σ
µ
e=
τ
T
η+
µ
b
T + τ)
T + τ)
T +1
Tτ
0
b
Ω + (T + 1)Σ +
(η − µ
b)(η − µ
b)
T (ν + N − 1)
T +τ
The vector of optimal portfolio weights, ω∗ is a function of the forecasted
e and is given by (5). The efficient
mean, µ
e and the forecasted variance matrix, Σ
3
In Bayesian probability theory, if the posterior distributions p(θ|x) are in the same
family as the prior probability distribution p(θ), the prior and posterior are called conjugate
distributions, and the prior is called a conjugate prior for the likelihood, see [Raiffa and
Schlaifer, 1961]. The Gaussian family is conjugate to itself (or self-conjugate) with respect to
a Gaussian likelihood function. If the likelihood function is Gaussian, a Gaussian prior over
the mean ensures that the posterior distribution is also Gaussian.
36
0
frontier can by traced out by the optimal weights (µ∗p , σp∗ ) where µ∗p = ω∗ µ
e and
2
∗0 e ∗
σp = ω Σω , for varying values of the risk-aversion parameter A, in the relation
(2).
1.2 Black Litterman optimization problem
The Black and Litterman [1991, 1992] portfolio model (BL model, hereafter)
is appealing for many investors because it can combine subjective information
with objective one. The BL model is based on the Sharpe [1964] and Lintner
[1965] Capital Asset Pricing Model, CAPM, hereafter. The model assumes
that there is one risk factor that explains returns in equilibrium, the market
return. 4 Numerous extensions have been made to the basic model, both in
the industry and in the academics. See, for example, Martellini and Ziemann
[2007], Nardari and Scruggs [2007], Giacometti et al. [2007], Zhou [2009], Bade
et al. [2009], Meucci [2009], and Kooli and Selam [2010].
b assets, let us assume that
If the asset universe (the market portfolio ) are N
b
the equilibrium risk premiums are the N ×1 vector R, R = Ra −Rf 1, where Ra
b × 1 vector of market asset returns, 1 is a N
b × 1 vector of ones, and Rf is
is a N
b
the risk-free rate. If weq are the N ×1 vector of market capitalization weights of
the resampling portfolio in BL, the market portfolio, and the CAPM holds, R
is equal to β(Rm − Rf ), where Rm − Rf is the market risk premium, β is equal
2
b × 1 vector of asset betas and R0 weq is the market
to cov(R, R0 weq )/σM
is a N
2
2
0
return, and σM is the variance of the market return, that is, σM
= weq
Σweq ,
where Σ is the asset return covariance matrix.
If the Sharpe ratio of the market portfolio is R = δΣweq , with δ equal to
2
(Rm − Rf )/σm
, the vector of equilibrium risk premiums R can be written as
R = δΣweq
(6)
After rearranging, we obtain
weq =
1 −1
Σ R
δ
(7)
and δ is the risk aversion parameter A of the relation (2).
The market on average is expected to be in equilibrium, but at any point in
time, the equilibrium can be perturbed by shocks. Therefore, the return will be
µ = Ra +, where the N × vector includes the perturbations to the equilibrium,
which we assume that they have a multivariate normal distribution and that the
prior distribution of µ is given by µ ∼ N (Ra , τ Σ), that is, the prior covariance
matrix of the mean is a scaled covariance matrix of the sampling distribution.
The scale parameter τ can be interpreted as the uncertainty in the accuracy
with which Ra can be estimated or the confidence that the analyst has on the
CAPM. A small τ reflects high accuracy and confidence.
4
Even though the CAPM model has been strongly criticized in the literature, it is a
useful approximation for the true market model. Further extensions are Fama and French
[1993] and Carhart [1997], who extended the CAPM model, to account for other factors, to
a multifactor market model, which better explains returns.
37
Notice that the covariance matrix is a square symmetric matrix, and the
inverse of a block symmetric square matrix can be written, see Jo et al. [2004],
Bernstein [2005, p44-45], as
AT A AT B
Σ=
BT A BT B
=
−1
(AT PB A)−1
−(AT PB A)−1 AT B(B T B)−1
T
−1
T
T
−1
−(B PAB) B A(A A)
(B T PA B)−1
(8)
where PA = I − A(AT A)−1 AT and PB = I − B(B T B)−1 B T . If the blocks
out of the main diagonal are close to zero, and PB is close to be the identity
matrix, an allocation based on the first block will be the optimal allocation on
b assets will be the
the subset of those assets, that is, the allocation of the N
allocation based on the N assets in the market, except for the omitted ones.
b assets and the investor has K views on those
If the analysis focuses on N
b
assets, let us denote the K × N matrix of views portfolios by P . Each row of
the matrix P represents a view portfolio, where an element of P is nonzero if
the corresponding asset is associated with the view and zero elsewhere. The
K × 1 vector of expected returns on the view portfolios is given by Pµ . If the
prior distribution of returns µ is normally distributed, the investor’s subjective
views will be
Pµ ∼ N (Q, Ω) = N (Pb
, Ω),
µ
(9)
M = ((τ Σ−1 + P 0 Ω−1 P )−1 ((τ Σ)−1 R + P 0 Ω−1 Q)
(10)
where µ
b is the n
b × 1 vector of the expected prior returns, which maps to the
K × 1 vector of prior expected values Q of the views. The K × K covariance
matrix reflects the uncertainty of the views under the prior distribution of the
stress testing scenario. 5
After applying Bayes’ theorem to combine the objective information, from
µ, and subjective information, from Pµ , the posterior distribution of the expected returns µwill be normal with mean and covariance, M and V , respectively:
= ((τ Σ−1 + P 0 Ω−1 P )−1 ((τ Σ)−1 R + P 0 Ω−1 P µ
b),
where µ
b is the estimate of expected returns implied by the views,
and
µ
b = (P 0 P )−1 P 0 Q,
V = ((τ Σ)−1 + P 0 Ω−1 P )−1
5
In Black and Litterman [1991], the degree of confidence that the investor has on the
views is reflected in the diagonal elements of the prior covariance matrix Ω.
38
b assets in a stress scenario
If the returns and the covariance matrix of the N
b assets of interest, P
reflect the absolute views of the investor on each of the N
will be an identity matrix, that is, P = I,
and
M = ((τ Σ)−1 + Ω−1 )−1 ((τ Σ)−1 Ra + Ω−1 µ
b)
(12)
V = ((τ Σ)−1 + Ω−1 )−1 .
The resulting covariance matrix is the inverse of the sum of the inverse of
the covariance, multiplied by τ , and the inverse of the prior views covariance,
that is, a kind of harmonic weighted average of the covariance matrix Ω and Σ.
1.2.1 The parameter τ in Black-Litterman
If the market portfolio has mean expected return µ, the distribution of the
vector µ − R is
µ − R ∼ N (0, τ Σ)
(13)
where Σ is the covariance matrix of returns computed separately.
The parameter τ can be interpreted as the remaining uncertainty in the
sample data due to the perturbations , which it is usually assumed between 0
and 1. For example, Black and Litterman [1992] proposes to use a value close
to zero, Satchell and Scowcroft [2000] proposes to use the value of one, and
Rachev et al. [2008] proposes τ = 1/T , where T is the length of the sample in
years.
For purpose of measuring uncertainty, we use two measures: standard
deviation and value at risk, VAR hereafter. We employ the delta-normal
method, 6 which uses a mean-variance approximation of the VAR and a 99%
VAR, following Basel Committee guidelines, which is the expected lost, in a
10 day period, with a 99% confidence interval. For purpose of analysis, we
use a one
√ million portfolio, so if σ is the daily standard deviation, the VAR is
(2.33)( 10)(1, 000, 000).
2. Methodology
We use data from the following stock exchange indices: the IPC from Mexico, the MERVAL from Argentina, the IPSA from Chile, the BOVESPA from
Brazil, the IBEX 35 from Spain, the DAX from Germany, the FTSE from Great
Britain, the KOSPI 20 from South Korea, the HSENG Index from Hong Kong,
the IGBL from Peru, the IGBC from Colombia, the IBC from Venezuela and the
SP500 from the United States. The data set was from Economatica, complemented with Yahoo Finance and Bloomberg. The exchange rate was obtained
from central banks web sources, the Pacific Exchange Rate Service from the
Sauder School of Business at the University of British Columbia, Canada and
Economatica. We use daily closing prices from September 10th, 1993 to December 17th, 2010. Missing data was filled with previous closing prices. Each
6
The delta-normal method assumes independence of returns. If returns exhibit positive
correlation in the short term, the delta-normal VAR can underestimate the true VAR.
39
of the indexes was converted to US dollars with daily exchange rates. A total of
4,505 daily return observations were calculated based on weeks with five days.
Table 1 shows basic statistics for the indexes and equivalent daily returns for
the three month T Bill rates. 7
Figure 4 shows the daily risk premium, the difference between the daily
index return and the daily T Bill return. During 2008-2010 period, there was
an increase in volatility in almost all indexes; however, other previous periods
also showed high volatility. In order to analyze previous volatility, we estimated
the yearly standard deviation for each index and built up a equally weighted
portfolio of all indexes. Figure 2 shows that the standard deviation decrease
during 2008, 2009 and 2010 to 0.24, 0.18, and 0.14, respectively. However, the
years 1997 and 1998 also showed high volatility, standard deviations of 0.13
and 0.16, respectively. If we focus on returns, in 1998 the return was below
zero, -1.1%, but it is not comparable with the sharp decreases of 2000 to 2002,
-19.7% -10.3%, and -17.8%, respectively, a period in which the volatility was
not extremely high. The returns failed strongly in 2008, to -48.7%, to recover
in 2009 and 2010, 50.2% and 15.6%, respectively, see Figure 3. The correlation
between yearly returns and standard deviation is negative, -0.527.
2.1 Bayesian Markowitz portfolio updating
For the Bayesian Markowitz portfolio exercise (BM, hereafter, we select the
time period before 2008 as the pre-sample one of daily excess returns. The annualized daily returns of a equally weighted portfolio till 2007 was 11.82%, with
a standard deviation of 0.1096 and a Sharpe ratio of 0.0667. 8 For stress testing
purposes, the prior returns must correspond to a worst case scenario, that is, a
period with high volatility and small returns. The year 1998 had relatively high
volatility but it did not have sharp decreases in return. In contrast, in the year
2000, there was large return decreases, but the volatility was relatively small.
Therefore, for stress testing purposes, we use the covariance matrix of the year
1998, as the prior covariance and the returns from the year 2000, as the prior
returns. The parameters are as follows:
a) The vector µ are the average daily excess returns till the year 2007.
b) The covariance matrix Σ is the covariance matrix from the pre-sample
period, till the year 2007.
c) The parameter T is equal to 3,731, the number of daily excess returns
in the pre-sample period, till the year 2007.
d) The vector of prior returns η is equal to the observed mean daily excess
returns during the year 2000.
7
The exchange rates have had episodes of overvaluation and undervaluation, which resulted in different return and VAR in United States dollars (USD) from the ones in native
currencies. The average return of the indexes in USD was 12.7% and the average exchange
rate yearly change was -4.2%, in the period of study. However, the exchange rates volatilities were lower than the stock markets volatilities, 11.4% and 29.3% average yearly standard
deviation, respectively.
8
The Sharpe ratio shows the same pattern as the daily returns. The Sharpe ratio, proposed by Sharpe [1966] and redefined in Sharpe [1994], is the ratio between the expected risk
premium and its standard deviation, E(Rt − Rft )/σ(Rt − Rft ).
40
e) The parameter τ is equal to 261. The parameter is usually interpreted
as the size of a hypothetical sample drawn from the prior distribution.
Here, the number corresponds to the daily observations in a year on
average.
f) The covariance matrix Ω is equal to Σ̄(ν − N − 1) where Σ̄ is its sample
counterpart, the covariance matrix from the excess return during the
year 1998. 9
g)The parameter N is equal to 15, the number of assets.
h)The parameter ν is 30, the degrees of freedom in the Wishart distribution
and a large value to make the prior of Σ informative and reflect the confidence about Ω. 10
2.2. Black-Litterman updating
In order to use BL as a stress testing tool, we consider the market from the
presample period. Because, we did not have information for a world sample
of stock indexes for the period, we took two approximations: the MSCI World
Index (MSWO) and the ex-post optimal risky portfolio during the presample
period (PRESAM), given the observed returns vector and covariance matrix.
MSWO is a index of more than 1,500 stocks from 24 developed economies. The
stock indexes here are an incomplete sample of stock indexes, slightly bias to
emerging economies. The prior views were from the stress testing scenario, the
1998 covariance matrix and 2000 observed return. Given that there is not a
consensus in the literature about the scale parameter τ , we analyze the forecast
behavior as a function of it.
3. Analysis
3.1. Bayesian Markowitz updating
The assumption of conjugate priors overstates the expected volatility, see Figure
4, which is larger than the one observed in the 2008-2010 period. However,
the observed return in 2008 was lower than the expected return, which was
comparable to the one in 2009.
From Figure 4, the portfolio expected return and the 2008 observed one
are increasing with τ , but the 2009 and 2010 observed returns are decreasing
with τ . From Figure 5, the expected portfolio VAR is increasing with τ , but
the 2008, 2009 and 2010 observed ones are smaller at 600, 570 and 510 days,
respectively, using intervals of 30 days for estimation purposes.
3.2. Black Litterman updating
The selection of the scale parameter τ can be critical for the resulting asset
allocation. The optimum portfolio composition is highly dependent on it. For
example, in the case of the MCWO benchmark, there is a large portfolio reallocation when τ changes from 0.1 to 0.15. As a result, the return and the risk
incurred can change dramatically, see Figures 6 and 7. In the MCWO benchmark case and a small τ , the return and the VAR are small, the expected and
9
10
Given that
Σ is distributed IW (Ω, ν),the prior mean of Σ̄ is Ω/(ν − N − 1).
ν > N + 1.
The Wishart distribution exists if
41
the observed ones during the 2008-2010 period; even though, the expected and
the observed ones in the year 2008 are larger than the ones in the years 2009
and 2010. This relation will change with τ larger than the critical point, the
expected return and observed ones for 2008 will be larger than the 2009 and
2010 returns. At large τ , the return differences subside.
Changes are also observed in the presample benchmark case at a critical
point. There is also a large change in asset allocation; however, it happens when
τ changes from 0.55 to 0.65. At this critical point, the VAR increases dramatically, then it subsides, see Figure 9. Before the critical point, the expected
return and the observed one during 2008 were smaller than the observed ones
during the years 2009 and 2010, see Figure 8. At the critical point, the relation
changes and continues for a while: the expected return and the observed one
during 2008 are smaller than the observed ones during the years 2009 and 2010.
However, at large τ , the return differences between periods diminish and the
expected return and the observed one in 2008 become smaller than the ones in
2009 and 2010.
3.3. Comparing methods
Table 2 compares differences between the forecasted Sharpe ratio and the observed one in different years with a conservative τ , that is, in the Bayesian
Markowitz method, at τ = 240 days, in BL, at τ close to zero (0.1 and 0.05,
with the MCWO Index and the optimal portfolio in the presample period as
benchmarks, respectively) or with τ equal to one. We observed that the most
consistent forecast is with the MCWO Index as market and τ equal to 0.1. The
forecast with the presample index as market was not as consistent during the
2008 and 2010 period. In BL, a small τ gave optimistic forecasts, the observed
differences were always negative. A τ equal to one gave pessimistic forecasts,
the observed differences were all positive. The BM method was not consistent,
in 2008, it was optimistic and, in 2009 and 2010, it was pessimistic.
4. Conclusions
Black Litterman portfolio optimization can be useful to obtain an asset allocation that it is little sensible to changes in the stock market if the benchmark
is a stock index. If the stock market recovers, the Black Litterman allocation
also recovers, but it also suffers in bad times. There are small differences in
allocation, risks and rewards if the market proxy is the MSWO index or the
presample ex-post optimal portfolio in the analysis of the 2008-2010 period.
Bayesian updating with conjugate priors in a Markowitz model can overestimate the forecasted VAR. However, the resulting asset allocation can be
useful to manage VAR and return as we observed during the 2008-2010 period
with a buy and hold strategy. Bayesian Markowitz portfolio optimization and
Black Litterman portfolio optimization are sensible to the scale parameter τ ,
particularly the last method mentioned. Black Litterman portfolio optimization
shows strong changes in asset allocation close to a critical scale parameter value
and jumps in VAR and return. This value can be small, as in the MSWO case.
If BL is used, the selection of the scale parameter demands special care.
42
5. References
Bade, Alexander, Gabriel Frahm, and Uwe Jaekel (2009). A general approach
to bayesian portfolio optimization. Mathematical Methods of Operations
Research, Vol. 70, No.2, pp. 337356.
Bernstein, Dennis (2005). Matrix Mathematics. Princeton University Press.
Black, Fischer and Robert Litterman (1991). Asset allocation: combining
investor views with market equilibrium. Journal of Fixed Income, Vol.
September, pp. 718.
Black, Fisher and Robert Litterman (1992). Global portfolio optimization.
Financial Analysts Journal,Vol. 48, No. 1, pp 16.
Carhart, M. (1997). On the persistence in mutual fund performance. Journal
of Finance,Vol. 52, No.1, pp. 5782.
Fama, E. F. and K. R. French (1993). Common risk factors in the return of
stocks and bonds. Journal of Financial Economics, Vol. 33, No. 1, pp.
356.
Giacometti, Rosella, Marida Bertocchi, Svetlozar T. Rachev, and Frank J.
Fabozzi (2007). Stable distributions in the Black-Litterman approach to
asset allocation. Quantitative Finance, Vol. 7, No. 4, pp. 423433.
Hall, Robert E. (2010). Why does the economy fall to pieces after a financial
crisis? Journal of Economic Perspectives, Vol. 24, No. 4, pp. 320.
Idier, Julien (2011). Long-term vs. short-term comovements in stock markets:
the use of markov-switching multifractal models. European Journal of
Finance, Vol. 17, No. 1, pp. 2748.
Jinjarak, Yothin and Huanhuan Zheng (2010). Financial panic and
emerging market funds. Applied Financial Economics, Vol. 20, No. 23,
pp. 17931805.
Jo, S., S. W. Kim, and T. J. Park (2004). Equally constrained affine projection algorithm,. In Conference Record of the Thirty-Eighth Asilomar
Conference on Signals, Systems and Computers, Vol. 1, pp. 955959.
Kooli, Maher and Margaux Selam (2010). Revisiting the Black-Litterman
model: The case of hedge funds. Journal of Derivatives & Hedge Funds,
Vol. 16, No. 1, pp. 7081.
Krishnamurthy, Arvind (2010). How debt markets have malfunctioned in the
crisis. Journal of Economic Perspectives, Vol. 24, No. 1, pp. 328.
Lintner, J. (1965). The valuation of risky assets and the selection of risky
investments in stock portfolios and capital budgets. Review of Economics
and Statistics, Vol. 47, pp. 1337.
Markowitz, Harry M. (1952). Portfolio selection. Journal of Finance, Vol. 7,
pp. 7791.
Martellini, Lionel and Volker Ziemann (2007). Extending Black-Litterman
analysis beyond the mean-variance framework. Journal of Portfolio Management, Vol. 33, No. 4, pp. 3344.
Meucci, Attilio (2009). Enhancing the Black and Litterman and related approaches: Views and stress-test on risk factors. Journal of Asset
Management, Vol. 10, No. 2, pp. 8996.
Nardari, F. and J.T. Scruggs (2007). Bayesian analysis of linear factor models
with latent factors, multivariate stochastic volatility. Journal of Financial
& Quantitative Analysis, Vol. 42, No. 4, pp. 857892.
43
Svetlozar Rachev, John S.J. Hsu, Biliana S. Bagasheva, and Frank J. Fabozzi
(2008). Bayesian Methods in Finance. John Wiley & Sons, Inc., Hoboken,
New Jersey.
Howard Raiffa and Robert Schlaifer (1961). Applied Statistical Decision Theory. Division of Research, Graduate School of Business Administration,
Harvard University, Cambridge, Ma.
Satchell and A. Scowcroft (2000). A demystification of the Black-Litterman
model; managing quantitative and traditional portfolio construction. Journal of Asset Management, Vol. 1, No. 2, pp. 138150.
Sharpe, William F. (1964). Capital asset prices: A theory of market equilibrium under conditions of risk. Journal of Finance, Vol. 19, pp. 425442.
Sharpe,William F. (1966). Mutual fund performance. Journal of Business,
Vol. 39, No. 1,pp. 119138.
Sharpe, William F. (1994). The Sharpe ratio. Journal of Portfolio Management, Vol. 21, No. 1, pp. 4958.
Zhou, Guofu (2009). Beyond Black-Litterman: Letting the data speak. Journal of Portfolio Management, Vol. 36, No. 1, pp. 3645.
44
45
46
47
48
49
Estimación del residual de un bono respaldado por
hipotecas mediante un modelo de riesgo crédito:
una comparación de resultados de la teorı́a de
cópulas y el modelo IRB de Basilea II en
datos del mercado hipotecario mexicano
Arturo Cortés Aguilar
∗
Recibido 10 de agosto de 2010. Aceptado 12 de octubre de 2010
Resumen
El residual en un bono respaldado por hipotecas, tiene impacto en la calificación
de la emisión, por lo que debe reflejar el riesgo de crédito de la estructura
financiera. Se propone el uso de un enfoque de riesgo crédito para su estimación
como la pérdida no esperada de las hipotecas que respaldan al bono a través de
la aplicación de la teorı́a de cópulas, se presenta la comparación de los resultados
obtenidos de la cópula t-Student, cópula Normal, cópula Gumbel, del modelo de
capital económico para cartera hipotecaria de Basilea II y del residual real del
bono, mostrando que se obtienen estimaciones inferiores al aplicar los modelos
de cópulas que el análisis de escenarios empleado en la definición del residual
del bono.
Abstract
Residual tranche in a mortgage backed security is a determinant issue in its
grade and it should show the credit risk profile. I propose residual tranche
estimation in a credit risk view with the application of copula theory to calculate
unexpected losses in the collateralized mortgages. The comparison of results
between t-Student copula, Normal copula, Gumbel copula, Basel II economic
capital model and the residual tranche in a Mexican MBS show that residual
as economic capital estimated with copula implementation are less than the
scenario analysis that had defined that tranche in the structure. Keywords:
Mortgage backed security, credit risk, copula theory, Basel II.
Clasificación JEL : G21, G32.
Palabras clave: Bono respaldado por hipotecas, riesgo crédito, teorı́a de cópulas, Basilea II.
∗
Programa Doctoral en Ciencias Financieras. Tecnológico de Monterrey, Campus Ciudad
de México. E-mail: artur [email protected]. Tel: 55282493.
Estimación del residual de un bono respaldado por hipotecas...
51
1. Introducción
En el mercado mexicano, el originador de los créditos hipotecarios recurre a
la estrategia de bursatilización traspasando activos crediticios a un fideicomiso
con la finalidad de obtener más recursos para generar nuevos préstamos, al
respecto, los agentes estructuradores están enfocados en resolver el problema
de la falta de liquidez de los originadores de los créditos hipotecarios, más que
en establecer juicios respecto al uso óptimo del capital, si se considera a la
misma estructura como una entidad financiera, resultando en residuales que
pueden sobre o sub valorar el riesgo de crédito de la estructura de acuerdo a lo
que reflejarı́a un modelo de estimación de pérdidas esperadas y no esperadas,
derivado de este hecho, este trabajo de investigación tiene por objetivo mostrar
que el uso de los modelos aquı́ empleados disminuyen el requerimiento de capital
o residual de la estructura comparado con lo que se obtiene con el análisis de
escenarios empleado en la práctica, el beneficio de esta disminución en la porción
subordinada de la estructura permitirá un incremento en la porción de bonos
emitidos.
2. Riesgo crédito en bonos respaldados por hipotecas
Los originadores de créditos recurren a la venta de sus activos hipotecarios
para la emisión de bonos y ası́ obtener recursos financieros y emplearlos para
originar más créditos, dicho mercado ha sido el que más ha entrado en el negocio
de la bursatilización. En una estructura de bursatilización, la porción que no
forma parte de los bonos emitidos y constituye parte del capital del fideicomiso,
funciona como una porción de seguro contra incumplimiento en los pagos de los
créditos, esto significa que es la parte que absorbe las pérdidas y generalmente
es posesión del cedente, esto quiere decir que como el cedente ya recibió el valor
de los créditos al momento de la transferencia para la originación de nuevos
créditos, con excepción de esa proporción, tiene un cambio en su exposición al
riesgo crédito y este cambio se refleja en un menor requerimiento de capital en su
balance general, sin embargo tiene la desventaja de tener un activo subordinado,
el cual regresará a formar parte de su balance en el caso de que se cumplan
las siguientes dos condiciones: los bonos emitidos deben estar completamente
pagados y las pérdidas realizadas sean menores que el residual.
El riesgo de incumplimiento de un bono respaldado por hipotecas resulta
de una omisión de pagos del suficiente número de acreditados que impidan el
cumplimiento del pago del cupón a los inversionistas, es decir, que la amortización de los créditos hipotecarios no es suficiente para afrontar el compromiso
adquirido en la emisión del bono, este riesgo es absorbido por el residual y el
papel que desempeña en la estructura impacta en la calificación del bono por
lo que el residual debiera ser establecido por el riesgo crédito de los colaterales,
comprometiendo los flujos de acuerdo a la subordinación definida siguiendo los
criterios que marcarı́a un agente calificador para el efecto de un alto grado
de inversión, en este negocio el originador que se queda con el residual, visto
como un inversionista que compra una nota subordinada no calificada, estarı́a
dispuesto a obtener el diferencial entre las pérdidas esperadas y las pérdidas
realizadas o cero en el escenario extremo.
Dentro de una institución financiera, este riesgo se cubre mediante una
porción de capital que se mantiene de acuerdo a las pérdidas potenciales surgidas
52
por los factores que afectan a las transacciones realizadas por las instituciones,
esto es, la pérdida esperada (EL), la cual se puede considerar como una prima
de riesgo 1 y está en función los siguientes tres factores: una porción de pérdida
realizada que es determinada por la experiencia del originador del portafolio y
que es conocida como pérdida dado que la contraparte incumplió (LGD), de
la probabilidad de que la contraparte caiga en incumplimiento (P D) y de la
exposición a un evento de incumplimiento (EAD), mientras que la cantidad
de capital necesario para proteger o respaldar a un portafolio de créditos es
un estimado de la máxima pérdida posible en una ventana de tiempo de un
año a un determinado nivel de confianza menos la pérdida esperada, es decir,
U Lα = (Qα EL), donde Qα es el α-cuantil de la distribución de pérdidas y U Lα
es la pérdida no esperada. Básicamente, la noción de modelar el riesgo crédito,
se debe a la necesidad de una protección contra pérdidas, esto es, la estimación
de una prima por riesgo para cada crédito y administrarlas dentro de una cuenta
interna llamada reservas por riesgo crédito, estas reservas tendrán la función
de cubrir las pérdidas ocasionadas por incumplimiento en los créditos; en este
sentido, el capital económico tiene la función de proporcionar cierta protección
en los eventos en los que la estimación del riesgo crédito sea excedida por otra
pérdida.
En general, si en un portafolio de créditos se establece que ocurre una
pérdida cuando el valor de los activos Xi de la contraparte cae por debajo de
un umbral ui establecido, se tiene lo siguiente:
pi = P [Xi < ui ] = N (ui )ui = N −1 [pi ]
(1)
Es decir, si se define que el evento de incumplimiento ocurre cuando el rendimiento de los activos del acreditado es menor a cierto umbral y además si se
establece que este rendimiento está sujeto a riesgo sistemático y riesgo idiosincrásico o especı́fico, se puede establecer la siguiente relación:
p
√
Xi = ρY + 1 − ρZi
(2)
donde X representa a un conjunto de variables aleatorias con distribución conjunta normal estándar y correlaciones ρ e Y , y Z1 , Z2 , ..., Zn son variables
normal estándar mutuamente independientes y se refieren a factores de riesgo
común y riesgo especı́fico, respectivamente.
√
√
Por lo tanto, el incumplimiento ocurre si ρY + 1 − ρZi < ui , equiva√
√
lentemente ρY + 1 − ρZi < N −1 [pi ], es decir, el incumplimiento ocurre si y
sólo si:
p
√
Zi < (N −1 [pi ] − ρY )/ 1 − ρ
(3)
Considerando que Zi es una variable normal estándar, el evento de incumplimiento ocurre con probabilidad condicional:
−1
√ N [pi ] − ρY
√
pi (Y ) = P [Li = 1|Y ] = N
(4)
1−ρ
1
Esto se debe a que la pérdida esperada, de acuerdo a los mejores estimados de las
instituciones, puede ser equivalente a la misma cantidad de recursos que éstas mantienen
como protección, es decir, como un seguro contra incumplimiento.
53
Estableciendo que para un portafolio con m créditos, la exposición total
se incrementa a medida de que el número de individuos se incrementa y que
cada exposición individual se diluye a medida de que el tamaño del portafolio
tiende a infinito es suficiente para garantizar que en el lı́mite, la pérdida total
del portafolio Lm y la esperanza condicional de la pérdida E[Lm |Y ] son iguales
a.s. tal que:
P limm→∞ (Lm − E[Lm |Y ]) = 0 = 1
(5)
cuando
m
X
EADi ↑ ∞ si m → ∞
(6)
√ N −1 [pi ] − ρY
√
→ p(Y ) = N
a.s.
1−ρ
(7)
i=1
Ası́ cuando m → ∞:
Lm
Ahora, si se tiene que P [L ≤ x] = P [p(Y ) ≤ x], se sigue que:
P [L ≤ p(−qα (Y ))] = P [p(Y ) ≤ p(−qα (Y ))]
= P [Y ≥ −qα (Y )]
= P [−Y ≤ qα (Y )]
donde Y ∼ N (0, 1) y qα es el α-cuantil de la distribución normal estándar. Por
lo tanto, se tiene que:
−1
√
N [pi ] − ρqα Y
√
qα (L) = p(−qα (Y )) = N
(8)
1−ρ
De la expresión anterior se desprende el modelo de capital económico de Basilea
II considerando la severidad de la pérdida (LGD) y la pérdida esperada como
P ixLGD a un cuantil del 99.9%, teniendo ası́:
0.5
R
K = LGD×N (1−R)−0.5 ×G(Pr )+
×G(0.999) −Pr ×LGD (9)
1−R
siendo
K =requerimiento de capital
Pr =probabilidad de incumplimiento
X =exposición
LGD =Pérdida dado que hubo incumplimiento o severidad de la pérdida
R =Coeficiente de correlación, establecida en 0.15 para préstamos hipotecarios
N (x) : Denota la función de distribución acumulativa Normal estándar.
54
G(z) : Denota la función de distribución acumulativa inversa para una variable
aleatoria Normal estándar.
La expresión anterior proporciona como resultado el capital económico para
cubrir pérdidas no esperadas, al percentil 99.9%.
3. Cópulas
La teorı́a de cópulas es el fundamento de modelos de riesgo crédito tal como
los basados en calificaciones internas (BIS, 2006) y otros modelos estructurales
derivados del modelo de Merton (1974), (Vasicek 2002), sin embargo, una caracterı́stica principal de dichos modelos es el supuesto de un solo factor de riesgo
sistemático (ASRF, por sus siglas en Inglés). Puesto que la estructura de dependencia que se trata de capturar a través del modelo de cópula Gaussiana, se
obtiene de la correlación entre los activos de las entidades bajo estudio, surge
la necesidad de retomar los fundamentos de esta teorı́a para extender a otros
factores de riesgo cuando no es posible observar la variable de activos, más
aún, cuando se desea considerar la existencia de eventos extremos, los cuales
no pueden ser modelados bajo el escenario de normalidad.
En varios campos de estudio, el uso de cópulas ha sido una herramienta
muy útil para el análisis de dependencia entre vectores aleatorios que tienen
una función de distribución conjunta, la cual está definida por las distribuciones marginales de cada uno de los vectores considerados, particularmente en
riesgo crédito, los nuevos enfoques para valuación de activos financieros sujetos a
riesgo de incumplimiento, han mostrado mejores resultados empleando cópulas
para obtener la estructura de dependencia entre dos eventos de incumplimiento
conjunto (Li, 2000) para la valuación de derivados de crédito, estimación del
requerimiento de capital o pérdida no esperada (Gordy 2003) y para una colocación eficiente de capital mediante el estudio de la dependencia de ı́ndices de
mercado (Cherubini y Luciano, 2000), entre otras aplicaciones.
Una Cópula n-dimensional es una función de distribución multivariada con
distribuciones marginales estándar C : [0, 1]d → [0, 1], es decir, una función de
n dimensiones que mapea desde el cubo unitario de n dimensiones al intervalo
unitario y que está caracterizada por las siguientes tres propiedades:
1. C(u1 , u2 , ..., ud) es creciente en cada componente ui .
2. C(1, ..., 1, ui, 1, ...1) = ui para cada i ∈ {1, 2, .., d} y ui ∈ [0, 1].
3. Para cualesquiera (a1 , a2 , ..., ad), (b1 , b2 , ..., bd) ∈ [0, 1]d con ai ≤ bi se
tiene:
2
2
X
X
...
(−1)i1 +i2 +...+id C(u1i1 , udid , ..., udid ≥ 0
i1
i1
con uj1 = aj y uj2 = bj para todo j ∈ {1, 2, .., d}.
Ası́, si se supone un vector aleatorio X = (X1 , X2 , .., Xd)0 con distribución
conjunta F y marginales continuas F1 , F2 , ..., Fd aplicando una transformación
adecuada se obtiene un vector de la forma (F (X1 ), F (X2 ), ..., F (Xd)) cuya
función de distribución es por definición una cópula, la cual se denota por
C, lo anterior queda establecido mediante el teorema de Sklar (Nelsen, 2006).
Teorema de Sklar. Sea H una función de distribución n-dimensional con
marginales F1 , F2 , ..., Fn, entonces existe una cópula C n-dimensional tal que
para todo x ∈ Rn ,
H(x1 , x2 , ..., xn) = C(F1 (x1 ), F2 (x2 ), ..., Fn(xn ))
55
(10)
Si F1 , F2 , ..., Fn son continuas, entonces C es única, de lo contrario C está
definida únicamente sobre Ran F1 × Ran F2 × ... × Ran Fn .
Recı́procamente, si C es una cópula n-dimensional y F1 , F2 , ..., Fn son funciones de distribución, entonces la función H definida en (10) es una función de
distribución n-dimensional con marginales F1 , F2 , ..., Fn.
3.1 Cópula t-Student
Ésta Cópula es estudiada con gran detalle en Demarta y Mcneil (2004) donde
se definen algunas variantes importantes como la cópula t-Student agrupada y
la de valores extremos, esto debido a la habilidad de la cópula t de capturar
mejor el fenómeno de dependencia de valores extremos, la cópula t-Student está
definida mediante la expresión (11):
−1
t
Cv,P
(u1 , u2 , ..., ud) = tv,P (t−1
v (u1 ), ..., tv (ud ))
(11)
En la expresión (11) anterior, t−1
v es la inversa de la distribución t-Student
univariada o función de cuantiles, mientras que tv,P es la distribución t-Student
multivariada con v grados de libertad, media cero y matriz de correlaciones P ,
la cual se define como:
td (v, 0, P ) =
Z
t−1
v (u1 )
...
−∞
Z
t−1
v (ud )
−∞
Γ( v+d
2 )
Γ( v2 )
v+d
2
X 0 P −1 X
1+
dX
v
(12)
donde X = (X1 , X2 , ..., Xd)0 es un vector aleatorio de mezcla normal en varianza
definido como:
√
Xd = µ + W Z
(13)
donde Z ∼ Nd (0, Σ), W es independiente de Z y satisface v/W ∼ χ2v , equivalentemente W tiene distribución gamma inversa W ∼ Ig (v/2, v/2).
Para el caso particular de dos factores de riesgo o dos variables aleatorias
de interés con distribuciones marginales t-Student, la cópula t-Student bidimensional, está definida mediante la distribución t-Student bivariada:
t
C (u; θ) =
Z
tθ1 (u1 )
−∞
Z
tθ2 (u2 )
−∞
−θ12+2
(1 − θ22 )−1/2
s2 − 2θ2 st + t2
1+
dsdt (14)
2π
v(1 − θ22 )
donde u = (u1 , u2 ), θ = (θ1 , θ2 ) y θ1 son los grados de libertad, el cual controla
el peso de la cola y si θ1 → ∞,
C t (u1 , u2; θ1 , θ2 ) → ΦN (u1 , u2 ; θ2 ),
θ2 es el parámetro de dependencia o correlación.
56
3.2 Cópula Normal
Una de las cópulas más usadas en finanzas es la cópula normal, el modelo de
calificaciones internas de BASILEA II (BIS, 2006) se fundamenta en el supuesto
de un solo factor de riesgo sistemático (ASRF por sus siglas en inglés), mismo
que se distribuye normal con media cero y varianza uno. La cópula normal se
define como:
−1
−1
CPn (u1 , u2 , ..., ud) = ΦP (Φ−1
P (u1 ), ΦP (u2 ), ..., ΦP (ud ))
(15)
donde Φ es la distribución normal multivariada estándar, Φ−1 la distribución
normal univariada estándar inversa, P es la matriz de correlaciones con 1 en la
diagonal y ρ (la correlación del vector ui fuera de la diagonal, ası́ para el caso
bivariado, la expresión (15) toma la forma siguiente:
t
C (u1 , u2 ) =
Z
Φ−1 (u1 )
−∞
Z
Φ−1 (u2)
−∞
x2 − 2ρxy + y2
exp −
dxdy (16)
2(1 − ρ2 )
1 − ρ2
1
2π
p
3.3 Cópula Gumbel
La cópula Gumbel es la más común de las cópulas de valores extremos y está
definida mediante la expresión:
CαG(u1 , u2 )
1/α α
α
= exp − (ln(u1 )) + (ln(u2 ) )
(17)
para α ∈ [1, +∞].
El parámetro α controla el grado de dependencia y cuando es igual a uno,
la dependencia no existe, si α = +∞ hay dependencia perfecta.
3.4 Cópula empı́rica
Las cópulas empı́ricas son empleadas para realizar pruebas de independencia
no paramétricas y para la estimación no paramétrica de cópulas.
Sean u1 ≤ u2 ≤ ... ≤ un y v1 ≤ v2 ≤ ... ≤ vn los estadı́sticos de orden
de muestras univariadas de la cópula C, la cópula empı́rica Ĉ se define en los
puntos (i/n, j/n) por:
n
i j
1X
Ĉ
,
=
I{uk ≤ui ,vk ≤vj }
(18)
n n
n
k=1
para i, j = 1, 2, ..., n.
Ası́ mismo, Ĉ converge uniformemente a C, cuando el tamaño de la muestra
tiende a infinito.
La cópula empı́rica de frecuencia ĉ está dada por la siguiente expresión:
1
i j
si (ui , vi ) son elementos de la muestra
ĉ
,
= n
(19)
n n
0
en cualquier otro caso
57
4. Resultados
Se analiza un bono respaldado por hipotecas a través de la aplicación del modelo de calificaciones internas básico (BIS, 2006) y la teorı́a de cópulas a los
créditos hipotecarios que respaldan dicha estructura financiera, estimando el
residual mediante un nivel de capital económico (U Lα ) resultado de ambos
modelos. Para estimar los parámetros de riesgo crédito del portafolio, éste se
segmentó mediante la técnica de árboles de segmentación basados en pruebas
χ2 (CHAID), para esto se consideró la razón valor de la garantı́a a monto
financiado (LT V ) en el momento de la originación del crédito y de acuerdo con
Kaskowitz et al (2002), se consideró una ventana de 5 años para observar el
incumplimiento, mismo que ocurre si los créditos que tenı́an un atraso igual o
menor a 3 meses al inicio del periodo de observación, al final de 5 años tienen más
de tres meses de atraso, esta segmentación se realizó en el paquete estadı́stico
SPSS y los grupos resultantes se muestran en el cuadro 1.
Cuadro 1. Grupos y probabilidad de incumplimiento
resultado de la prueba CHAID.
Posterior a la segmentación, se construyeron las curvas de tasas de incumplimiento históricas por grupo, considerando el incumplimiento con atraso
en el pago mayor a 3 meses en un año, esta estimación es consistente con la
probabilidad de incumplimiento anual que se obtiene en los métodos de calificaciones internas. En la práctica, el indicador de incumplimiento es 3 pagos
atrasados o más, en el caso especı́fico de este trabajo, se empleará superior a
3 considerando un mayor periodo de observación antes de definir a un crédito
con estatus de incumplimiento. Ası́, el incumplimiento está definido por:
Îit =
n
X
1Dit
(20)
i=1
donde
1Dit =
1 si atraso mayor a 3 meses
0 si atraso menor a tres meses
(21)
Dado lo anterior, la tasa de incumplimiento está definida como la razón de
incumplimientos a total de observaciones de acuerdo a lo siguiente:
58
T it =
Iˆit
Nt
(22)
donde Tit es la tasa de incumplimiento observada en el periodo t y Nt el número
total de créditos hipotecarios (vigentes y vencidos).
La composición de la estructura de bursatilización se muestra en el cuadro
2, la primera estimación se realizó mediante simulación histórica de las pérdidas
obteniéndose la pérdida esperada, pérdida no esperada, α-cuantil y déficit esperado (P E, U Lα , Qα , ESα respectivamente) en lo que respecta al U Lα , α-cuantil
y al ESα , se obtuvieron para α = 99.9% que es el equivalente a la calificación
BBB en escala global de un bono y también a manera de comparación se presentan valores de 99% y 99.5%, el residual va a estar definido mediante el resultado
del α-cuantil menos la pérdida esperada, dado que la tasa activa 2 de un crédito
incluye la estimación de este tipo de pérdida como un costo a ser cubierto, este
resultado es el concepto de capital económico, estos resultados se muestran en
el cuadro 3.
Cuadro 2. Composición actual de la estructura de bursatilización.
* La exposición es la proporción del saldo del grupo respecto al total.
Dentro del enfoque regulatorio y de mejores prácticas bancarias, la correlación en el modelo de Basilea II es un parámetro exógeno establecido, para el
caso de créditos hipotecarios este valor es 0.15 y la probabilidad de incumplimiento se puede obtener mediante un modelo que asigne una calificación o
probabilidad de acuerdo a ciertas caracterı́sticas de segmentación, la severidad
de la pérdida puede ser obtenido también mediante un modelo estadı́stico o
puede considerarse como un parámetro establecido de acuerdo a si se trabajará
bajo el enfoque avanzado o estándar, respectivamente. En este caso, se empleará la probabilidad promedio de cada grupo de segmentación como insumo
para el modelo de capital económico; la severidad se considera un parámetro
constante en 50%. Adicionalmente, se incrementa el supuesto de correlación
entre incumplimientos para obtener una estimación más severa de la pérdida
no esperada, es decir, se prueba con una correlación de 0.20 para probar los
resultados del modelo con el supuesto del 0.15.
2
En términos generales, la tasa activa podrı́a definirse como la tasa de interés que cobra
una institución al financiar a una contraparte, la cual incluye el costo de financiamiento de
la institución, el riesgo crédito, un margen financiero, entre otros conceptos.
59
Cuadro 3. Resultados de la simulación histórica.
Cuadro 4. Parámetros para la expresión (1)
*El nombre del escenario no tiene relación con calificaciones crediticias.
Los resultados del modelo de BASILEA II de acuerdo a los parámetros
del cuadro 4, son mostrados en el cuadro 5, para el escenario KB1 significan el
empleo de una probabilidad promedio a 5 años resultado del cuadro 1 y una
correlación de 0.20, mostrando que la estimación del capital económico bajo
estos supuestos es mayor que con los parámetros establecidos del modelo de
Basilea II (expresión (9)) para un cuantil del 99.9%, el valor resultante del
promedio ponderado por exposición de cada grupo de riesgo es de 23.3% menor
que el bono bajo análisis que fue emitido con un residual igual al 27.9% de
toda la estructura, el cual está respaldado por hipotecas a 30 años y formado
por un tramo senior, un tramo subordinado y el residual que tiene la menor
subordinación en la estructura.
Cuadro 5. Estimación del residual por el modelo de
Basilea II, expresión (1) con parámetros de acuerdo al cuadro 4.
El análisis siguiente que se presenta, se desarrolló con el sistema estadı́stico
de libre acceso R (Develompent Core Team, 2010), empleando el paquete cópula
(Kojadinovic y Yan 2010) y de acuerdo a la teorı́a expuesta en la sección 3,
60
se tiene como primer caso la estimación paramétrica de la cópula t-Student
bivariada, que como ya se comentó en dicho apartado, supone que las marginales
univariadas son t-Student con v grados de libertad, por lo que es preciso estimar
los parámetros de la cópula (α) y de las marginales (β) de la expresión (14),
partiendo de la misma, la expresión de log-verosimilitud es la siguiente:
l(θ) = log(c(t1 (Xi , β), t2 (Xi , β); α) +
n X
2
X
log(tj (Xi , β))
(23)
i=1 j=1
donde θ(β T , αT )T es el vector de parámetros a ser estimados y el estimador de
máxima verosimilitud está dado por θ̂M L = arg maxθ∈Θ l(θ).
Figura 1. Panel de grupos de Ti y EAD. Densidades de las cópulas ajustadas.
La estimación de los parámetros de las cópulas y las marginales es un
proceso numérico complicado si se quiere llevar a cabo en un solo paso, por
lo que se implementó máxima verosimilitud en dos etapas, es decir primero se
estiman los parámetros de las marginales t-Student y en una segunda etapa se
estiman los parámetros de la cópula t-Student bivariada para los 5 pares de
variables Ti y EAD, las densidades de las cópulas ajustadas se muestran en
la figura 1, misma que muestra colas más pesadas para la cópula del par Ti
y EAD que representa al total del portafolio de créditos hipotecarios (grupo
Total).
Teniendo ajustada la cópula a los datos, se procede a simular las pérdidas
históricas y a obtener la pérdida esperada (P E), pérdida no esperada (U Lα ),
61
para cada uno de los pares de variables T ii , EADi de acuerdo a lo visto en la
sección 3. Estos valores se estimaron para los cuantiles 95% que es el cuantil
al que se define el V aR, al 99.9% que es la probabilidad a la cual se asigna la
calificación BBB en escala global a un bono, también a manera de comparación
se consideran 99% y 99.5%.
Cuadro 6. Pérdida esperada para los grupos de Ti y EAD y pérdida
no esperada a diferentes cuantiles para la cópula t-Student paramétrica.
Como segundo caso, se lleva a cabo la estimación semi-paramétricamente
de las cópulas t-Student, Normal y Gumbel, de acuerdo con Neelsen (1999) y
Genests y Favre (2007), dentro del análisis de cópulas se presenta el problema
de subestimación de las marginales ajustadas a los datos bajo estudio, este
problema se minimiza empleando la distribución empı́rica de las marginales,
obteniendo con esto la cópula empı́rica la cual está definida de acuerdo a la
expresión (18), este análisis se refiere a la estimación no paramétrica de cópulas
que de acuerdo a la sección III, dada la continuidad del par de vectores aleatorios
(X, Y ), existe una única cópula asociada a dicho vector la cual es invariante bajo
transformaciones monótonas no decrecientes de las marginales, es decir,
Ĉ(i/n, j/n) → C(X, Y )
cuando n → ∞, ası́ la dependencia entre Ĉ es capturada por la cópula empı́rica
como la mejor representación muestral de la cópula teórica C. En este sentido,
se desarrolla el siguiente análisis mediante la estimación no paramétrica de las
marginales y parámetrica para las cópulas t-Student, normal y Gumbel a los
vectores (T i,EAD).
no esperada a diferentes cuantiles para la cópula t-Student semi-paramétrica.
62
no esperada a diferentes cuantiles para la cópula Normal semi-paramétrica.
no esperada a diferentes cuantiles para la cópula Gumbel semi-paramétrica.
Definiendo al residual como el resultado de los modelos analizados para
un cuantil del 99.9% para el caso de las cópulas (U L0.999 ), se obtiene un nivel
inferior al residual real con el que se emitió la estructura de bursatilización que
fue del 27.9%, éste comparativo puede observarse en el cuadro 10, donde los
resultados para las cópulas, son una ponderación entre los niveles de U L0.999
de los cuadros 6 a 9 y el cuadro 2, estos resultados son ligeramente mayores y
por consiguiente más conservadores que los resultados obtenidos por el modelo
de calificaciones internas (BIS 2006), cuyo valor máximo fue de 23.3%. Se
notará que para el caso de las cópulas el resultado no tiene gran variación, esto
indica que los parámetros de riesgo considerados son poco sensibles respecto a
la cópula empleada.
Cuadro 10. Comparativo de estimaciones.
63
5. Conclusiones
Los resultados obtenidos muestran que las estimaciones basadas en el modelo
de Basilea II y Cópulas son inferiores al residual real con el que fue emitida
la estructura y que fue estimado mediante análisis de escenarios, esto sugiere
que el empleo del modelo de la agencia calificadora pudiera sobreestimar el
riesgo crédito de la estructura, por lo tanto se considera importante señalar
que el uso de modelos estadı́sticos como los empleados en esta investigación,
permiten disminuir el tamaño del residual o requerimiento de capital empleando
un nivel de confianza de 99.9%, obteniendo aún ası́una sobrecolateralización que
proporcione un desempeño satisfactorio de la estructura, ya que los modelos que
se emplearon en el presente trabajo, utilizan variables estadı́sticas que reflejan el
riesgo crédito de los activos subyacentes de los bonos respaldados por hipotecas.
Una caracterı́stica adicional a analizar es el plazo legal del bono el cual es
superior a los 25 años y la estrategia de realizar pagos anticipados al principal
en los casos donde se presentan excesos de flujos posteriores al pago de los respectivos cupones, disminuye significativamente el plazo de la estructura que de
acuerdo a las caracterı́sticas del escenario base de la proyección de su amortización, puede llegar a ser hasta de 10 años generando un riesgo de prepago, que
se presenta al amortizar anticipadamente el principal del bono cuando las tasas
de reinversión en el mercado son inferiores a la que paga dicho instrumento
financiero. Esta particularidad disminuye el riesgo de crédito del bono respaldado por hipotecas, ya que al amortizar anticipadamente las obligaciones del
fideicomiso, disminuye la exposición que éste tiene ante un eventual incremento
de la tasa de incumplimiento de los activos subyacentes de la estructura en el
futuro, éste efecto de prepago y su efecto en el residual, no se ha analizado a
profundidad de lo que se puede desprender una investigación posterior.
6. Referencias
Artzner, P.; Delbaen, F.; Eber, J. M.; Heat, D. 1999. Coherent measures of
risk. Mathematical Finance.
Bank for International Settlement (BIS). 2006. International convergence of
capital measurement and capital standards. Basel Committee on Banking
Supervision.
Cherubini, U; Luciano, E. 2000. Value at risk trade-off and capital allocation
with copulas. Turin.
Davidson, Andrew; Sanders, Anthony; Wolff, Lan-Ling; Ching, Anne. 2003.
Securitization: Structuring and investment analysis. Wiley.
Demarta, Stefano; McNeil, Alexander J. 2004. The t copula and related copulas. Department of Mathematics ETHZ Zürich.
Frey, Rüdiger; McNeil, Alexander J. 2002. Var and expected shortfall in portfolios of dependent credit risks: conceptual and practical insights.
Frey, Rüdiger; McNeil, Alexander J. 2001. Modeling dependent defaults.
Genest, Christian; Favre, Anne-Catherine. 2007. Everything you always
wanted to know about copula modeling but were afraid to ask. Journal of
Hydrologic Engineering. Pag 347-368.
Gordy, Michael B. 2003. A risk-factor model foundation for ratings-based bank
capital rules. Journal of Financial Intermediation. Pag. 199-232.
64
Kojadinovic, Ivan, Yan, Jun. (2010). Modeling multivariate distributions with
continuous margins using the copula r package. Journal of Statistical Software, 34(9), 1-20. URL http://www.jstatsoft.org/v34/i09/.
Kraskowitz, David; Kipkalov, Alexander; Lundstedt, Kyle; Mongo, John. 2002.
Best practices in mortgage default risk measurement and economic capital.
Washington Mutual Inc.
Li, David X. 2000. On default correlation: a copula function approach. The
RiskMetrics Group.
Merton, Robert C. 1974. On the pricing of corporate debt: the risk structure
of interest rates. Journal of Finance. Pag. 449-470.
Nelsen, Roger B. 1999. An introduction to copulas. Springer.
Vasicek, Oldrich Alfons. 2002. The distribution of loan portfolio value.
Capital Investments and real options:
news proposes
Beatriz Mota Aragón
∗
Recibido 25 de mayo de 2010. Aceptado 26 de octubre de 2010
Resumen
La aportación más importante de este trabajo está orientada a la Teorı́a de
Opciones Reales. La investigación sostiene que el Valor Presente Neto (V P N )
es un proceso estocástico. Se sugiere un modelo de opciones reales a través de
un “modelo extendido” de Vasicek y Cox-Ingersoll-Ross (1985) para la tasa de
interés en el V P N , en el cual se consideran variables de control externas (Zt ),
mismas que cambian el curso de los flujos netos de efectivo. El VPN modificado
sugiere un valor presente neto más exacto al valuar V P N (Zt ) + φ, donde φ es
la opción real.
Abstract
The main contribution of this research to directed on Real Option Theory.
Research asserts that Net Present Value (N P V ) is stochastic processes. A
model for the real options is suggest where is constructing a continuous model
for net present value named “Vasicek extended ”and the Cox-Ingersoll-Ross
(1985) model for interest rate is examined. In the model is considering external
control variables (Zt ) which change the N CF course. The modified N P V (Zt )
this gives a more accurate value for valuating V P N (Zt ) + φ, where φ is the real
option.
Clasificación JEL: Finance 0508
Palabras Clave: Capital Investments Theory, Net Present Value, Net Cash Flow, Interest
Rate, Real Options Theory, Options Financial Theory, Stochastic Processes. Asymmetric
Information.
1. Introduction
This research suggested a different point of view about on the real options
theory. The orthodox capital investment theory is considered and thinking
about assumptions the Net Present Value (NPV), such as the assets price follows
a discrete process, or that the interest rate is constant. The research presented
assumptions a different way, at the stochastic processes theory. The work is
proposing a continuous model which explains the Net Present Value (NPV)
random evolution. And their effects on the valuation on the real options theory.
The financial options theory is considered too.
∗
Profesora Titular “C” de Tiempo Completo en la Universidad Autónoma MetropolitanaIztapalapa. E-mail: [email protected].
66
The first section presents a real option theory extended review is made and
observed the several fields the action. Second, the fundamental concepts the financial option valuation theory and real option theory are reintroduced. Third,
the capital investment theory is review and proposed a continuous model of
N P V and the real options model later.
The N P V continuous model is defined in the Net Cash Flow (N CF ) with
external control variables (Zt ) with Vasicek model (1977) and the interest rate
with Cox-Ingersoll-Ross model (1985) for determined the interest rate and finally φ is incorporated in the RO.
2. Literature Review
This section expected to show the several works development using real options
theory (Mota, 2006). The methodology developed with the real options was
first applied to investments in natural resources; nevertheless there are applications in other fields such as Research and Development (R&D), Corporate
Strategies, Mergers and Acquisitions (M&A), Innovation and High Technology, Intellectual Property Rights, Interest Rate, Capital Risk, among others,
Schwartz and Trigeorgis (2000). See table 1.
Copeland and Vladimir (2001) stated that real options may be applied on
almost any situation where it is possible to estimate a Net Present Value (NPV)
project. Merton (1988) presents an excellent review showing the ample scope
of applications that the real options theory has had.
Dixit and Pindyck (1995), Amram and Kulatilaka (1999) and Trigeorgis
(1988) provide conceptual arguments to develop real options on capital investment decisions. Other conceptual works are presented by Trigeorgis and Mason
(1987), Brealy and Myers (2000). As well as Merton (1977) and Mason and
Merton (1985) discuss connections among financial options and investment decisions.
Real options quantitative origins derivate form the works on financial options by Black-Sholes (1973) and Merton (1973). And other way, Cox, Ross
and Rubinsteins (1979) study and made possible the use binomial lattices to
evaluate options in discrete time.
Another important work is the one of Geske (1979) who evaluates compound options with differential equations. Kulatilaka and Trigeorgis (1994)
present a model in discrete time to interchange options. Dixit (1992) presents
a discrete model to valuate the expected value. Pindyck (1988) shows in a continuous expected value model using dynamic programming. Dixit and Pindyck
(1994) study the cost function and implication as diffusion processes; also see
Quigg (1993).
Cortazar (1992) makes a simulation and other numerical approximations
to valuate an European real option. Among others, as we can see, there is
an important number of works in real options literature which are focused in
quantitative valuation, the ones mentioned are important for this research.
In the following table we might observe according to their area, some of
the works developed using real options theory.
Capital Investments and real options: news proposes
67
Table 1
Real options: Topics and some Application Areas
Source: Lander y Pinches (1988), Schwartz (2001) y Mota (2006, 2008).
68
The review of the literature shown in the table above to show the fact
that real options may be used in several fields related to investment project
evaluation.
3. Fundamental concepts
As well known, the financial option valuation theory was written in the 1970s by
Black-Sholes and Merton (1973), they got a close solution for the equilibrium
price of a call option; since then, hundreds of articles and empirical studies
have been written in this direction and have been linked to the real options
theory. Myers (1977) stated that corporative assets may be seen as growth
options (as a call option) and through this he applies financial options concepts
to real assets. Brabazon (1999) states that the real options concept comes from
financial options research, among others.
A definition accepted for a real option purchase is the right, but not the
obligation of investing, postponing, expanding, contracting or quitting an investment project in the future. This decision has a predetermined cost called
exercise price which will be paid in a determined date and which exists during
the whole option life long (Copeland and Antikarov, 2001). While exercising,
the option utility is the difference between the underlying assets value and the
exercise price, and considering that in general terms real options theory is an
extension of the financial options theory applied to the non-financial real assets
valuation, so to the capital investment (Amram and Kulatilaka, 1999), therefore
we find some adaptations on the parameters to consider the valuation.
The parameters that compose a financial option are:
The underlying asset price Sf , the exercise price K, the underlying volatility σ, the risk-free rate r and the option T − t expiration date.
Table 2
Real and Financial Options Parameter Valuation
Source: Mota (2006). Adapted of Venegas, F. (2006). Riesgos Financieros y
Económicos. Thomson, México. Chapter 69, p. 801.
At the real options language: Sf is the cash flow present value expected in
t; K is the cost at present value of the project investment in t; σ is the project
cash flow volatility; r is the risk-free rate and T −t is the project maturity time.
69
Finally, some methodology advantages are: first, it considers uncertainty,
which to get any type of growth opportunity, diversification or risk (Smith and
Triantis, 1998). Thus an important methodology value is given by the possibility
of according administratives abilities that from the traditional method valuation
perspective of NPV is impossible to evaluate.
Second, real options integrates technological and strategic factors inside a
general valuation model (McGrath and McMillan, 2000), it to make possible
to manage administratives abilities. Third, from the methodological viewpoint
a decision process based on real options offers a systematic approximation to
invest and evaluate in a high uncertainty and competence environment, creating
subsequent investment opportunities, evaluated as cash flows plus a group of
options (Amram and Kulatilaka 1999). Mota (2006).
3.1 Real options versus financial options
For ended, and assuming that the Real Option (RO) takes their base from
the Financial Option (F O) theory, it is important to mention differences between them because they change the RO models mathematical structure. The
F O had been used for periods, while the RO have a recent development. The
RO have a long term life, T − t = years, and the F O have a short term life,
usually T − t = months.
The underlying asset in F O is the asset price; while in RO there is an
infinite variables quantity, in our case they are the net cash flows. Since the
analysis of RO considers physical assets (real), we might be careful at the
underlying variables selection, because the mentioned volatility refers to the
underlying asset.
The OF are regulated, although in theory, stockholders manipulate asset
price for their sake. The RO are created by the enterprise and their decisions
may increase the project value. The F O have relatively got a lower value
(hundreds or thousands dollars per option), while the RO worth thousands,
millions or billions dollars per project (strategic option), Mun (2002).
Both option types may fuse by using similar approximations; close solutions, finite differences; Brennan (1979), partial differential equations; Geske
(1979), binomial and multinomial lattices; Cox, Ross and Rubinstein (1979),
Trigeorgis (1991), Hull and White (1988) and Boyle (1976), who include the
Monte Carlo simulation.
The FO models are based in a formal market, which make assets prices
to be transparent; thus model construction is more objective. The RO are not
negotiated at a formal market and financial information is just available for the
administration, therefore model designing becomes subjective.
Hence, the enterprise assumes the key is to valuate RO not F O. Having a
particular project issued, the enterprise may create strategies that might provide
by themselves future options, whose value could vary depending on how they
are constructed, (Mun, 2002).
In short, fundamental characteristics and differences of RO and F O are
presented in table 3.
70
Table 3
Differences between Real Options and Financial Options
Source: Mota (2006, 2008). Adapted from Mun, J. (2002): Real options, Analysis. J. Wiley, USA. Chapter 5, p. 100.
4. Capital investments
Is time to review the capital investment theory and proposing a continuous
model of Net Present Value and the real options model later.
Literature about capital investments may be divided in two groups; the one
formed by independent investment opportunities, situations where investments
considered are substantial and another which includes some models studying
sequential irreversible investments, Pindyck (1988).
Dixit and Pindyck (1994), Dixit (1995), Bertola (1998), Ingersoll and Ross
(1992) were the first ones who considered the stochastic interest rate impact
over investment opportunities. Alvarez and Koskela (2006) extended Ingersoll
and Ross (1992) analysis for different interest rates and uncertain income joints.
The question is: How does this work impact the real options theory? This
research to assume that in order to understand nowadays enterprise problems
we must exclude the orthodox NPV, and it shows the requirement to include
stochastic processes in N CF and N P V valuation.
The principal condemnation to the traditional N P V method is that it
produces a simple estimation, and this is a disadvantage, because the events
that affect cash flow forecasts are highly uncertain; Myers (1987), Trigeorgis
(1993), (Copeland and Vladimir, 2001). Other remarks are in Hayes and Garvin
(1982) and Hayes and Abernathy (1980), who recognize that the N P V criteria
sub estimates investment opportunities.
71
Brennan and Schwartz (1985) support that the NCF presents deep limitations due to prices volatility. Paddock, Siegel and Smith (1988) list NPV
technique disadvantages.
On the other hand, Dixit and Pindick (1994) assure that:
“The simple N P V rule is not just wrong; it is often very wrong ”, (see
chap. 5:136). One of the fundamental drawbacks observed at the traditional
N P V technique is that N CF estimation depends on a constant benefit rate
and static expected flows. On several works, the method selected to solve
the expected project cash flow estimation problem consists of inferring that
the project generates perpetual rents in constant terms identical to the ones
generated on the last exercise, and the interest rate with which they discount
expected cash flows follows the CAM P rules. Copeland and Antikarov (2001),
D´ iaz (1999, 2000), Kester (1984), Gil (1991), and Smith (2001), Mota (2006,
2008, 2009), among others.
Motivated by the argument previously exposed, we to suggest the Net
Present Value continuous model, which defined the Net Cash Flow with external control variables (Zt ), and confirmed that N CF and interest rate are not
constants. A criterion distant to the one we find at ultra-traditional environment. His expression is, Mota (2006, 2009):
"Z
#
T
NP V = E
N CF (t)e−r(t)t dt
0
NP V = NP V + φ
The discrete version of the model to explain the Net Cash Flow and its
internal dynamics with variables (Zt ) and random interest rate, is presented in
the description follow, see Mota (2006):
Table 4
72
The important point in this research is that now NCF is a stochastic process
that the administration council looks forward and guides the evolution. We
have used diffusion processes with control variables (Zt) and showed that these
processes not only explain NCF evolution, but also guides it. The analysis
about how to use control variables on diffusion processes is of the form:
dN CFt = µ(Zt , N CFt, t)dt + σ(Zt , N CFt, t)dWt
In this work we have used the Vasicek model (1977) which is a diffusion process
and due to its affinity with the purpose of this work had showed been applicable,
but the possibility of studying more processes and proposing new ones is not
excluded, still more. Only by focusing in the component F (Zt ) formulation,
proposing non-linear relations, we get the possibility of entering upon complex
schemes.
In short, the modified real option is:
"Z
#
T
RO = N P V = E
N CF (t)e−r(t)t dt > 0
0
In order to review the impact on a real option value and therefore on real options
theory, it would be enough to apply modified N P V with external variables (Zt )
on a capital investment opportunity; we take back the idea that a real option
is:
NP V = NP V + φ > 0
and we ask whether the real option is such that N P V < 0, φ is call/put option
such that N P V = N P V + φ > 0. We change the path by taking more steps
before a decision is reach, instead we see the relation:
N P V (Zt ) = N P V (Zt ) + φ
and we start in the same place with N P V < 0, and φ is a call/put option, now
we suggest:
1.- Find a suitable Zt such that N P V (Zt ) > 0.
2.- If for all possible sets {Zt } N P V < 0, then find a couple {Zt , φ} such
that
N P V (Zt ) = N P V (Zt ) + φ > 0
The simple idea that takes traditional NPV ignores:
1. The {Zt} set is actually acting over the cash flow estimates.
2. N P V is a stochastic processes not a deterministic one.
The typical questions emerged from administration council while making a capital investment decision can be answered from traditional viewpoint: V P N > 0,
from real options perspective traditional: V P N + φ > 0, or even from a new
approach proposed in this research; V P N (Zt ) + φ > 0 as information joint
associated to Zt .
Classical real options inquiries investing in research and development; expanding or not annual production; postponing an investment project, etc. these
are questions on the structure N P V (Zt )+φ > 0. With this approach, accepting
or rejecting an investment project depends on variables Zt trajectories.
73
The rationale behind is that with the model proposed we go into a more
accurate value rather than just doing a real option valuation. Now since N P V
is stochastic and is possible to manage its behavior through a wise use of the
control variables, now the firm has to set the level of Zt in N V P = N P V (Zt ),
which says the ability to generate wealth in the firm depends on the decisions
of the board setting the level of control (Zt ).
5. Conclusions
The work was written on the continuous objective to contribute in Real Options
Theory with news proposes. We have been proposed that the Net Present Value
is a stochastic process because we should consider a continuous models Net
Cash Flow and interest rate. The considering external control variables (Zt )
which change the Net Cash Flow course and modified the traditional N P V for
N P V (Zt ) and addition φ, where φ is the real option are some contributions.
Mota (2006, 2008, 2009).
In this research was important raised that multiples questions emerged
from administration council while making a capital investment decision can be
answered from approach proposed:
V P N (Zt ) + φ > 0
as information joint associated to Zt and these are questions on the structure
N P V = N P V (Zt ) + φ > 0. With this approach, accepting or rejecting an
investment project depends on variables Zt trajectories. In short, we find a
suitable Zt such that N P V (Zt ) > 0 and if for all possible sets {Zt }, N P V < 0
then find a couple {Zt , φ} such that N P V = N P V (Zt ) + φ > 0.
As can see, for the Investment Capital Theory this work is significant for
investment project area because the model proposed is able to offer a more
accurate valuation the real option.
6. References
Amram, M. and N. Kulatilaka (1999). Real Options Managing Strategic Investment in an Uncertain World. Boston, Massachusetts: Harvard Business
School Press.
Brabazon, T. (1999). Real Options: Valuing Flexibility in Capital Investment
Decisions. Accountancy Ireland, 31 (6): 16-18.
Breeden, D. (1979). An Intertemporal Asset Pricing Model with Stochastic Consumption and Investment Opportunities, Journal of Financial Economics, 7, 265-296.
Brennan, M. (1979). The Pricing of Contingent Claims in Discrete Time Models, Journal of Finance, pp.53-68.
Brennan, M., and E. Schwartz (September 1978). Finite Difference Methodos and Jump Process Arising in the Pricing of Contingent Calims: A
Synthesis, Journal of Finance and Quantitatve Analysis, pp. 461-474.
Brennan, M., and E. Schwartz (Spring 1985). Evaluating Natural Resources
Investments, Journal of Business, 58, 135-157.
Boyle, P. (May 1977). Options: A Monte Carlo Approach, Journal of Financial
Economics, 323-338.
74
Campbell, J., A. W. Lo and A. C. MacKinlay (1997). The Econometrics of
Financal Markets. Princenton, New Jersey: Princenton University Press.
Copeland, T. and V. Antikarov (2001). Real Options: A Practitioner’s Guide,
New York, N.Y.: Thomson Texere.
Cox, J. J. Ingersoll and S. Ross (1985). An Intertemporal General Equilibrium
Model of Asset Prices. Econometrica, 53, 363-384.
Cox, D. R. and H. D. Miller (1965). The Theory of Stochastic Processes:
Chapman and Hall.
Chiang, A. (1984). Fundamental Methods of Mathematical Economics. (3a.
ed.). USA: McGraw Hill.
Dixit, A. and Pindyck, R. (May-June 1995). The Options Approach to Capital
Investment. Harvard Business Review, 105-118.
Dixit, A. and Pindyck, R. (1994). Investment Under Uncertainty. New Jersey,
Princeton University Press.
Dohan, U. (1978). On the Term Structure of Interest Rates. Journal of Financial Economics 6, 59-69. Engle, R. and Ng, V. (2000). Measuring and
Testing the Impact News on Volatility, in ARCH Selected Readings, Edited
for Engle, R. and Ng, V. (2000). Oxford University Press.
Geske, R. (1979). The Valuation of Compounds Options. Journal of Financial
Economics 7 (1): 63-81.
Glasserman, P. (2004). Monte Carlo Methods in Financial Engineering: Verlag.
Glosten, L. R., R. Jagannathan, and D. E. Runkle (1993). On the Relation
Between the Expect Value and the Volatility of the Nominal Excess Return
on Stocks. Journal of Finance, 48, 1779-1801.
Gourieroux and Jasiak (2001). Financial Econometrics: Diffusion Process,
USA: Princeton Series in Finance.
Heath, D., R. Jarrow, and A. Merton (1990).
Bond Pricing and the
Term Structure of Interest Rates: A Discrete Approximation. Journal
of Financial and Quantitative Analysis, 25 (4): 419-440. Heath, D., R.
Jarrow, and A. Merton (1992). Bond Pricing and the Term Structure of
Interest Rates: A New
Methodology for Contingent Claims Valuation. Econometrica, 60 (1): 77105. Herath, H., and C. Park (2001). Real Options Valuation and its
Relationship to Bayesian Decision Making
Methods: The Engineering Economist, 46 (1), 1-32. Ho, T. and S. Lee (1986).
Term Structure Movements and Pricing Interest Rate Contingent Claims.
Journal of Finance, 42 (5), 1011-1029.
Hughston, L. (1996). Vasicek and Beyond: Approaches to Building and Appliying Interest Rate Models. London: Risk Publications.
Hull, J., (1993). Options, Futures and other Derivative Securities, (2nd ed.).
USA: Prentice Hall.
Hull, J. and A. White (1988). The Use of the Control Variate Technique in
Option Pricing. Journal of Financial and Quantitative Analysis, 23 (3):
237-251.
Ingersoll, J., and S. Ross (1992). Waiting to Invest: Investment and Uncertainty, Journal of Business, 65 (1): 1-29.
Kaplan, S. and R. Ruback (1995). The Valuation of Cash Forecast: An Empirical Analysis. The Journal of Finance, 50 (4):1059-1092.
75
Kester, W. C. (1984). Today’s Options for Tomorrows Growth. Harvard Business Review, 62 (2): 153-160.
Kogut, B., and N. Kulatilaka (2001). Strategy, Heuristics, and Real Options.
The Oxford Handbook of Strategy.
Kulatilaka, N., and E. Perotti (1998). Strategic Growth Options. Management
Science, 44 (8), 1021-1031.
Kulatilaka, N., and L. Trigerorgis (1994). The General Flexibility to Switch:
Real Options Revisited, International Journal of Finance, 6 (2): 27-54.
Lamberton, D. and B. Lapeyre (1997). Introduction to Stochastic Calculus
Applied to Finance. (First ed.) Great Britain: Chapman & Hall.
Lander, D., and G. Pinches (1998). Challenges to the Practical Implementation of Modeling and Valuing Real Options. The Quarterly Review of
Economics and Finance, 38, 537-567.
Majd, S., and Pindyck, R. (March 1987). Time to Build, Option Value, and
Investment Decisions, Journal of Financial Economics 18: 7-27.
McDonald, R., and Siegel, D., (1985). Investment and the Valuation of Firms
When There is an Option to Shut Down. International Economic Review
26 (2): 331-349.
Mcgrath, R., and I. Mac Millan (2000). Assessing Technology Projects using
Real Options Reasoning. Research Technology Management, 43 (4), 35-49.
Merton, R. C., (1970). Optimum Consumption and Portfolio Rules in a
Continuous-Time Model. Working Papers 58, Massachusetts Institute of
Technology (MIT), Departments of Economics.
Merton, R. C., (1973). Theory of Rational Option Pricing. Bell Journal of
Economics and Management Science, 4, 141-183.
Merton (1998). Applications of Option-Pricing Theory: Twenty-Five Years
Later. American Economic Review, 88(3): 336-340.
Moel, A., and P. Tufano (2000). When are Real Options Exercised? An
Empirical Study of
Mine Closings. Review of Financial Studies, 15, 35-64.
Mota, B. (2006). La teorı́a de Opciones Reales, los Proyectos de Inversión y
las Decisiones Estratégicas de Negocios, Denarius 13: 245-266.
Mota, B. (2008). Proyectos de Inversión: Una Visión Iberoamericana. La
Teorı́a de Procesos Estocásticos en el análisis de los Flujos de Efectivo de
un Proyecto de Inversión, Cap. 7: 255, FCA-UNAM, México.
Mota, B., Ludlow, J. Williams, F. (2008). Stochastic Processes. A Critical
Synthesis. Análisis Económico, Vol. XXIII, No. 53. México.
Myers, S. (1977). Determinants of Corporate Borrowing. Journal of Financial
Economics, 5: 147-175.
Mun, J. (2002), Real Options Analysis, Tools and Techniques for Valuing
Strategic Investments and Decisions, New Jersey: John Wiley Sons, Inc.
Myers, S. and Majad, S. (1990). Abandonment Value and Project Life. Advances in Futures and Options Research, 4: 1-21.
Natenberg, S. (1994). Option Volatility Pricing. Cambridge, England: Probus
Publishing Company.
Neftci, S. N., (2000). An Introduction to the Mathematics of Financial Derivatives. (2a. ed.), New York, N.Y.: Academic Press.
Paddock, J. Siegel, D. and Smith, J. (1988). Option Valuation of Claims on
Physical Assets: The Case of Offshore Petroleum Leases, Quarterly Journal
76
of Economics 103, 479-508.
Pindyck, R. (1988). Irreversible Investment, Capacity Choice, and the Value
of the Firm. American Economic Review 78, 5: 969-985.
Quigg, L. (1993). Empirical Testing of Real Option-Pricing Models, Journal
of Finance, 48, 621-640.).
Rebonato, R. (1996). Interest Rate Option Models. England: John Wiley
Sons.
Schwartz, E., and L. Trigeorgis (2000). Real Options and Investment under
Uncertainty: Classical Readings and Recent Contributions. MIT Press.
Schwartz, E., and C. Zozaya-Gorostiza (2000). Valuation of Information Technology Investments as Real Options. AFA 2001, New Orleans Meetings.
Smith, K., and A. Triantis (1998). The Value of Options in Strategic Acquisitions, in Trigeorgis, L. (1999): Real Options and Business Strategy:
Applications to Decision-Making, Risk Books.
Trigeorgis, L., and Mason, S.P., (1987). Valuing Managerial Flexibility. Midland Corporate Finance Journal 5 (1): 14-21.
Trigeorgis, L. (1988). A Conceptual Options Framework for Capital Budgeting.
Advances in Futures and Options Research 3, 145-167.
Trigeorgis, L. (Autumm, 1993). Real Options and Interactions with Financial
Flexibility, Financial Management 22 (3): 202-224.
Trigeorgis, L. (Autumm, 1993). The Nature of Option Interactions and the
Valuation of Investments with Multiple Real Options, Journal of Financial
and Quantitative Analysis, 28 (1): 1-20.
Trigeorgis, L. (1991). A Long Transformed Binomial Numerical Analysis
Method for Valuing Complex Multi-Option Investments. Journal of Financial and Quantitative Analysis, 26 (3): 309-326.
Trigeorgis, L. (1998). Real Options, Managerial Flexibility and Strategy in
Resource Allocation, Cambridge, The MIT Press.
Vasicek, O. (1977). An Equilibrium Characterization of the Term Structure.
Journal of Financial Economics, 5, 177-188.
Venegas, F. (2006). Riesgos Financieros y Económicos: Productos Derivados
y Decisiones Económicas bajo incertidumbre. (1 ed.), México, Thomson.
Wilmott, P. (2000). Quantitative Finance. England: John Wiley Sons, Inc.
Valuación de Swaptions Bermuda
basada en el Modelo LIBOR
adaptado a vectores frontera
Igor P. Rivera∗
Enzo D’Antonio di Vito D.
Andrés Fundia ∗∗∗
∗∗
Recibido 15 de abril de 2010. Aceptado 09 de septiembre de 2010
Resumen
El presente trabajo estudia el cálculo del precio de Swaptions tipo Bermuda,
con base en el Modelo Libor (LMM) de tasa de interés adaptado al algoritmo
de vectores de frontera de ejercicio para valuar opciones americanas. Dicho
algoritmo de la familia de la simulación Monte Carlo, obtiene una frontera
de tasas de ejercicio que permite valorar la decisión de seguir en la opción o
ejercerla de forma anticipada. Este enfoque tiene la ventaja de ser fácil de
implementar y puede obtener un resultado rápido y aproximado del valor de un
Swaption bermudano, mejor conocido en el mercado como Swaption Bermuda.
Abstract
This paper studies the computation of the price of Bermuda Swaptions type,
based on the Libor Model (LMM) interest rate vector algorithm adapted to
the exercise boundary to value American options. This algorithm about family
Monte Carlo, get a border exercise to rate the value of staying in decision
option or exercise early. This approach has the advantage of being quickly to
implement and get a result about the value of a swaption bermudano, better
known swaption market as Bermuda.
Clasificación JEL : G10, G14
Palabras clave: Valuación de derivados de tasa de interés, Swaptions Bermuda, Simulación
Monte Carlo
Introducción
Actualmente el uso de derivados sofisticados es cada vez más solicitado en los
mercados financieros y entre las razones principales de esta creciente demanda
se encuentra la posibilidad de aprovechar y generar oportunidades de negocio
∗
Escuela de Graduados en Administración y Dirección de Empresas Tecnológico de Monterrey, Campus Ciudad de México, EGADE. Calle del Puente 222, Aulas 4-Piso 4, Ejidos de
Huipulco, Tlalpan, D.F. 14380, e-mail: [email protected]
∗∗
∗∗∗
Departamento de Estructuración BBVA Bancomer (México)
Departamento de Riesgos Infonavit, México
78
que se derivan de la evolución y cambios de las necesidades de los clientes y
participantes de los mercados. Entre los productos más comunes en el mercado
de derivados de tasas, se encuentran los caps, floors y los swaps. Los caps son
opciones de tasas de interés que le garantizan al tenedor que una tasa variable
no exceda de un nivel especı́fico; los floors, contrario a los caps, garantizan al
tenedor que una tasa variable no disminuya de un cierto nivel. La cotización
de ambos en el mercado generalmente se realiza en términos de volatilidad de
tasas.
Por otra parte, los swaps son contratos en el que las contrapartes acuerdan
el intercambio de flujos futuros en una misma o en diferentes monedas y a
tasas fijas o flotantes. Dado que el uso de swaps en los mercados se ha hecho
tan común, que ha generado la necesidad de utilizar derivados sofisticados que
tengan como subyacente a los swaps, entre ellos estan los swaps adelantados, los
futuros sobre swaps y las opciones sobre swaps, mejor conocidas en el mercado
como swaptions. Los swaptions contratos que otorgan a su tenedor el derecho
de entrar en un swap, para recibir o pagar una tasa fija.
Al igual que las opciones de tasas de interés, los swaptions cotizan en
términos de volatilidad de tasas y la tasa de ejercicio está dada por la tasa fija
del swap subyacente al que se puede entrar. También, como en el caso de las
opciones tradicionales, los swaptions pueden ser de tipo europeos o americanos
aunque también son muy común los de tipo bermudano. Los swaptions europeos
pueden ejercerse únicamente a su vencimiento, mientras que los americanos
pueden ser ejercidos en cualquier momento antes del vencimiento. Entre dichos
extremos, existe una variante, llamada opción bermuda que permiten ejercer el
derecho asociado en un calendario de fechas definido antes del vencimiento. Los
vencimientos tı́picos de un swaption pueden ir desde unos cuantos meses hasta
varios años.
En el caso de los swaptions, la analogı́a entre opciones de compra (calls) y
de venta (puts) se define en términos de la clase de tasa de interés que al tenedor
corresponderı́a pagar en caso de ejercer su derecho de entrar al swap: en un
call swaption, mejor conocido como payer swaption, el tenedor tiene el derecho
de entrar al swap pagando flujos a tasa fija, mientras que en el put swaption,
tı́picamente denominado receiver swaption, el tenedor queda habilitado para
entrar al swap erogando los flujos a tasa variable si decide ejercer la opción.
Si bien los swaptions bermudanos pueden ser utilizados con objeto de negociación y especulación, han cobrado gran importancia al usarse como instrumentos de cobertura. De hecho, los swaptions bermudanos generalmente están
implı́citos en swaps que pueden ser cancelables (conocidos como callable swaps)
los cuales la mayorı́a de las veces forman parte de canastas de activos o de
bonos cancelables en las campañas de financiación corporativa. Por ejemplo,
en perı́odos de baja volatilidad, intermediarios financieros y tesorerı́as bancarias, podrı́an tomar posición larga en swaptions para compensarla en perı́odos
posteriores de mayor volatilidad; bajo esquemas de esta naturaleza generalmente se negocian swaptions tipo europeo y en estrategias básicas. Incluso, una
tesorerı́a bancaria podrı́a utilizar un swaption para cubrir niveles de volatilidad
provocados por posiciones propias o de clientes.
Existen en la literatura diversas referencias sobre los efectos de noticias y
avisos macroeconómicos tanto en el mercado de contado de tasas de interés,
como en su mercado de derivados; se sugiere al lector el trabajo de Forniari
Valuación de swaptions Bermuda ...
79
(2004) como compendio sobre el tema. Ante tales circunstancias, es común que
una tesorerı́a bancaria necesite ajustar el desbalance de duración que se genera
ante eventos de prepago de sus créditos de mediano y largo plazo. Por ejemplo,
suponga que el banco otorgó un crédito a tasa fija en el que el cliente pueda
prepagar de forma anticipada; si bien el crédito puede cubrirse por un swap,
simultáneamente el prepago puede cubrirse con la compra de un swaption que
otorgue el derecho de recibir la tasa fija. Ası́, en el caso de que el cliente decida
prepagar el crédito (esto asume que el prepago se realiza por ventajas en el
mercado), la cobertura instituı́da en forma del swap deja de tener sentido, de
modo que el banco debe ejercer el swaption a fin de compensar el swap mediante
la sustitución de los flujos. a tasa fija que proporcionaba el antiguo acreditado.
El siguiente cuadro muestra un ejemplo de cobertura contra el riesgo de
prepago por medio de un swaption.
Para el caso de los swaptions europeos, es posible obtener una solución
cerrada a la ecuación diferencial parcial del precio del swaption, en la forma de
una ecuación del tipo Black-Scholes-Merton. Sin embargo, esto no es posible en
el caso del swaption Bermuda por lo que en este trabajo emplearemos métodos
originalmente pensados para la valuación de opciones americanas para obtener
una aproximación al precio del swaption bermudano. Si bien, existe literatura
relacionada con esta conjetura (p.e. Andersen (2000)), el enfoque que en este
trabajo presenta se caracteriza por su fácil implementación. El modelo Libor
80
para determinar las tasas de mercado tanto porque se apega a los datos estilizados sin recurrir a parámetros no observables y porque es compatible con el
uso del método Monte Carlo. El trabajo está organizado de la siguiente forma:
en la sección 2 abordamos las técnicas más comunes de valuación de swaps; en
la sección 3 mostramos como la simulación Monte Carlo permite manejar la
dependencia con la trayectoria del modelo Libor de mercado, al mismo tiempo
que permite incorporar vectores frontera para hacer frente al ejercicio anticipado de las opciones americanas. En la sección 4 se revisa la implementación.
En la sección 5 se analizan los resultados y se trazan algunas conclusiones.
2. Técnicas comunes de valuación de swaptions
Como se muestra en las figuras 2.1 y 2.2, los derivados de tasas de interés se
cotizan tı́picamente en términos de una estructura de plazos de la volatilidad
implı́cita calculada con base en un modelo de Black (1976) bajo el supuesto de
una dinámica lognormal de la tasa de interés.
Figura 2.1. Cotización de caps y floors sobre la Libor del USD (Fuente: Bloomberg, L.P.)
Con el fin de obtener una ecuación para valuar un swaption como el del
ejemplo en las figuras 2.1 y 2.2, considere primeramente al swap subyacente
con una estructura de pagos, dada por el plazo θ que empezarı́a a correr si y
sólo si el swaption hubiera sido ejercido en la fecha, Tk . Dicho swap tendrı́a su
vencimiento en Tm . La condición a alcanzar al vencimiento serı́a la tasa swap
adelantada fuera mayor que la tasa de ejercicio, i.e. rsw,fwd > rk . En dicho
81
caso, el precio del receiver swaption descontado a Tk estarı́a dado por:
RSW PTk = θmax(rk − rsw,fwd, 0)
n
X
B(Tk , Tk + θi)
i=1
donde n = (Tm −Tk )/θ y B(Tk , Tj ) serı́a el precio en Tk de un bono sin cupones
con vencimiento en Tj . La suma del precio de dichos bonos, una anualidad,
será utilizada como numeraria y cuya medida de probabilidad rsw,fwd > rk es
martingala, de modo que:
RSW P0 = θE[max(rk − rsw,fwd , 0)]B(0, Tk + θi)
Figura 2.2. Cotización de swaptions sobre la Libor del USD (Fuente: Bloomberg, L.P.)
Al transformar este resultado en una expresión tipo Black-Scholes-Merton
obtenemos un resultado conocido tal como:
RSW P0 = θ[rk Φ(−d2 ) − rsw,fwdΦ(−d1 )]B(0, Tk + θi),
donde
d1 =
2
ln(rsw,fwd /rk ) + 0.5Tk σsw
σsw (T − k)1/2
y
d2 = d1 − σsw (T − k)1/2
con σsw como la volatilidad de la tasa swap adelantada.
82
En virtud de que los swaptions americanos no son tan comunes como los
europeos, no profundizaremos en su valuación, sino en la de opciones americanas. Wilmott (2001) y Hull (2006) establecen que los árboles binomiales
son muy comunes en la valuación de opciones americanas. Un árbol binomial
representa un diagrama de diferentes trayectorias recombinantes que pudieran
seguir los precios del bien subyacente durante la vida de la opción, partiendo
del supuesto de que el subyacente en cada perı́odo de tiempo se mueve hacia
arriba o hacia abajo en una magnitud determinada con sendas probabilidades
de ocurrencia como se muestra en la figura 2.3. Una vez trazado el árbol la
forma de trabajar es partiendo del final del árbol hasta el principio, probando
cada uno de los nodos para ver donde es óptimo ejercer antes del vencimiento.
En general es un modelo muy recurrido para el cálculo de este tipo de opciones,
el cual comienza a complicarse si la función de pago de la opción depende de
la trayectoria que sigue el subyacente y no sólo del valor final en cada uno de
los pasos, además de complicarse con problemas de más de dos dimensiones.
Las simulaciones Monte Carlo, en cambio, se adaptan fácilmente al problema
de alta dimensión, como lo establecen Broadie and Glasserman (1997).
Figura 2.3. Árbol binomial de tres pasos.
En las simulaciones Monte Carlo pueden incorporarse dependencias de
trayectoria, esto dado que, como se muestra en la figura 2.4, se generan diferentes trayectorias aleatorias independientes con algún proceso estocástico definido para el subyacente, se calcula la función de pagos para cada trayectoria
y posteriormente se pueden combinar linealmente y promediar para estimar el
valor esperado de la función de pagos del derivado.
A pesar de que en Wilmott (2001) y Hull (2006) se considera como difı́cil
manejar la posibilidad de ejercicio anticipado de las opciones americanas a
83
través de la simulación Monte Carlo, existen diversas referencias tales como
Brodie y Glasserman (1997), Dupire (1998), Fundia (2002) y Rivera (2005) en
las que se proporcionan indicios y ejemplos de cómo emplear el método Monte
Carlo para la valuación de opciones americanas.
Figura 2.4. Trayectorias de precio simuladas por Monte Carlo.
3. Modelo Libor, vectores frontera para valuar opciones americanas
En la presente sección se presentará la forma de utilizar el método Monte Carlo
para manejar la dependencia de trayectoria requerida por el modelo Libor de
mercado a las vez que los vectores frontera permiten incorporar el ejercicio anticipado, tı́pico de opciones americanas. Recuérdese ante todo que los modelos de
tasas de interés pretenden describir la evolución de las tasas de interés a través
del tiempo; algunos describen una estructura temporal de tasas basados en el
comportamiento de la tasa de corto plazo, mientras que otros se basan en procesos que siguen tasas adelantadas instantáneas, las cuales no son observables
en el mercado. Hull (2006) aborda estos modelos con profundidad intermedia
mientras que la revisión detallada de dichos modelos se puede encontrar en
Brigo and Mercurio (2001).
Diversos autores como Brace, Gatarek y Musiela (1997), Jamshidian (1997)
ası́ como Miltersen, Sandmann y Sondermann (1997) han abordado la no observabilidad de la tasa forward instantánea mediante lo que en forma unificada se
conoce como LMM, por sus siglas en inglés Libor Market Model, el cual puede
expresarse en términos de las tasas “forward ”que se observan en los mercados
actuales. Resulta conveniente usar este modelo sobre las tasas aplicables a los
derivados de tasas de interés en los perı́odos lı́quidos, que son de por lo menos
un mes y comúnmente de tres y seis meses resultando su uso menos complicado
que las tasas instantáneas no observables.
Como lo describen Hull (2006) y Jamshidian (1997) este modelo se puede
utilizar en la valuación de productos comunes del mercado de derivados de
84
tasas de interés, como caps y floors, bajo el supuesto de que las tasas forward
siguen una distribución lognormal. Comúnmente la implementación requiere
de la simulación Monte Carlo. Existen diferentes modelos para el cálculo de
primas de opciones americanas utilizando simulación Monte Carlo; en general
se caracterizan por utilizar métodos numéricos y en algunos casos métodos
iterativos; a continuación revisaremos los principales.
Longstaff y Schwartz (2001) proponen una aproximación por mı́nimos cuadrados para la valuación de opciones americanas. Bajo este enfoque es necesario
elegir en cada posible punto de ejercicio entre continuar con la opción o ejercer.
El método consiste en generar un gran número de trayectorias y analizar los
posibles valores del subyacente para cada periodo de ejercicio en cada una de
las trayectorias. Se compara el valor de ejercicio en cada punto con el valor de
no ejercer:
V = a + bS + cS 2
donde S es el precio del subyacente en el i-ésimo perı́odo y V es el valor de
no ejercer calculado al tiempo correspondiente, es decir, el valor de ejercer en
el siguiente periodo descontado al periodo i-ésimo. Para todos los valores se
encuentran a, b y c tal que se determine el mı́nimo de la suma
X
(Vi − a − bSi − cSi2 )
a través de mı́nimos cuadrados. Se realiza de atrás hacia delante hasta obtener
el valor de ejercer inmediatamente. Este modelo podrı́a llegar a complicarse
cuando el precio de la opción se vea afectado por más de un factor, resultando
la aproximación ordinaria por mı́nimos cuadrados impráctica para el cálculo de
la función condicional V ; en tal situación, resulta más eficiente utilizar otras
técnicas como mı́nimos cuadrados ponderados o mı́nimos cuadrados generalizados entre otros. Podrı́a también encontrarse algunas otras implicaciones
numéricas para la significancia estadı́stica de las regresiones de mı́nimos cuadrados al definir la función condicional, como se resume en Longstaff y Schwartz
(2001).
Por su parte Andersen (2000) propone una aproximación en la que se genera
un número considerable de trayectorias Monte Carlo, y en el que la frontera de
ejercicio es parametrizable. Primeramente se define una función de ejercicio
anticipado I(t) que es igual a 1 si el ejercicio anticipado es óptimo en el tiempo
t y 0 en otro caso. I(t) es una función con un vector de parámetros, cuyos
valores óptimos son determinados iterativamente, iniciando por el vencimiento
de la opción hasta el inicio.
Después, se prueban cada uno de los valores del precio S del subyacente,
en cada perı́odo t de las diferentes trayectorias, y en el que el valor esperado
de ejercicio sea mayor/menor dependiendo del tipo de opción, es decir, el valor
que maximice el precio promedio de la opción se definirá como punto frontera.
Se obtiene el punto frontera para cada perı́odo t y ası́ hasta llegar a t = 0 como
se sugiere en Hull(2006) o Broadie y Glasserman (1997). En este modelo la
parametrización de las fronteras es única para cada tipo de operación; y en
ocasiones podrı́a resultar complicada la forma en que debe ser parametrizada
la frontera de ejercicio anticipado.
85
En Fundia (2002), los vectores frontera se calculan iniciando por el vencimiento de la opción hasta el inicio, es decir haciendo el recorrido hacia atrás
en el tiempo. En el tiempo final N , el vector está determinado por el precio
de ejercicio de la opción, y para encontrar sus valores en cualquier tiempo k
es necesario haber obtenido los valores futuros, es decir entre el tiempo k y N .
En cada uno de los perı́odos primeramente debe definirse el techo y el piso de
la frontera y se define a y como el punto medio de dichos puntos; entonces,
la pregunta que debe responderse es si la función de pago es mayor o igual al
valor estimado de continuar con la opción; con base en la respuesta, y será el
nuevo piso o techo del perı́odo k. Para responder a esas preguntas, se define
primero la función de valor de la opción si el tenedor decide no ejercer. Se
simulan trayectorias desde el tiempo k hasta el tiempo N ; en cada una de ellas
se obtiene un valor observado.
Para las n trayectorias que se calculan, se obtienen valores observados de los
que al obtener la media (estimador) se obtendrá el valor esperado de continuar
en la opción; las posibles respuestas en el punto de decisión son:
a) ejercer si la función de pago es mayor o igual al valor estimado de
continuar,
b) no ejercer si la función de pago es menor al valor estimado de continuar.
El proceso se repite hasta que el valor del piso y del techo coincidan (i.e.
hasta que difieran en un valor no mayor a ). Una ventaja de este modelo es que
es un método iterativo y con alta velocidad de cálculo. De hecho, el algoritmo
descrito anteriormente es el que se implementó en el presente trabajo, siendo la
base para el desarrollo en VBA. En la siguiente sección se describirá con mayor
detalle la implementación.
4. Implementación
En esta sección, se revisrá una descripción general del algoritmo a seguir para
el cálculo de la frontera de ejercicio, que combinado con el modelo Libor de
tasas, conformará un método alternativo a los ya existentes; posteriormente
se explicará a detalle tomando como ejemplo un swaption semestral con plazo
de 10 años. La idea fundamental que se propone consiste adaptar el modelo
“Fast Monte Carlo American Option Pricing”de Fundia (2002), para obtener
una aproximación de la frontera de ejercicio de tasas swaps que permita calcular
el valor de un swaption Bermuda. La implementación incluye la combinación de
dicho método de aproximación para opciones americanas con el modelo Libor
de mercado.
Es importante señalar que el ejemplo implementado con fines experimentales para el cálculo de la frontera, tiene como supuestos:
a) que se considera la curva de tasas libres de riesgo como plana en todos
los plazos para este ejemplo en particular
b) que la Curva de volatilidad se considera plana para todos los plazos para
este ejemplo en particular
c) que es un modelo de una sola dimensión.
Sin embargo destacamos que la gran ventaja de implementar esta metodologı́a es que puede aplicarse de manera general para swaps de cualquier plazo tal
y como se observan en el mercado, además de que puede generalizarse fácilmente
86
a estructuras temporales de tasas observadas y volatilidades incluso si éstas no
son deterministas.
Como se mencionó, el algoritmo se centra en calcular los vectores frontera
iniciando por el vencimiento de la opción (i.e. al tiempo N ) hasta el inicio. Al
tiempo N el valor de la frontera está determinado por el precio de ejercicio de
la opción, y para encontrar este valor en cualquier tiempo k es necesario haber
obtenido los valores futuros, es decir entre k y N .
En cada uno de los perı́odos primeramente debe definirse el techo y el
piso de la frontera, los cuales pueden ser 0 y un número B, con una realización
única u que pertenezca al intervalo (0, B) y tal que (x, u∗) sea un vector frontera.
Entonces, se define a y como el punto medio del piso y techo dados por (0, B)
y la pregunta que debe responderse es si y ≥ u∗ ; dependiendo de la respuesta y
será el nuevo piso o techo de u∗ ; el proceso se repetirá hasta que la diferencia
entre el piso y el techo no sea mayor al nivel de precisión dado por .
Para abordar el proceso, se define primero a gk como el valor de la opción
si el tenedor decide no ejercer. Se simulan trayectorias comenzando en Sk , es
decir, se obtienen los valores (Sk , Sk+1 , ..., SN ) con cada una de ellas se obtiene
un valor observado Gk que se define como:
Gk = Dk,t h(St )
donde
t = min(k + 1, ..., N )
si St ≥ V para cualquier V que pertenezca a la frontera de ejercicio, o t = N
si St < V , h() representa el valor de ejercer en este instante, y Dk,t es el factor
de descuento.
De hecho para las n trayectorias
que se calculan, se obtienen valores de
P
Gk ; si se hace que gk = (1/n) Gk , es decir el estimador del valor esperado de
continuar, las posibles respuestas a las preguntas antes mencionadas serı́as las
siguientes:
a) y ≥ u∗ si h(x) ≥ gk , es decir, ejercer si la función de pago es mayor o
igual al valor estimado de continuar,
b) y < u∗ si h(x) < gk , es decir, no ejercer si la función de pago es menor
al valor estimado de continuar.
Este procedimiento itera hasta que el valor del piso y del techo coincidan es
decir, difieran en un valor no mayor a . El número de trayectorias y el tiempo
de simulación dependerán del subyacente sobre el que se esté calculando y del
proceso estocástico que se defina para este.
A continuación se desarrolla un ejemplo en el que se supone que el producto
a valuar es un swaption tipo bermuda sobre un swap con periodicidad semestral,
en el que se adquiere el derecho de pagar la tasa fija (“payer”) y con posibilidad
de ejercer en cualquier perı́odo de vencimiento de cupón.
Antes de iniciar con el algoritmo para construir la frontera de tasas se
presentan las caracterı́sticas del instrumento en la tabla siguiente y se describirá
el proceso a utilizar con el modelo Libor de mercado, para las simulaciones de
trayectoria de tasas.
87
Como ya se mencionó anteriormente el modelo Libor de Mercado puede
ser implementado usando simulación Monte Carlo y expresado en términos de
volatilidad.
El modelo libor que se utilizará es el proceso definido para tasas forwards,
de las cuales pretende obtenerse las tasas swaps; entonces la expresión a utilizar
que define el proceso estocástico de las tasas forward, es como sigue:
δF (t, j)σ 2
σ2
1/2
−
F (t, j + 1) = F (t, j)exp
δ + σZδ
1 + δF (t, j)
2
donde
a)F (t, j + 1) es la tasa forward para el siguiente perı́odo,
b)F (t, j) es la tasa forward para el perı́odo actual,
c)δ es la periodicidad de la tasa,
d)σ es la volatilidad de la tasa forward,
e)y Z es una variable aleatoria con distribución normal estándar.
Por medio de la simulación, esta expresión permitirá obtener trayectorias
de las tasas forwards de las que derivarán las tasas swaps que formarán parte
de la frontera de ejercicio. De acuerdo a la descripción general anterior, se tiene
que el algoritmo inicia el cálculo en el vencimiento del subyacente, es decir al
tiempo N , en este caso 10 años.
Como se ha definido una frecuencia semestral, dicho plazo equivale a 20
perı́odos. En virtud de que el punto frontera en el perı́odo 20 está dado por el
precio de ejercicio que es igual a la tasa forward a esa fecha, el primer punto de
análisis es al tiempo N − 1, es decir el perı́odo 19 en este ejemplo.
El análisis inicia con definir un piso (0) y un techo (B) iniciales, los cuales
se irán cerrando a través de un proceso iterativo, hasta hacer convergencia con
la tasa forward frontera que se busca. En este ejercicio se definió como techo
inicial B = 2K, es decir B = 19%, de modo que el intervalo inicial está dado
por los valores (0,19%).
Siguiendo con la descripción del modelo hecha anteriormente, se encuentra
el punto medio del intervalo (0, B), es decir y = 9.5%, y a partir de este valor se
harán simulaciones que permitirán obtener el valor esperado de la tasa forward
como se muestra en la gráfica 4.1.
Usando el proceso de tasas forward definido con anterioridad, se tiene que:
(0.5)(0.095)((0.1215)2 (0.1215)2
−
0.5+0.1215Z(0.5)0.5
F (20i) = 0.095exp
1 + (0.5)(0.095)
2
88
donde el valor Z es un número aleatorio con distribución normal estándar
N (0, 1). Para obtener el valor esperado de F es preciso realizar un número
importante de simulaciones; tı́picamente en la industria se harı́an de 10,000
a 100,000 simulaciones dependiendo de la velocidad de los compiladores disponibles como se establece en Dupire (1998).
Gráfica 4.1. Simulaciones para el tiempo (N - 1)
Para cada valor de F (20, i) debe determinarse el valor Gk dado por:
Gk = (F (20, i) − K)F D,
donde F D es el factor de descuento dado por la tasa libre de riesgo entre
el periodo n
Py n − 1. Con base en el número de simulaciones n, se calcula
gk = (1/n) Gk y se obtiene el valor esperado de permanecer en la opción si
ası́ conviene el tenedor.
A partir de la comparación del valor gk con el valor y, en caso de que
el valor de permanecer en la opción sea mayor que ejercer; entonces y será
el nuevo piso para la siguiente iteración, es decir el procedimiento de cálculo
descrito anteriormente se realiza ahora con el intervalo (y, B) ó (9.5%,19%) en
este caso.
Este proceso se repite hasta que la diferencia entre el piso y el techo sea
inferior a , que representa el error con el que finalmente está calculado el valor
frontera. Una vez que se calculó el valor en el perı́odo N − 1, es decir el perı́odo
19 en este ejemplo, se debe continuar con el perı́odo inmediatamente anterior
N − 2 que en este caso serı́a el perı́odo 18.
En este punto se parte nuevamente del piso y techo iniciales definidos
anteriormente (0, B), se obtiene el valor medio y , y se harán simulaciones,
esta vez desde el perı́odo N − 2 hasta N ; en general, las trayectorias inician
en el perı́odo N − i y terminarán en el punto en que se encuentren por arriba
89
del punto frontera anteriormente calculado o en el perı́odo N . La gráfica 4.2
muestra como se generan las trayectorias desde cualquier punto N −i con i > 1.
Gráfica 4.2 Simulaciones para el tiempo N - i.
Con los valores Gk generados por medio de las simulaciones, se encuentra
el valor esperado gk ; se compara con el punto medio y, y ası́ se procede de
forma sucesiva hasta llegar al perı́odo N = 1. Una vez obtenida la tasa forward
frontera para cada uno de los puntos; se puede obtener la tasa swap de cada
uno de ellos; esto a través de la relación entre estas tasas y que se describe a
continuación:
Qn−1
j=i (1 + δF (ti )) − 1
Si = Pn−1 Qn−1
j=i
k=j−1 (1 + δF (tk ))
donde
a) Si es la tasa swap para el siguiente perı́odo,
b)F (tk ) es la tasa forward para el perı́odo actual, y
c)δ es la periodicidad de la tasa.
Finalmente el precio de la opción en el perı́odo actual corresponde al valor
de permanecer en la opción ya que el tenedor no ejercerı́a de forma instantánea,
es decir el valor de gk en t = 0.
5. Análisis de resultados y conclusiones
Para el ejemplo anterior, por medio de simulación se obtendrı́an sendas
fronteras, de tasas forward y de tasas swap, como las que se muestran en las
gráficas 5.1 y 5.2. La interpretación de esta frontera de ejercicio indica que si
la tasa observada se encuentra por arriba de dicha frontera, en el caso de un
payer swaption, al tenedor le convendrı́a ejercer la opción de forma anticipada.
90
Para obtener el precio de la opción en el tiempo cero, sólo es necesario calcular
el valor de permanecer en la opción como se realizarı́a en cualquier tiempo t.
Gráfica 5.1 Frontera de tasas forward.
Gráfica 5.2 Frontera de tasas swap.
En el ejemplo el precio de la opción resulta 1.75%; este valor parece ser
razonable, pero para saber realmente la efectividad del algoritmo, a continuación se presenta un cuadro comparativo del precio de algunos swaptions
91
tipo bermuda que se cotizan en el mercado y cuyo proceso de cálculo puede
tener un grado mayor de sofisticación, aunque no necesariamente de rapidez.
Como se muestra en el cuadro anterior, los resultados obtenidos por la
metodologı́a sugerida en este trabajo, son comparables con los niveles de compra
y de venta que se cotizan en el mercado mexicano.
El objetivo del presente trabajo, fue proponer una alternativa eficiente
de cálculo para valuar los swaptions de tipo Bermuda, con base en un modelo
iterativo para el cálculo de opciones americanas y aplicado al Modelo Libor o de
mercado se logró obtener una rápida aproximación del valor de dicho producto.
El modelo iterativo, fundado en simulaciones Monte Carlo, permite calcular
el valor de permanecer en la opción o de ejercerla en cada un de los perı́odos
definidos.
El número de simulaciones que después de diferentes corridas se sugiere
manejar, es de al menos 10,000; un número menor de simulaciones puede causar
desviaciones grandes en el resultado. Por otro lado en cada uno de los puntos,
el número de iteraciones sugeridas es 15, es decir el subproceso de definir un
nuevo piso o techo para definir el valor frontera, se repite 15 veces. Esto implica
que el grado de error, es decir la diferencia entre el piso y el techo es menor a
0.00001. El proceso estocástico utilizado en las simulaciones es el modelo Libor
estándar para tasas forward. El algoritmo aquı́ definido encuentra una frontera
de tasas forward y a partir de estas es posible encontrar la frontera de tasas
swap.
Este modelo tiene la ventaja sobre algunos ya existentes, de que es fácil
de implementar y se puede obtener un resultado rápido y muy aproximado del
valor de un swaption bermuda; entre las desventajas, en esta versión, es que
se trabaja en una sola dimensión y el modelo Libor de un factor lognormal.
En la comparación de precios realizada al final de la sección anterior, puede
observarse que los precios calculados por el modelo de vectores son cercanos a
las cotizaciones de compra y venta encontradas en el mercado mexicano; pero
si se supone que el precio teórico real, se aproxima al precio promedio entre las
posturas de compra y de venta, se puede observar que los precios calculados
están subvaluados, esto se atribuye a los supuestos considerados de volatilidad,
curva de tasas de interés y de modelo. Con base en estas dos consideraciones,
en investigaciones futuras se puede ampliar la precisión del enfoque a través
de un modelo multifactorial, ası́ como incorporando dinámicas estocásticas más
ricas para la volatilidad. Asimismo, trabajos posteriores podrı́an realizarse
desarrollos para el cálculo de sensibilidades y compararlas con otros modelos.
Sin embargo cabrı́a mencionar que estudios empı́ricos como el de Driessen,
Klaassen y Melenberg (2003) han demostrado que no es necesario utilizar un
92
modelo de muchos factores para capturar la volatilidad total de los mercados;
tres factores son suficientes para explicar en promedio el 97.8% de las variaciones y un sólo factor explica en promedio más del 80% por lo que la eficiencia
obtenida con este enfoque de poder calcular un precio en menos de 10 segundos con un compilador de bajo nivel como VisualFortranMR hacen atractivo el
resultado.
6. Referencias
Wilmott, Paul (2001) Wilmott introduces Quantitative Finance. John Wiley
& Sons Ltd. England.
Hull, John C. (2006) Options, Futures and Other Derivatives. Prentice Hall.
Sixth Edition. New Jersey.
Jamshidian, Farshid (1997) Libor and swap market models and measures. Finance & Stochastics. 1,293-330.
Andersen, Leif & Andreasen, Jesper (2000) Volatility skews and extensions of
the Libor Market Model. Applied Matemathical Finance. 7,1-32.
Broadie, Mark & Glasserman, Paul (1997) Pricing American-style securities
using simulation. Journal of Economic Dynamics & Control. 21, 13231352.
Fundia, Andrés (2002) A Fast Monte Carlo Algorithm for Pricing American
Options. REMEF, Revista Mexicana de Economı́a y Finanzas. 1(3). 243253.
Andersen, Leif (2000) A simple approach to the pricing of Bermudan swaptions
in the multifactor Libor market model. General Re Financial Products.
New York.
Brigo, Damiano & Mercurio, Fabio (2001) Interest Rate Models. Springer
Finance. First Edition. Italy.
Litterman and Scheinkman (1991) Common Factors Affecting Bond Returns.
Journal of Fixed Income. 1:54-61.
Longstaff, Francis A. & SCHWARTZ, Eduardo S. (2001) Valuing American
Options by Simulation: A Simple Least-Squares Approach. The Review of
Financial Studies. 14(1). pp 113-147.
Driessen, Joost, Klaassen, Pieter & Melenberg, Bertrand (2003) The Performance of Multi-Factor Term Structure for pricing and Hedging Caps
and Swaptions. Journal of Financial and Quantitative Analysis. 38, 3;
ABI/INFORM Global pg. 635 Di Vito, Rivera, Fundia 17.
Rivera, Igor P. (2005) Aproximación numérica al precio de las opciones americanas: una evaluación al año de su aparición en MexDer. REMEF, Revista
Mexicana de Economı́a y Finanzas. 4(3). 212-222.
Fornari, Fabio (2004) Macroeconomic announcements and implied volatilities
in swaption markets. BIS Quarterly review. September, 79-86.
INSTRUCCIONES PARA LOS AUTORES
1) La Revista
de Administración, Finanzas y
Economía
(Journal
of
Management, Finance and Economics) recibe trabajos de investigación en cualquiera
de las áreas o especialidades de administración, economía, contabilidad y finanzas; en
la dirección electrónica:
< [email protected]>
2) Los trabajos que se sometan a arbitraje y dictaminación deberán ser inéditos y no
podrán ser enviados simultáneamente para su publicación en otro medio.
3) Los trabajos pueden ser escritos en español o inglés.
4) El documento puede ser escrito en cualquier editor de texto (Word, PcTex,
MigTex, LaTex) con letra tipo Times New Roman, tamaño 12 a doble espacio.
El justificado no se deberá realizar en los primeros párrafos de cada sección o
después de una tabla o fórmula.
5) Los títulos y subtítulos de secciones se escribirán de tamaño 14 y en negritas,
comenzando siempre con una capitular. Se numerarán empleando la numeración
arábiga. La numeración para los subtítulos será una numeración anidada: 2.1., 2.2.,
2.3., etc.
6) La primera página del
documento deberá contener a) título del trabajo;
b) nombre del autor o autores, sin incluir el grado académico; c) institución de
filiación; d) resumen de no más de 100 palabras en inglés y en español; palabras
claves en Inglés y Español; f) clasificación JEL, disponible en el sitio electrónico:
http://www.aeaweb.org/journal/jel_class_system.html#G y g) al pie de página deberán
incluirse domicilio, teléfono y correo electrónico del autor o de los autores para recibir
correspondencia.
7) Sólo podrá existir un pie de página adicional en la primera hoja. En dicho pie
podrán los autores expresar sus agradecimientos o incluir alguna información
adicional que consideren relevante.
8) Las ecuaciones deben estar numeradas consecutivamente, al igual que los
cuadros, las figuras y las gráficas.
9) Los cuadros, gráficas y figuras deben poseer un título o encabezado que las distinga.
Cada cuadro, gráfica o figura deberá incluir alguna referencia, el origen de la fuente de
información y siempre deberá presentarse en blanco y negro.
10) La relación bibliográfica deberá presentarse al final del documento, en orden
alfabético de autores y éstas deben ser como:
Casar, J. I., G. Rodríguez y J. Ros (1985). Ahorro y balanza de pagos: un
análisis de las restricciones al crecimiento económico de México. Economía
Mexicana, núm. 7, pp. 21-33.
Cox, J. C, J. E. Ingersoll, and S. A. Ross (1985). An Intertemporal General
Equilibrium Model of Asset Prices. Econometrica, 53(2), pp. 363-384.
Fuller, W A. (1996). Introduction to Statistical Time Series. 2nd ed., John
Wiley, New York.
Granger, C. W. (1980). Long Memory Relationships and the Aggregation of
Dynamics Models. Journal of Econometrics, 14(1), pp. 227-238.
The
Trouble
with
Rational Expectations and the Problem of Inflation
Stabilization, en R. Fredman y E. S. Phelps (comps.).
INSTRUCTIONS TO AUTHORS
1) Revista
de
Administración,
Finanzas
y
Economía
(Journal of
Management, Finance and Economics) is a peer reviewed scientific journal and
receives manuscripts with subject matter in Management, Economics, Accounting and
Finance. Articles should be sent to:
< raf.ccm@servicios. itesm.mx>
2) Manuscripts will be considered for possible publication provided they are unpublished
and not submitted elsewhere.
3) The articles could be written in English or Spanish.
4) The manuscripts could be written in Microsoft Word, PcTex, MigTex, or LaTex format,
the font must be Times New Roman, size 12 and pages must be double spaced. Do not
use indentation in the first paragraph of each section or after a table or equation.
5) Titles and subtitles of sections should be written in size 14 and bold faces. It should use
the arabic numerals. Numerals for the subtitles should be consecutive: 2.1., 2.2., 2.3.,
etc.
6) The Cover page should include: a) titles of the paper; b) full name of the author(s), no
specification of academic grade; c) institutional affiliation(s) ; d) a summary of your
…paper in English and Spanish of at most 100 words; e) keywords in English and
…Spanish;_f)_JEL_classification,_which_can_be_found_in:_http://www.aeaweb.org/journ
…al/j_el_class_system.html#G and g) footnote should has: address, telephone and
…electronic mail of the author(s).
7) Only one footnote at the first page is allowed. In the footnote, the author(s) could
include some relevant information.
8) The equations should be in consecutive arabic numerals, and the same applies for the
tables, figures and graphics.
9) Tables, figures and graphics should have a title. Each table, figure, graphic should
include any reference or source.
10) Bibliographical references will be at the end of text with the author(s) in
….alphabetical order, according to the following examples:
Casar, J. I., G. Rodríguez y J. Ros (1985). Ahorro y balanza de pagos: un
análisis de las restricciones al crecimiento económico de México. Economía
Mexicana, núm. 7, pp. 21-33.
Cox, J. C, J. E. Ingersoll, and S. A. Ross (1985). An Intertemporal General
Equilibrium Model of Asset Prices. Econometrica, 53(2), pp. 363-384.
Fuller, W A. (1996). Introduction to Statistical Time Series. 2nd ed., John
Wiley, New York.
Granger, C. W. (1980). Long Memory Relationships and the Aggregation of
Dynamics Models. Journal of Econometrics, 14(1), pp. 227-238.
The
Trouble
with
Rational Expectations and the Problem of Inflation
Stabilization, en R. Fredman y E. S. Phelps (comps.).
EGADE BUSINESS SCHOOL
Revista de Administración, Finanzas y Economía (Journal of Management,
Finance and Economics) es una revista de investigación científica con arbitraje,
sus artículos son responsabilidad de los autores, son ajenos a ella las instituciones que representan, la revista o el Tecnológico de Monterrey.
Índice en el que aparece la revista: IDEAS-RePEc.
Revista de Administración, Finanzas y Economía
EGADE Business School
Calle del Puente 222, Col. Ejidos de Huipulco, Tlalpan. C.P. 14380, México D.F.
Aulas III, cuarto piso. Tel.+52(55) 54832020 ext. 1390 y 1392
Correo electrónico: [email protected]
Página: http://www.csf.itesm.mx/egade/publicaciones

administración, finanzas y economía

Transcripción

Documentos relacionados