administración, finanzas y economía

Transcripción

administración, finanzas y economía
REVISTA DE
Volumen 5
Número 1
Enero-Junio
2011
ADMINISTRACIÓN, FINANZAS
Y ECONOMÍA
(Journal of Management, Finance and Economics)
Artículos
Comité Editorial
Director
José Antonio Núñez Mora
Directores Adjuntos
Carlos Manuel Urzúa Macías
Jorge Fernández Ruiz
Edgar Ortiz Calisto
Cristian Alonso y Eduardo Fracchia
El Emprendedor Shumpeteriano
Aportes a la Teoría Económica Moderna
Linda Margarita Medina Herrera y José Benito Díaz Hernández
Caracterización y modelado de redes: el caso de la Bolsa
Mexicana de Valores
José Carlos Ramírez Sánchez
Humberto Valencia Herrera
Consejo Editorial
Value at risk and return from the use Bayesian methods for stress testing
Alberto Hernández Baqueiro
in a world asset allocation and the 2008-2009 crises
Elvio Accinelli Gamba
José Luis de la Cruz Gallegos
Arturo Cortés Aguilar
Anabella Dávila Martínez
Estimación del residual de un bono respaldado por hipotecas mediante un modelo
Julián Pérez García
de riesgo crédito: una comparación de resultados de la teoría de cópulas y el modelo
Frank Dellman
IRB de Basilea II en datos del mercado hipotecario mexicano
Raúl Moncarz
Isabel Martínez Torres Enciso
Enrique Cásares Gil
Beatriz Mota Aragón
Capital Investments and the real options: new proposes
Carolyn Erdener
Igor P. Rivera, Enzo D’Antonio di Vito D. y Andrés Fundia
Editora de Producción
Valuación de Swaptions Bermuda basada en el modelo LIBOR
Martha F. Carrillo Urbina
adaptado a vectores frontera
EGADE BUSINESS SCHOOL
Directorio
Salvador Alva Gómez
David Noel Ramírez Padilla
María de Lourdes Dieck Assad
Rector del Sistema Tecnológico de Monterrey
Rector del Tecnológico de Monterrey
Rectora de las Escuelas Nacionales de Posgrado:
EGADE Business School & EGAP Gobierno y
Política Pública
Revista de Administración, Finanzas y Economía
(Journal of Management, Finance and Economics)
Comité Editorial
Director
José Antonio Núñez Mora
EGADE Business School del Tecnológico de Monterrey
Directores Adjuntos
Jorge Fernández Ruiz
Edgar Ruiz Calisto
José Carlos Ramírez Sánchez
Carlos Manuel Urzúa Macías
El Colegio de México
Universidad Nacional Autónoma de México
Universidad Anáhuac
EGAP Gobierno y Política Pública del Tecnológico de
Monterrey
Consejo Editorial
Alberto Hernández Baqueiro
Elvio Accinelli Gamba
José Luis de la Cruz Gallegos
Anabella Dávila Martínez
Julián Pérez García
Frank Dellman
Raúl Moncarz
Isabel Martínez Torres Enciso
Enrique Cásares Gil
Carolyn Erdener
Tecnológico de Monterrey
Facultad de Economía de la UASLP
Tecnológico de Monterrey
EGADE Business School del Tecnológico de Monterrey
Universidad Autónoma de Madrid, España
Universidad de Münster, Alemania
Universidad Internacional de Florida, USA
Universidad Autónoma de Madrid, España
Universidad Autónoma Metropolitana
Kazakhstan Institute of Management Economics
Research, KIMEP
Editora de Producción
Martha F. Carrillo Urbina
EGADE Business School del Tecnológico de Monterrey
Revista de Administración, Finanzas y Economía (Journal of Management, Finance and Economics)
Volumen 5, Número 1, enero-junio 2011, publicación semestral
EGADE Business School
Calle del Puente 222, Col. Ejidos de Huipulco, Tlalpan. C.P. 14380, México D.F.
Aulas III, cuarto piso. Tel. +52 (55) 54832020 ext. 1390 y 1392
Correo electrónico: [email protected]
Página: http://www.csf.itesm.mx/egade/publicaciones
El presente ejemplar se encuentra protegido por la Ley Federal del Derecho de Autor. ISSN en trámite. Se prohíbe la reproducción
total o parcial del contenido en este número sin la previa autorización que por escrito emita el editor.
Artı́culos
Página
Cristian Alonso y Eduardo Fracchia
El emprendedor Shumpeteriano Aportes a la Teorı́a
Económica Moderna .................................................................................1
Linda Margarita Medina Herrera y José Benito Dı́az Hernández
Caracterización y modelado de redes: el caso de la Bolsa
Mexicana de Valores .................................................................................23
Humberto Valencia Herrera
Value at risk and return from the use of Bayesian methods for stress
testing in a world asset allocation and the 2008-2009 crises ....................33
Arturo Cortés Aguilar
Estimación del residual de un bono respaldado por hipotecas mediante
un modelo de riesgo crédito: una comparación de resultados
de la teorı́a de cópulas y el modelo IRB de Basilea II en
datos del mercado hipotecario mexicano ...................................................50
Beatriz Mota Aragón
Capital Investments and real options:
news proposes.............................................................................................65
Igor P. Rivera, Enzo D’Antonio di Vito D y Andrés Fundia
Valuación de Swaptions Bermuda basada en el modelo LIBOR
adaptado a vectores frontera........................................................................77
Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and
Economics), vol. 5, núm. 1 (2011), pp. 1-22.
El Emprendedor Schumpeteriano
Aportes a la Teorı́a Económica Moderna
Cristian Alonso ∗
Eduardo Fracchia∗∗
Recibido 13 de septiembre de 2010. Aceptado 16 de diciembre de 2010
Resumen
A un siglo de la primera edición de la Teorı́a del Desenvolvimiento Económico,
las ideas de Schumpeter conservan una vigencia notable que sorprenderı́a al
propio autor. En este artı́culo se propone releer en particular el segundo capı́tulo
de su obra a la luz del contexto actual y analizar en qué modo sus enseñanzas
siguen siendo válidas y cuán consistente fue a lo largo de su vida académica.
Se ensaya también un rápido análisis de su influencia sobre las corrientes de
pensamiento actuales y las teorı́as modernas de innovación y entrepreneurship.
Abstract
One century after the first edition of the Theory of the Economic Development,
Schumpeter’s ideas remain so current that Schumpeter himself would be surprised. In this paper we propose to perform a new reading especially over the
second chapter of the Theory in order to check the validity of his teachings and
his consistency over time. A quick review of Shumpeter’s influence over current
economic research and over modern theory of innovation and entrepreneurship
is also included.
Clasificación JEL : B20, O30
Palabras clave: Schumpeter, Emprendedor, Innovación
Introducción
Schumpeter es un autor imposible de encasillar. Admira a Walras fervientemente pero comparte con los austrı́acos el rechazo al estado estacionario. Cree
inevitable el avance de las economı́as hacia el socialismo pero no por el fracaso
del capitalismo como señalara Marx, sino por su éxito. Schumpeter no forma
parte de ninguna de las grandes escuelas teóricas y, sin embargo (o quizás por
eso mismo), es que puede percibirse su influencia en economistas sumamente
disı́miles. Este trabajo no es una sı́ntesis de la obra schumpeteriana ni una
exposición detallada de cómo ha influido en la teorı́a económica. El objetivo
de este trabajo es simplemente releer a Schumpeter hoy y apreciar qué tan
∗
∗∗
IAE Universidad Austral. E-mail: [email protected]
IAE Universidad Austral. Casilla de correo No.49. Mariano Acosta s/n y Ruta Nacional
8 (B1629WWA) Pilar. Buenos Aires. Argentina. E-mail: [email protected]
2
Revista de Administración, Finanzas y Economı́a
vigentes son sus ideas. Una propuesta que puede sonar atractiva si se considera que pronto se cumplirán cien años de la primera edición de su “Teorı́a del
Desenvolvimiento Económico”. 1
La sección II ofrece una breve introducción biográfica, necesaria dada la
importancia que se le atribuye a ciertos eventos de su vida personal sobre su
trabajo. En la tercera parte se discuten los conceptos que constituyen el núcleo
de su teorı́a; el emprendedor schumpeteriano que, mediante la introducción de
innovaciones, motoriza el proceso de desarrollo no lineal de la sociedad. En
este punto se propone una explicación gráfica de la noción de nuevas combinaciones para mostrar que se trata de un concepto superador al de mero cambio
tecnológico del ideario neoclásico. En la sección IV se discute la tesis de obsolescencia del emprendedor. Y en la sección V se presentan algunas ideas del
pensamiento neo-schumpeteriano. No es la intención de ese apartado presentar
una discusión formal de las distintas ramas, sino simplemente evidenciar que
los conceptos de Schumpeter se encuentran presentes en la actualidad en dos
corrientes de pensamiento opuestas que emplean metodologı́as distintas para
formalizar las mismas nociones. Por último, la sección VI retoma el tema de la
innovación para mostrar la vigencia de las ideas del autor en este tópico.
2. Vida y obra de Joseph Shumpeter
Joseph Alois Schumpeter nació el 8 de febrero de 1883 en el pequeño pueblo
de Triesch, en Moravia (posteriormente parte del Imperio Austrohúngaro y, en
la actualidad, de la República Checa). En el seno de una familia acomodada,
propietaria de una fábrica textil, Schumpeter creció observando la cotidianeidad
del manejo de los negocios. Inició sus estudios de abogacı́a en la Universidad
de Viena, aunque pronto mostró interés por la economı́a. En particular, fue
alumno de Friedrich von Wieser y de Eugen von Boehm-Bawerk, entre otros
eminentes miembros de la escuela austrı́aca, cuya influencia resultará notable
durante toda su carrera. En 1906 obtuvo su doctorado y en 1909 se inició en
la labor docente en la Universidad de Czernowitz como profesor de economı́a y
gobierno.
Con sólo veintiocho años, en 1911 publicó su célebre “Teorı́a del Desenvolvimiento Económico”. En este libro desarrolló el concepto de emprendedor
como un agente irracional que permite, gracias a sus innovaciones en los procesos productivos, el avance de la sociedad. Comulga además con sus colegas
austrı́acos al negar la existencia de un estado estacionario señalando que el
sistema económico justamente avanza gracias a los desequilibrios permanentes
generados de forma endógena. Pero, como gran admirador de Walras que era
(el mayor economista de todos los tiempos, según expresa en su “Historia del
Análisis Económico”), presentó su teorı́a de cambio económico como un complemento a la teorı́a del equilibrio estático walrasiano. Más allá de las correcciones
que fuera desarrollando a lo largo del tiempo, el núcleo de las ideas plasmadas
en esa primera versión de la “Teorı́a del Desenvolvimiento Económico” estarı́a
presente en el resto de su obra.
1
A lo largo de este trabajo se empleará la palabra desenvolvimiento como sinónimo de desarrollo en sintonı́a con la primera traducción al castellano del libro “Theory of the Economic
Development”, aun cuando desarrollo sea el vocablo más usual.
El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna
3
En 1911 comenzó a dar clases en la Universidad de Graz. En 1919 se
desempeñó como ministro de finanzas de Austria durante poco más de medio
año. Y entre 1920 y 1924 presidió un pequeño banco privado, el prestigioso
banco Biedermann. Aunque su labor allı́ era bastante acotada, por lo que
aprovechó ese tiempo para probar suerte como inversor privado amasando una
pequeña fortuna que se evaporó con la crisis de 1924, junto con su trabajo.
Afortunadamente en 1925 recibió un ofrecimiento de la Universidad de Bonn,
con el cual inicia su retorno definitivo a la vida académica. En 1926 aparece
la segunda edición de su “Teorı́a del Desenvolvimiento Económico” en alemán,
una versión reducida y corregida de la anterior sobre la cual se editarı́a la
primera traducción inglesa en 1934. Pero en 1926 sufre la pérdida de su segunda
esposa, de su hijo recién nacido y de su madre y cae en una profunda depresión.
Continúa enseñando en la Universidad de Bonn hasta que, con el ascenso del
nazismo en Europa Central, decide mudarse a Estados Unidos en 1932.
En Estados Unidos fue nombrado profesor en la Universidad de Harvard,
cargo qua mantendrı́a hasta su muerte. En este perı́odo logró la publicación de
otras dos de sus grandes obras; “Ciclos Económicos” en 1939 y “Capitalismo,
Socialismo y Democracia” en 1942, además de infinidad de trabajos menores.
También fue presidente de la Econometric Society entre 1940 y 1941 y de la
American Economic Association en 1948. Luego de su muerte, ocurrida el 8 de
enero de 1950, Elisabeth, su tercera esposa, se ocupó de editar el último gran
trabajo de Schumpeter, “Historia del Análisis Económico”, que fue publicado
en 1954.
3. El emprendedor Schumpeteriano y el fenómeno del desarrollo
La teorı́a del desarrollo económico según la óptica de Schumpeter no se basa
en la especialización y la división del trabajo como indica Adam Smith o en el
cambio tecnológico exógeno como señalan las primeras versiones del modelo de
crecimiento neoclásico. Schumpeter delinea en cambio la figura del emprendedor como agente motor de un proceso de transformaciones contı́nuas en la organización de la producción que configuran un avance no lineal de la sociedad.
De hecho, en Schumpeter y, en particular, en el capı́tulo dos de su Teorı́a, titulado El Fenómeno Fundamental del Desenvolvimiento Económico, los conceptos
de emprendedor y desarrollo económico se encuentran tan ı́ntimamente ligados
que resulta imposible exponer una idea sin simultáneamente expresar la otra.
Schumpeter inicia ese capı́tulo diferenciando dos fenómenos casi antagónicos en
lo que refiere al avance de la sociedad, la adaptación y el desenvolvimiento o
desarrollo. Considera adaptación a todos aquellos cambios que se producen en
el sistema económico en respuesta a alteraciones en el medio externo.
El equilibrio walrasiano de una economı́a puede variar, por ejemplo, por
un incremento de la población; pero este no constituye un cambio cualitativo
del cual la teorı́a deba ocuparse desde que, para determinar sus consecuencias
económicas, basta incluir los nuevos números en el modelo. En contraposición,
el fenómeno de desarrollo es el que encierra toda la riqueza del análisis de la
evolución de los sistemas. En sus propias palabras,
“Por tanto, entendemos por “desenvolvimiento” solamente a los cambios
de la vida económica que no hayan sido impuestos a ella desde el exterior, sino
4
Revista de Administración, Finanzas y Economı́a
que tengan un origen interno”. 2
El desenvolvimiento es entonces un cambio endógenamente gestado, espontáneo y discontinuo y es en la concepción de esta mutación que emerge la figura
del emprendedor. Es importante notar que para Schumpeter no es necesario que
existan más factores productivos para el desarrollo (en efecto, eso constituye
una simple adaptación); lo que importa es que se hagan cosas nuevas con los
factores existentes, que se los combine de formas más eficientes, que se creen
nuevos productos. El emprendedor es el agente que genera esas innovaciones.
Asimismo Schumpeter tampoco pensaba que el ahorro fuera la clave para
entender el avance de las sociedades ya que, en cuanto a mera formación de
capital, no genera cambios cualitativos en la economı́a,
“El aumento lento, pero continuo en el tiempo, de la oferta nacional de
medios productivos y de ahorro, es indudablemente un factor importante en la
explicación del curso de la historia económica a través de los siglos, pero se
oculta completamente por el hecho de que el desenvolvimiento consiste primariamente en el empleo en forma distinta de los recursos existentes, en hacer
cosas nuevas con ellos, sin que importe si aumentan o no dichos recursos. Y esto
es cierto en forma más tangible en el tratamiento de perı́odos más reducidos.
Los distintos métodos de empleo, y no de ahorro, o de aumentos de la cantidad
de trabajo, han cambiado la faz del mundo económico en los últimos cincuenta
años”. 3
Schumpeter se ocupa entonces de delimitar el concepto de emprendedor o
empresario. No todo aquel que tiene a su cargo una empresa es un emprendedor.
Al contrario, sólo una porción muy reducida lo es, mientras el resto constituye
lo que él denomina meros gerentes de empresa. En la distinción no importa si
el individuo es el dueño o es sólo un dependiente de la empresa. Lo que importa
es cómo desarrolle su trabajo. El gerente de empresa actúa rutinariamente; el
emprendedor actúa innovando, ve con facilidad la existencia de nuevas combinaciones de factores y las implementa. En este sentido, el gerente de empresa
es la expresión tı́pica del homo economicus neoclásico, un agente racional que
contrapesa ingresos y costos y determina el curso óptimo de acción para su
negocio. El emprendedor es, en cambio, un individuo irracional como subraya
Schumpeter promediando el final del capı́tulo,
“Pues a no ser que asumamos que los individuos que nos interesan se hallen
impulsados por un deseo insaciable de satisfacción hedonista, el funcionamiento
de la ley de Gossen harı́a cesar todo esfuerzo posterior por parte de los jefes
de negocios. Pero la experiencia nos muestra que los empresarios tı́picos sólo
se retiran de la arena cuando se ha agotado su fortaleza y no se sienten a la
altura de su función. Esto no parece comprobar la representación del hombre
económico, que compara resultados probables con la desutilidad del esfuerzo y
alcanza a su debido tiempo un punto de equilibrio más allá del cual no desea
pasar”. 4
Es irracional porque las motivaciones de su accionar no se limitan a la maximización de beneficios con un fin hedonista como el de incrementar su consumo
2
Schumpeter (1957), pág. 74.
3
Schumpeter (1957), pág. 79.
4
Schumpeter (1957), pág. 101.
El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna
5
factible. El emprendedor schumpeteriano persigue, en palabras del autor, una
posición social poderosa, el placer de sentirse independiente y superior a los
demás, el impulso de lucha y conquista constante y la satisfacción de crear. Y
es irracional también porque las innovaciones que incorpora no surgen de un
proceso de estudio riguroso, sino de su propia intuición.
Su comportamiento transgresor no es gratuito en una sociedad más bien
regida por la inercia. Como lo sintetiza Swedberg (2007), los agentes enfrentan
dos fenómenos de resistencia al cambio originados en el instinto de supervivencia
de las sociedades y los individuos. Uno es de naturaleza sociológica, la sociedad
reacciona negativamente si alguien abandona la forma tradicional, conocida y
segura de obrar. El otro, de naturaleza psicológica, proviene del propio individuo, es la resistencia al cambio interna. Cambiar implica riesgos y los individuos, en general, rehúyen al riesgo. Es más fácil permanecer actuando en la
forma conocida antes que embarcarse en nuevas alternativas, donde no existe
un plan de acción acabado para todas las posibles vicisitudes con probabilidad
de ocurrencia. El emprendedor, al decidir aplicar una innovación supera esas
resistencias exponiéndose a la desaprobación general, a la negación de financiamiento o aceptación de su producto o, incluso a la agresión fı́sica.
El emprendedor en Schumpeter es un lı́der nato. En la edición de 1911
se refiere a él como un “Man of Action”, expresión que curiosamente no está
presente en la reedición de 1926, como lo nota Swedberg (2007). No acepta la
realidad tal como es, sino que busca cambiarla y para ello necesita convencer
a otras personas para que lo sigan. Necesita impresionar al banquero para
que financie sus proyectos. Si está introduciendo un nuevo producto, necesita
crear demanda. Conduce los factores productivos y los combina de formas
no tradicionales. Y lidera también al mercado en su conjunto, en cuanto sus
competidores lo seguirán e imitarán en la implementación de innovaciones.
Por supuesto, el autor reconoce que el emprendedor no está innovando
diariamente y que desarrolla ciertas actividades en forma rutinaria. Muchas
veces el emprendedor debe ocuparse de tareas administrativas o técnicas, del
manejo de personal, la liquidación de impuestos, entre muchas otras. Pero lo
que lo define como emprendedor es su vocación por la realización de nuevas
combinaciones. Es irrelevante por tanto el tamaño de la empresa que maneja,
como ası́ también la clase social a la cual pertenezca. Lo único que importa es
que cumpla esa función especial. Por eso Schumpeter señala,
“() y es en consecuencia tan raro que una persona conserve durante toda
su vida el carácter de empresario, como lo es para un hombre de negocios no
ser empresario, ni aun siquiera un momento y en forma modesta, durante todo
el curso de su vida”. 5
Es decir, es bastante improbable que el directivo de empresa nunca implemente un cambio en la forma de producción, comercialización o competencia,
aunque más no sea uno de reducida importancia. Como también resulta improbable pensar que alguien pueda generar innovaciones en forma continua durante
toda su gestión. Lo más razonable es pensar que, en ciertos perı́odos o en ciertas
áreas, el emprendedor tenderá a apegarse a la rutina.
Pero no es función tı́pica del emprendedor la invención, sino sólo su aplicación. Es ası́ como el empresario protagoniza el fenómeno de desarrollo en
5
Schumpeter (1957), pág. 88.
6
Revista de Administración, Finanzas y Economı́a
Schumpeter mediante la implementación de innovaciones que benefician a algunos sectores y perjudican a otros en un proceso que dio en llamar destrucción
creativa, término que acuñó en “Capitalismo, Socialismo y Democracia”. De
todos modos, vale destacar que este proceso no es lineal o progresivo, como
el propio autor lo advierte. El empresario es el responsable, con su accionar,
tanto de las expansiones como de las depresiones debido a los efectos desequilibrantes que genera la incorporación de nuevos bienes o procesos productivos
en la economı́a.
Schumpeter da una concepción holı́stica a la innovación, y establece la distinción entre tres fases interconectadas que forman el proceso: invención, innovación y difusión. La invención según Schumpeter es aquel producto o proceso
que se genera en la esfera cientı́fico-técnica, es decir, el descubrimiento propiamente dicho. Ahora bien, la socialización o comercialización de la invención es
el paso decisivo para que se convierta en una innovación. La ciencia debe incorporarse a productos, procesos y/o métodos organizativos para poder difundirse
en el tejido social; siendo el empresario innovador quien hace de nexo entre ciencia y mercado. Es el que, en busca de ganancias independientes al crecimiento
de los factores de la producción, está dispuesto a arriesgarse a incorporar una
innovación. Esto le permitirı́a acceder a beneficios (un lugar monopólico en el
mercado, excedente organizacional, u otros) que harán que otros empresarios se
sumen y ası́ se animará la competencia entre empresas. Una vez difundida la innovación, el ciclo vuelve a empezar, el empresario buscará nuevas innovaciones
para aumentar su beneficio y prestigio personal.
Schumpeter define las innovaciones en general como el hallazgo de nuevas
combinaciones, la incorporación al sistema de conocimiento que es cualitativamente nuevo, no incluı́do en la configuración económica anterior. En particular,
establece cinco tipos de innovación:
a) La creación de nuevos productos o nuevas variantes a productos existentes
b) El desarrollo de nuevos métodos de producción o comercialización
c) El ingreso o apertura de nuevos mercados
d) La obtención de nuevas fuentes de materias primas o insumos
e) La modificación de la estructura de mercado (tı́picamente, la creación
de un monopolio)
Para ejemplificar gráficamente estas ideas se propone comparar la teorı́a
de la firma neoclásica con la schumpeteriana en una variante de la alternativa
propuesta por Winter (1967). El análisis que sigue es un modelo deliberadamente simplificado de equilibrio parcial con el sólo efecto de conseguir una
rápida exposición. Considérese un conjunto de firmas en una industria competitiva que producen el bien Y empleando un único insumo, trabajo, L a
través de una función Y = F (L). Asumiendo que la función de producción presenta rendimientos marginales decrecientes, admitirı́a una representación como
la del Gráfico 1. En la concepción neoclásica esta función separa las combinaciones factibles de las que no lo son. Todo punto por debajo de la frontera es
técnicamente posible, aunque sólo aquellos situados en la curva son eficientes.
Mientras que todas las combinaciones por encima de la función de producción
son inalcanzables, serı́a deseable poder obtener más producto empleando una
cierta cantidad de factor pero, en el estado actual de la tecnologı́a, eso no es
posible.
El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna
7
La firma neoclásica en competencia observa la relación de precios insumoproducto vigente en el mercado y determina el nivel de producción dentro del
conjunto de alternativas perfectamente conocidas que maximiza sus beneficios.
En el gráfico que precede, la firma comprarı́a L0 unidades de factor para elaborar Y0 unidades de producto. Si los precios cambiaran la firma sólo tendrı́a
que ajustar las cantidades para conseguir una nueva igualación de los precios
relativos al producto marginal y ası́ seguirı́a maximizando beneficios.
Gráfico 1. Función de producción. Interpretación Neoclásica.
En Schumpeter, sin embargo, más que la diferencia entre planes de producción factibles y no factibles, lo que interesa es distinguir los planes que
son empı́ricamente conocidos de los que no lo son. El Gráfico 2 es útil para
presentar esta idea. Por ejemplo podrı́a pensarse que, aún bajo la misma
función de producción que en el caso neoclásico, no todo el espacio de alternativas alcanzables es conocido por las firmas. Al contrario, las firmas podrı́an
conocer empı́ricamente sólo el área sombreada simplemente porque esos son los
planes que eventualmente han implementado con anterioridad y no tienen un
conocimiento perfecto de la función de producción.
En este caso, si el precio relativo del insumo disminuyera por el simple
incremento poblacional, por ejemplo, el grueso de las firmas maximizarı́a sus
beneficios de acuerdo a su conocimiento histórico de la función de producción
y se situarı́a en el punto (L1 , Y1 ). Este ajuste, un incremento en el nivel de
producto y empleo, constituirı́a lo que Schumpeter denomina una adaptación
de los agentes a nuevas condiciones y no desenvolvimiento.
Pero si alguna de las firmas estuviera dirigida por un emprendedor, un individuo no apegado a la rutina y a lo conocido, podrı́a exhibir un comportamiento
distinto. El individuo podrı́a notar que es posible incrementar la producción
más allá de los niveles reconocidos por el conocimiento histórico y podrı́a animarse a explorar planes productivos por encima de la frontera conocida. Al
hacerlo descubrirı́a que obtiene mayores beneficios si elige producir en el punto
(L2 , Y2 ), generando un mayor nivel de empleo y producto. De este modo el
8
Revista de Administración, Finanzas y Economı́a
emprendedor habrı́a introducido una innovación al identificar nuevas combinaciones de factores para la obtención del bien final. En el corto plazo su firma
se beneficiarı́a por mayores ganancias respecto al resto de sus competidores.
Mientras que en el largo plazo el beneficio se derramarı́a sobre el resto de la
sociedad también ya que, cuando el resto de las empresas note que este agente
encontró una forma más eficiente de producir, tenderı́an a imitarlo. Las que
ası́ no lo hicieran serı́an eliminadas del mercado. En definitiva, el aporte de
este emprendedor al desarrollo de la sociedad vendrı́a dado por el empleo de los
recursos en la forma óptima al descubrir la verdadera frontera de posibilidades.
Gráfico 2. Función de producción. Interpretación Shumpeteriana.
Gráfico 3. Función de producción. Cambio tecnológico.
El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna
9
Otro ejemplo que puede plantearse en este mismo escenario es el del tradicional cambio tecnológico. En este sentido, el emprendedor podrı́a observar la
existencia de herramientas nuevas o, simplemente distintas, que incrementarı́an
la productividad de sus operarios. Al introducirlas a su proceso de elaboración,
su frontera de posibilidades se expandirı́a hasta G(L), lo que le permitirı́a producir mucho más para cada nivel de empleo de insumos.
Si esta ganancia extraordinaria superara los costos de incorporar las herramientas, con el tiempo el resto de las firmas lo imitarı́a; pero mientras tanto
disfrutarı́a de beneficios por encima de los competitivos.
A modo de sı́ntesis, en la teorı́a original del emprendedor schumpeteriano,
este individuo se constituye en el motor de los saltos cualitativos en el orden
económico mediante la introducción de innovaciones en la producción, comercialización o estructura del mercado. Para ello se vale de su intuición más que
del cálculo acabado de costos y beneficios a la hora de detectar posibles nuevas
combinaciones. Del mismo modo que su motivación no se acaba en la persecución hedonista de la maximización del beneficios, sino que encuentra placer
en la actividad creadora y en una posición social poderosa.
4. La tesis de obsolescencia del emprendedor
Hacia el final de su vida algunos autores consideran que Schumpeter perdió
la fe en su emprendedor. En “Capitalismo, Socialismo y Democracia”, predice la
evolución pacı́fica del capitalismo hacia un estadio superior, el socialismo, como
consecuencia de la constante y creciente concentración económica en grandes
firmas que desplazan al emprendedor.
“This social function is already losing importance and is bound to lose it
at an accelerating rate in the future even if the economic process itself of which
entrepreneurship was the prime mover went on unabated. () The romance of
earlier commercial adventure is rapidly wearing away, because so many more
things can be strictly calculated that had of old to be visualized in a flash of
genius. () Thus, economic progress tends to become depersonalized and automatized. Bureau and committee work tends to replace individual action.” 6
Schumpeter señala que esta obsolescencia del emprendedor se explica básicamente por dos fenómenos. Por un lado, la concentración y burocratización
de los procesos de investigación y desarrollo en el seno de las grandes corporaciones. La búsqueda de nuevas combinaciones y los medios para ponerlas en
práctica se convierten en la tarea cotidiana de un grupo de técnicos preparados.
La innovación se torna de este modo una actividad rutinaria. Por otra parte,
tampoco es necesaria ya la voluntad del emprendedor para superar las resistencias, sociológicas y psicológicas, al cambio porque, tras tantas y tan frenéticas
mutaciones económicas (durante la primera mitad del siglo XX, en particular),
sociedades e individuos simplemente se acostumbraron a los cambios.
La predicción de Schumpeter era que las grandes firmas reemplazarı́an a
los emprendedores y a la burguesı́a industrial, en general. Perdida su función
caracterı́stica y con ingresos limitados a un salario por desempeñar una actividad rutinaria, esta clase social tenderı́a a desaparecer. La semilla para el paso
al socialismo quedarı́a ası́ sembrada.
6
Schumpeter (1976), pág. 133
10
Revista de Administración, Finanzas y Economı́a
Un importante debate se ha producido en la literatura en torno a este
cambio en el pensamiento schumpeteriano o, como se le denomina usualmente,
la tesis de obsolescencia del emprendedor. La corriente principal señala que
el cambio en Schumpeter se produjo cuando abandonó Austria y se instaló
en Estados Unidos. Allı́ fue cuando comprendió la naturaleza del capitalismo
tardı́o al observar las grandes empresas norteamericanas en las cuales la figura
de su emprendedor, bastante realista en el escenario austrı́aco de principios de
siglo, no tenı́a cabida.
Trabajos clásicos en esta lı́nea son los de Phillips (1971), Nelson (1977),
Klein (1977) y Freeman (1982). Todos ellos sugieren que se produjo un cambio
sustancial en la comprensión y descripción schumpeteriana de la economı́a a
tal punto que bien podrı́a considerarse que se trata de dos autores totalmente
distintos, un Schumpeter temprano y uno tardı́o. De hecho, Klein expresa esta
hipótesis de un modo bastante sugestivo:
“Schumpeter expressed very different views in his later writings than in his
earlier works, so much so that one has the impression there were two Schumpeters: Schumpeter the revolter against determinism, and Schumpeter the determinist.” 7
Estos autores destacan el cambio producido especialmente en su concepción
de las innovaciones. En el Schumpeter inicial, las invenciones eran un fenómeno
más o menos exógeno, que se convertı́an en innovaciones comerciales cuando un
emprendedor las aplicaba obteniendo ganancias extraordinarias que motivaban
al resto del empresariado a seguirlo. En el tardı́o, sin embargo, el proceso
exógeno de invención es endogeneizado en el interior de titánicas corporaciones
que requieren de la innovación continua, de la destrucción creativa constante,
para mantener su posición competitiva en el mercado. La intuición del emprendedor se vuelve un don irrelevante en instituciones burocráticas donde
todo se ha racionalizado. Sin embargo, existe otra lı́nea de investigación que
niega que Schumpeter haya modificado su teorı́a al mudarse a Estados Unidos.
Destaca en este sentido el trabajo de Langlois (2002). Langlois intenta demostrar que la teorı́a del emprendedor schumpeteriano mantuvo consistencia,
al menos, desde 1926 en adelante, seis años antes que abandonara Europa. En
efecto, en la última versión de la “Teorı́a del Desenvolvimiento Económico”,
basada en la segunda edición alemana de 1926 puede leerse:
“Sin embargo, cuanto más exactamente lleguemos a conocer el mundo natural y social, tanto más perfecto será nuestro control de los hechos; y cuanto
mayor sea la perfección con que puedan calcularse las cosas, con tiempo y
racionalización progresiva, y en forma rápida y segura, tanto más decrece la
importancia de dicha función. Deberá disminuir, por tanto, la importancia del
empresario, lo mismo que ha disminuido ya la del jefe militar.” 8
La similitud entre este pasaje del Schumpeter temprano y el previamente
citado del Schumpeter tardı́o es innegable. La idea detrás de esta consistencia
implicarı́a que, en situaciones de marcada incertidumbre o ignorancia, la intuición del emprendedor constituye un don muy valioso. Pero, en la medida que
el conocimiento acerca del ambiente externo se acrecienta, es más fácil calcular
7
Klein (1977), pág. 133.
8
Schumpeter (1957), pág. 95.
El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna
11
costos, beneficios y riesgos; y determinar, sobre la base del análisis racional
de estos cálculos, el mejor curso de acción. De esta forma, la intuición del
emprendedor queda relegada a un segundo plano.
Langlois cita además el aporte de Becker y Knudsen quienes, al traducir el
ensayo “Emprendedor”de 1928, indican que efectivamente aprecian un cambio
en la teorı́a del emprendedorismo pero entre 1911 y 1926, y no entre 1926 y 1942.
En su interpretación, de constituir una caracterı́stica psicológica de un pequeño
grupo poblacional en la primera versión de la “Teorı́a del Desenvolvimiento
Económico”, la noción de emprendedor pasarı́a a intentar conceptualizar una
forma de comportamiento más bien despersonalizada, un ideal de individuo
o, quizás incluso, de organización. Estos autores leen entonces una versión
institucionalizada del emprendedor ya en los escritos de 1926. Para Becker
y Knudsen este cambio se debió a un conjunto de eventos y tragedias en la
vida personal de Schumpeter. Para Langlois, se explica más bien por una
intención de compatibilizar su teorı́a con las ideas burocráticas de Max Weber,
que gozaban de notable reconocimiento en la Europa Central de la década del
veinte.
Sin embargo, en repetidos pasajes de la segunda versión de su libro, Schumpeter reitera la definición explı́cita del emprendedor como una persona y no
como una institución, poniendo especial énfasis en la importancia de su intuición. A favor de estos autores podrı́a pensarse que, el propio Schumpeter señala
en el prefacio a la versión inglesa de 1934 que, en la edición de 1926 que sirvió
de base para la traducción, intentó mantener la obra original de 1911 aplicando
sólo alteraciones menores; lo que justificarı́a la persistencia de la figura del emprendedor como individuo. Pero esas alteraciones menores no impidieron que
eliminara un capı́tulo completo y reescribiera el segundo y el sexto intentando
excluir los términos estático y dinámico que, a su juicio, habı́an motivado ciertas
confusiones entre sus lectores. En consecuencia, no parece tan irracional inferir
que, si Schumpeter hubiera estado convencido que el emprendedor ya no era
un individuo sino una institución, habrı́a introducido algunos cambios en este
sentido. En nuestra opinión, la teorı́a schumpeteriana del emprendedorismo
mantuvo una consistencia notable durante toda la obra de este autor. Incluso
Langlois (2002) reconoce esta posibilidad al señalar:
“A more detailed study might well discover that the continuity really goes
back to 1912 or earlier, not merely to 1926.” 9
El emprendedor de 1911 es el mismo que el de 1926 y de 1934; lo que
cambió es el medio ambiente en el que se desarrolla y las herramientas que
utiliza en la toma de decisiones. La resistencia al cambio fue desvaneciéndose
y el desarrollo de nuevas técnicas de gestión y análisis de mercados proveyeron
de mayor información al individuo para manejar la incertidumbre. En este
sentido, el emprendedor se ha racionalizado. Y fue el propio autor el primero
en llamar la atención en este sentido, contrario a lo que afirma Berumen (2007),
por ejemplo. Sin embargo, ningún individuo toma decisiones bajo información
perfecta. En ocasiones, ni siquiera puede emplear toda la información que
podrı́a conseguirse por no disponer del tiempo o los recursos para obtenerla,
como también ya lo notaba Schumpeter. De modo que, la intuición, el talento
9
Langlois (2002), pág. 11.
12
Revista de Administración, Finanzas y Economı́a
individual, aún cuando reducida en su importancia, sigue siendo una parte no
despreciable del comportamiento emprendedor.
Es cierto que la teorı́a de 1911 fue diseñada especialmente a medida del
capitalismo temprano. Pero también es verdad que el autor entrevió pronto que
el paso a la nueva etapa estarı́a relacionada con un detrimento de la intuición
en pos de la racionalidad. Y es largamente reconocido que no esperaba elaborar
una teorı́a económica universal válida para toda época y lugar. En sus propias
palabras, en su prólogo a la edición española de 1944,
“Se me ha dicho con frecuencia que mi esquema analı́tico se refiere únicamente a una época histórica que está rápidamente llegando a su fin. Y en eso
estoy de acuerdo. En mi opinión la teorı́a económica no podrá ser nunca, en
este sentido, más que la teorı́a de una cierta época histórica.” 10
Probablemente lo que ha motivado este nivel de discusión es el énfasis
particular que Schumpeter otorgó a las grandes corporaciones en “Capitalismo,
Socialismo y Democracia”. Al señalar que, en el lı́mite, estas empresas desplazarı́an totalmente a los emprendedores en cuanto a la endogeneización de
la generación de innovaciones posiblemente estaba considerando que las firmas
crecerı́an y avanzarı́an en forma perpetua gracias a su posición privilegiada en el
mercado, constituyendo una suerte de oligopolio de cı́clopes industriales. Pero
la evidencia demuestra que ese no es el caso. Muchas grandes corporaciones con
centros integrados de investigación y desarrollo han sucumbido por su propio
peso. Mientras que proyectos surgidos en un garaje han revolucionado el mundo
tecnológico.
Es evidente que el emprendedor de la actualidad no es idéntico al arquetipo
schumpeteriano. Pero no es menos cierto que comparte varios de los atributos
más importantes. Es un agente más racional, pero no desprecia la intuición.
Ve oportunidades donde otros sólo ven rutina e implementa innovaciones que
revolucionan el mercado. Afirmar que, como en el pensamiento de Schumpeter,
este emprendedor es la base del desarrollo puede sonar un poco arriesgado. Pero
que juega un papel importante en el proceso es innegable.
5. El pensamiento Schumpeteriano en las corrientes actuales
Tras la muerte de Schumpeter, sus contribuciones en materia de crecimiento
fueron soslayadas. El mainstream se hallaba abocado a la formalización matemática de las teorı́as tras la aparición de los celebrados modelos de HarrodDomar (1946) y de Solow (1956). Las ideas de Schumpeter eran difı́ciles de
expresar en relaciones matemáticas, él mismo durante su vida habı́a intentado
hacerlo a sabiendas que el resto de los economistas teóricos no tomarı́a en serio
su teorı́a del desarrollo hasta que pudiera formalizarla, según lo afirma Klein.
Pero los esfuerzos de Schumpeter y de algunos de sus seguidores inmediatos
no lograron los resultados deseados. Probablemente porque todavı́a no estaban
disponibles las herramientas matemáticas y computacionales necesarias para
hacerlo.
No es la intención de esta sección realizar un análisis detallado de la amplia
gama de autores influenciados por el pensamiento de Schumpeter. Al contrario,
a sabiendas de que se comete la imperdonable omisión de autores notables, esta
10
Schumpeter (1957), pág. 10.
El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna
13
sección simplemente intenta proveer una breve identificación de las dos principales corrientes que fundamentan sus trabajos en los conceptos de emprendedor,
innovación y destrucción creativa, entre otros. A grandes rasgos se clasifica a
estos autores en dos ramas. Por un lado, los neo-schumpeterianos que persiguen
la formalización de las ideas de la “Teorı́a del Desenvolvimiento Económico” a
través de modelos de simulación. Por el otro, economistas neoclásicos que desarrollan modelos de crecimiento endógeno utilizando versiones simplificadas de
tales conceptos. A continuación, una rápida descripción de cada grupo.
De acuerdo a Kwasnicki (2003) fueron el desarrollo de la informática en los
años cincuenta y sesenta y del enfoque de simulación los que permitieron comenzar a estudiar problemas no lineales. El primer modelo neo-schumpeteriano en
emplear simulaciones para emular el comportamiento evolucionista fue el de
Winter en 1964, “Economic Natural Selection and the Theory of the Firm”.
Los esfuerzos en esta lı́nea se intensificaron durante las décadas siguientes hasta
consolidarse en el libro de referencia de la economı́a evolucionista “An Evolutionary Theory of Economic Change” publicado por Nelson y Winter en 1982.
Desde entonces, han proliferado modelos de simulación inspirados en las ideas
del crecimiento schumpeteriano basado en la destrucción creativa.
Estos modelos desplazan totalmente la idea de equilibrio general a favor
la modelización evolucionaria. Esto les permite incorporar supuestos mucho
más realistas respecto a los modelos neoclásicos tradicionales. Se consideran,
por ejemplo, heterogeneidad de agentes, racionalidad acotada, mecanismos alternativos de innovación y apropiación, estructuras de mercado alternativas,
aprendizaje en la producción, rendimientos no decrecientes, etc. Pero un punto
particularmente interesante entre estos autores es que complementan su modelo de simulación con el análisis de la experiencia histórica, contrastando sus
resultados con la evidencia empı́rica. Un claro compromiso metodológico con la
visión de Schumpeter para quien la teorı́a económica, la estadı́stica y la historia
debı́an interactuar en la explicación de los fenómenos. Aunque tal compromiso
no implica que los neo-schumpeterianos hayan adoptado los trabajos del maestro como dogma. Al contrario, como lo señala Freeman (1998) es sorprendente
la variedad de enfoques que ha proliferado en el marco de esta corriente, muchos
de ellos incluso criticando al propio Schumpeter.
En general, los autores neo-schumpeterianos comparten la visión del capitalismo como un fenómeno evolutivo que muta en el tiempo a través de innovaciones productivas, comerciales o estructurales. Partiendo de ese denominador
común, se ha sometido al análisis y formalización a la mayor parte de las ideas
de Schumpeter y se han explorado áreas sobre las que el autor no habı́a trabajado como es el caso del comercio internacional, subdesarrollo y desarrollo
regional. Aunque también es cierto que otras áreas relevantes han sido excluidas del análisis, por ejemplo, teorı́a del consumidor. Para un excelente repaso
de esta literatura se sugiere Freeman (1998).
Una última caracterı́stica notable de los modelos neo-schumpeterianos es
que centran su estudio en la innovación microeconómica a nivel de firmas o industria y no a escala macroeconómica donde la teorı́a del desarrollo se encuentra
estancada en un callejón sin salida. Estudios notables se han llevado a cabo
tomando las caracterı́sticas especı́ficas de la industria sobre el avance técnico
en agricultura, minerı́a y, especialmente, actividades manufacturares. Sin embargo, se ha dejado de lado al sector más importante de la economı́a global y al
14
Revista de Administración, Finanzas y Economı́a
más afectado por los avances tecnológicos, el de los servicios. Por otra parte, las
innovaciones estudiadas se han concentrado en cambios tecnológicos en la producción pero escasas investigaciones se han llevado a cabo sobre innovaciones
en organización. Aunque justo es reconocer el elevado grado de dificultad que
la modelización de estos avances impone.
En otra lı́nea de sucesión, ya sobre la década del noventa, las ideas de
Schumpeter encontraron cabida en el marco de los modelos de crecimiento
endógeno. Estos autores no son neo-schumpeterianos en el sentido que se le ha
dado al término en los párrafos anteriores desde que no emplean la metodologı́a
evolucionista de los modelos de simulación. En cambio, emplean modelos de
corte neoclásico para formalizar las ideas de Schumpeter acerca de la endogeneización de las innovaciones, la competencia como fenómeno evolutivo que
expulsa a quienes no se ajustan a las nuevas condiciones de mercado, la destrucción creativa, entre otros.
A partir de los trabajos fundacionales de Romer y Lucas, en 1992 llegó el
destacado aporte de Aghion y Howitt, quienes desarrollaron un modelo de crecimiento endógeno basado en la idea schumpeteriana de la destrucción creativa.
Propusieron una economı́a constantemente sometida a innovaciones tecnológicas
que benefician a algunos sectores y perjudican a otros y donde la competencia se ocupa de eliminar a los que no tienen éxito desarrollando o imitando
innovaciones. En este sentido se diferencian de la teorı́a AK convencional que
considera al progreso tecnológico simplemente como otro modo de acumulación
de capital ignorando la posible existencia de conflictos interpersonales. Este
trabajo original fue continuado en la misma tradición generalizando el modelo básico y desarrollando nuevas alternativas. A continuación se propone un
repaso breve de aquella versión.
Aghion y Howitt (1992) constituye una primera aproximación al crecimiento endógeno bajo la concepción schumpeteriana en un contexto de incertidumbre. Para ello modelizan las innovaciones como una secuencia aleatoria
de mejoras únicamente en la calidad de los productos, por lo que constituye un
modelo de innovaciones verticales ya que estas vuelven obsoleta la tecnologı́a
anterior. Ası́ intentan formalizar parcialmente el concepto de destrucción creativa. Adicionalmente suponen que las investigaciones son llevadas a cabo por
las firmas quienes gozarı́an de un monopolio sobre las eventuales invenciones.
Para operacionalizar estos supuestos, Aghion y Howitt suponen que el trabajo
en una economı́a puede destinarse a investigación y desarrollo o a producir
un insumo del cual se obtiene un bien final. Cuando una empresa incorpora
una innovación monopoliza la producción del insumo y goza de beneficios extraordinarios hasta que otra empresa desarrolle otra innovación y la desplace.
Por último, las innovaciones se suponen idénticamente distribuidas Poisson con
parámetro λ.
Con esta estructura el monopolista (actual y potencial) maximiza beneficios llegando a una ecuación de arbitraje. Aparece luego una relación negativa
entre la investigación corriente y la futura porque si se advierte que existirá
mucha investigación en los próximos perı́odos, las rentas creadas por la investigación actual se ven amenazadas, desincentivándola. En virtud de esta
relación negativa el modelo puede tener una única solución de estado estacionario o varias originando posibles senderos de crecimiento cı́clicos e, incluso,
una trampa de no crecimiento donde la innovación se detiene. Aunque vale
El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna
15
notar que esta relación negativa se da porque el monopolista no endogeneiza la
externalidad positiva de la investigación corriente sobre la futura. Si se permite
que sea un planificador de Pareto el que toma las decisiones podrı́a alcanzarse
una tasa de crecimiento mayor que bajo descentralización. Para que esto se
produzca los efectos que generan mayores incentivos sociales a la investigación
por el lado de una menor tasa de descuento social respecto a la privada (porque
para el planificador el beneficio de la próxima innovación será para siempre) y
por el problema de la apropiabilidad (el monopolista no puede endogeneizar los
beneficios que producen sus innovaciones sobre las futuras) deben superar al
desincentivo social que resulta de la internalización por parte del planificador
de la destrucción del retorno social de la innovación anterior (que los privados
no interiorizan).
El aporte más significativo de esta lı́nea de trabajo claramente resulta
entonces la modelización de intereses contrapuestos y su impacto sobre el crecimiento. En este sentido el enfoque verdaderamente responde al ideal schumpeteriano aún cuando constituye una simplificación notoria. En palabras de
Howitt respecto a la superioridad de este esquema de trabajo sobre los modelos
AK,
“Our new theory treats innovation as a separate activity from saving, and
it is explicit about who gains from it, who loses, how the gains and losses depend
on social arrangements, and how such arrangements affect society’s willingness
and ability to progress.” 11
Las generalizaciones a este modelo básico desarrolladas en los últimos veinticinco años versan sobre distintas modificaciones a los supuestos. Pero las
que resultan más interesantes son las relacionadas a competencia, polı́tica de
patentes, diferencias de ingresos entre paı́ses y revoluciones tecnológicas. En
términos de competencia, por ejemplo, los modelos de crecimiento señalan que
la competencia reduce la tasa de crecimiento al contraer la tasa de retorno potencial de las innovaciones. Sin embargo, la evidencia empı́rica parece afirmar
lo contrario. Lo que motivó a estos autores a buscar explicaciones alternativas
en el marco del modelo de 1992. Ası́ aparecen modelos incluyendo barreras
de entrada, problemas de principal-agente y maximizaciones sobre los beneficios incrementales y no sobre los absolutos. Para más detalles acerca de las
generalizaciones del modelo de 1992 se sugiere Aghion y Howitt (1998).
6. La Innovación en la Teorı́a Moderna
Las ideas de Schumpeter acerca de las innovaciones también han evidenciado
una revitalización en los últimos años. Probablemente por la gravitación que
ciertos autores neo-schumpeterianos han ejercido sobre organizaciones como
la Organización para la Cooperación y el Desarrollo Económico (OCDE) y
el Fondo Monetario Internacional (FMI) en pos de la estandarización de las
estadı́sticas sobre investigación y desarrollo. En el Manual de Oslo (2005) de la
OCDE puede apreciarse una cierta influencia de Schumpeter cuando se señala
que las innovaciones pueden agruparse en cuatro categorı́as:
11
Howitt (2002), pág. 1.
16
Revista de Administración, Finanzas y Economı́a
a) La innovación de producto implica cambios significativos en las caracterı́sticas de las mercancı́as o de los servicios. Se incluyen tanto las mercancı́as totalmente nuevas como los servicios y las mejoras significativas
de los productos existentes.
b) La innovación de proceso representa cambios significativos en los métodos de producción y de distribución.
c) La innovación de organización, referida a la puesta en práctica de nuevos
métodos de trabajo, tanto de la organización como del lugar de trabajo
y/o de las relaciones exteriores de la empresa. La innovación de comercialización refleja la puesta en práctica de nuevos métodos de comercialización; desde cambios en el diseño y el empaquetado hasta la promoción
del producto mediante nuevas polı́ticas de precios y de servicios.
Además, el concepto de innovación ha cobrado particular vigor en el marco
de las teorı́as modernas de competitividad. Existen varias estrategias de competitividad, pero no se puede negar que la innovación es el único medio para
lograr que la competitividad de una nación a nivel internacional sea genuina,
sustentable y acumulativa. La capacidad de innovar, de apropiarse de rentas
tecnológicas y de generar economı́as de escala dinámicas y sustentables explican las diferencias entre paı́ses en cuanto a PBI per cápita y distribución de
la riqueza; y explican también el fenómeno de convergencia que se observa en
la actualidad en cuanto la innovación ha cobrado importancia dentro de las
naciones emergentes como puede apreciarse en el Gráfico 4. Los paı́ses emergentes han incrementado el gasto en investigación y desarrollo en relación a
su producto mucho más fuertemente que los paı́ses industrializados intentando
reducir la brecha tecnológica. Liderando esta tendencia aparece China donde
la participación se multiplicó por 2,5 entre 1996 y 2007.
Gráfico 4. Gasto en Investigación y Desarrollo en relación al PIB. Paı́ses seleccionados.
Fuente: Ministerio de Ciencia, Tecnologı́a e Innovación Productiva, Argentina
El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna
17
Los niveles de crecimiento y renta de los estados en una economı́a globalizada están determinados por su especialización internacional, y ésta a su vez
depende de las caracterı́sticas de su estructura productiva, las decisiones empresarias y el entorno. Un crecimiento genuino sólo se producirá si el entramado
industrial es capaz de absorber y generar tecnologı́a en un proceso de diversificación de la actividad industrial desde las tecnologı́as más simples a las más
complejas, lo que no implica necesariamente un tipo particular de distribución
sectorial de la producción sino la capacidad de mejorar la productividad y la
complejidad tecnológica de cada uno de los sectores industriales existentes.
El proceso de destrucción creativa lleva al desarrollo de nuevos productos
y procesos empujando al crecimiento de las naciones. Sin embargo, el impacto
de la innovación en el bienestar social de un paı́s puede ser positivo o negativo.
Según Reinert, el progreso técnico puede conducir al desarrollo o puede acentuar el subdesarrollo. El avance tecnológico puede impactar en la sociedad a
través de menores precios, menores salarios y, en consecuencia, un menor bienestar, asociado a desempleo, exclusión y deterioro de la distribución del ingreso
(derrame clásico de la tecnologı́a); o puede generar el efecto contrario (mayores
precios y mayores salarios) y el sector se beneficiará a través de un aumento en
sus ingresos. El rumbo que tomará el desarrollo vendrá dado no sólo por las
caracterı́sticas de la firma sino también por el entorno a nivel macro.
Desde una perspectiva micro, una primera aproximación a la idea de innovación dentro de una empresa es el modelo lineal de innovación que se inicia
con la investigación básica y finaliza con la implementación del nuevo proceso
o la introducción al mercado del nuevo producto. Sin embargo, la realidad
muestra que la innovación no es lineal sino más bien un proceso con mucha
retroalimentación y repetitivo. Las decisiones de las firmas no vienen sólo de
las invenciones cientı́fico técnicas, sino que a estas se le agrega la información
proveniente de la demanda y las posibilidades reales de implementar el cambio.
En otras palabras, ya que el proceso innovador depende de la capacidad de la
firma de generar nuevo conocimiento, la firma deberá sumar a sus fuentes generadoras de conocimiento (internas y/o externas) vinculaciones con sus clientes y
proveedores, más allá de las relaciones comerciales tradicionales. La innovación
surge de la empresa, pero también se da en un contexto histórico, geográfico y
socioeconómico determinado que agregan aún más información y conocimiento.
De modo que también en este sentido valen las enseñanzas de Schumpeter en
cuanto es el emprendedor quien incorpora nuevas combinaciones que son concebidas en su observación del medio en el cual su negocio se halla inmerso.
A todo este proceso de innovación hay que ubicarlo dentro de la estrategia
empresarial que determinará en qué momento del proceso de destrucción creativa ingresará la firma al mercado. Según Porter (1990), se puede distinguir una
estrategia de lı́der o de diferenciación entre las empresas que entran al proceso
en la etapa de introducción del producto (proceso), la estrategia de seguidor
combinada en parte con una estrategia de diferenciación entre las que sigan
con la imitación, y una estrategia de liderazgo en costos entre las que avanzan
en la estandarización del producto y procesos. Dependiendo del objetivo que
tenga y sus acciones, el derrame en el tejido social variará ası́ como lo harán la
cantidad de esfuerzo que deba aportar y la demanda de capacidad a la que esté
exigida. La trayectoria que vaya tomando la firma también tendrá consecuencia
sobre los determinantes del cambio tecnológico, porque la selección, desarrollo
18
Revista de Administración, Finanzas y Economı́a
y adaptación de la estrategia tendrán un efecto directo sobre la disponibilidad
de la tecnologı́a. Según Pavitt (1984), otra forma de explicar la dinámica del
cambio tecnológico es a partir de la pertenencia sectorial. En este enfoque la
estrategia innovadora de la firma depende de las caracterı́sticas del sector y es
entonces a nivel de la industria donde deben buscarse los patrones de conducta
innovadora. Lall (1992) sigue esta lı́nea y explica la dinámica de acuerdo al
grado de intensidad tecnológica de los sectores industriales medido a partir de
los esfuerzos en I+D. Lo que falları́an en explicar son los diferentes niveles de
conocimiento incorporado que se pueden encontrar en un mismo sector. Pero
en todos estos planteos está presente la idea schumpeteriana de que existen
firmas emprendedoras que toman la iniciativa en la implementación de cambios
y firmas seguidoras que se apresuran a imitarlas para no quedar excluidas del
mercado. Además, de la experiencia se sabe que las firmas innovadoras tienen
menores probabilidades de desaparecer ante crisis económicas, son menores expulsoras de empleo cuando buscan sobrevivir y alcanzan mayores niveles de
crecimiento de las ventas e inserción exportadora. Más aún, presentan mejores
indicadores de desempeño y trayectoria que las firmas no innovadoras, e incrementos en la calidad y cantidad de los recursos humanos. Punto a favor de la
proposición de Schumpeter al señalar que son los emprendedores quienes lideran
el crecimiento de la economı́a.
El efecto positivo de la innovación sobre la performance financiera, medida
por el valor de mercado o el precio de las acciones, aparece como bastante
robusto en la evidencia empı́rica, como discuten Blundell et al. (1999), Griliches
(1984), Hall et al. (2005) y Toivanen et al. (2002).
Existe también abundante literatura documentando los efectos de la innovación sobre el crecimiento y las ganancias de las firmas, aunque no exenta de
ciertas ambigüedades. Geroski et al. (1993) encuentran un impacto positivo de
las innovaciones exitosas de la firma sobre su margen de ganancias. Mientras
que Geroski y Machin (1992) destacan la persistencia y significatividad de las
diferencias en rentabilidad entre compañı́as innovadoras y no innovadoras. Por
su parte, Freel (2000) argumenta que tales diferenciales dependen de factores
como el tamaño de la firma y las caracterı́sticas de la industria.
El trabajo de Adamou y Sasidharan (2007) encuentra que firmas con mayor
ratio I+D a ventas crecen más rápido. Yasuda (2005) llega a un resultado
análogo al estudiar el impacto de los gastos de innovación por empleado sobre
el crecimiento de la compañı́a. Yang y Huang’s (2005), Foray et al. (2007) y
Del Monte y Papagni (2003) arriban a las mismas conclusiones. En cambio,
Hershmati y Lööf (2006) no encuentran impacto significativo de la innovación
sobre el crecimiento de las ventas en una muestra de 930 firmas suizas. Almus
y Nerlinger (1999) concluyen que el crecimiento de una firma es sólo afectado
por su tamaño y edad, pero no por sus actividades de innovación.
Además, las actividades de innovación aumentan la probabilidad de supervivencia de las firmas. Christensen et al. (1998) muestran que la combinación de
estrategias tecnológicas y de mercado son predictores importantes de la probabilidad de supervivencia. Cefis y Marsili (2003) muestran que las firmas jóvenes
y pequeñas son las más expuestas al riesgo de salida y, al mismo tiempo, las
que más se benefician de las innovaciones para permanecer en el mercado.
Por último, y a modo de conclusión y aplicación de estos conceptos, una mirada a la realidad argentina desde esta óptica. La historia económica argentina
El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna
19
reciente ha estado signada por la incertidumbre y vulnerabilidad causadas por
los recurrentes desequilibrios macroeconómicos. A la incertidumbre inherente
al proceso de innovación hay que agregarle entonces la del entorno, y esto impacta directamente en los procesos de toma de decisiones de inversión. Los
proyectos de innovación suelen ser de corto plazo para ser capaces de sostener
la competitividad en los perı́odos de crecimiento y minimizar la exposición en
caso de una nueva crisis.
Además, las empresas enfrentan el inconveniente adicional de un mercado doméstico de reducido tamaño que limita las economı́as de escala que
podrı́an obtenerse, desincentivando los gastos en innovación y promoviendo el
gasto en tecnologı́a incorporada (productos de tecnologı́as anteriores a las existentes pero que ya fueron amortizadas en mercados desarrollados) sin esfuerzos
endógenos de generación y apropiación de conocimiento. Esto se combina con
una baja inserción internacional como muestra Porta (2007), de forma tal que
los estándares de competencia del grueso de las firmas locales son justamente los
del mercado local: gustos y preferencias de menor sofisticación relativa, baja demanda de conocimiento, bajo-medio poder adquisitivo y escala reducida. Paralelamente, las interacciones entre los entes públicos como el Sistema Nacional
de Innovación (SNI), el Instituto Nacional de Tecnologı́a Industrial (INTI) y las
universidades y las empresas están lejos de ser las de los paı́ses desarrollados, y
están más asociados a vı́nculos rutinarios asociados al desarrollo de pruebas y
ensayos y al cumplimiento de normas que a la búsqueda de nuevos productos y
procesos como lo expresa Suárez (2007).
7. Conclusiones
Schumpeter fue el primero en señalar que su teorı́a económica carecı́a de valor
universal, del mismo modo que todas las teorı́as económicas carecen ya que sólo
sirven para explicar un perı́odo histórico particular. Sin embargo, a casi un siglo
de la primera edición de la “Teorı́a del Desenvolvimiento Económico” sus ideas
gozan de una validez notable. Evidentemente el emprendedor que describe en
el segundo capı́tulo de su obra no es idéntico al emprendedor actual, pero tiene
muchos puntos en común. Se trata de un agente en búsqueda permanente
de desafı́os impulsado no sólo por el beneficio económico, sino también por el
reconocimiento de la sociedad y por una sensación de superioridad y liderazgo.
En cuanto al modo de incorporar las nuevas combinaciones, seguramente en
la actualidad a cada innovación le antecede un estudio mucho más minucioso,
racional y menos intuitivo que en la Austria de principios del siglo XX. Sin
embargo eso no implica que el talento natural para percibir oportunidades de
negocio constituya un don inútil.
Además en este trabajo se rescata la consistencia, en lı́neas generales, del
pensamiento schumpeteriano durante más de cuarenta años, contrario a la tesis
de obsolescencia que indica que existe un Schumpeter temprano europeo y un
Schumpeter tardı́o americano con posiciones irreconciliables. El autor claramente vislumbró que el emprendedor tal y como lo habı́a descrito en su teorı́a
se transformarı́a en un agente más racional en la medida que mayores herramientas técnicas estuvieran a su alcance. De ese modo el proceso de desarrollo se
tornarı́a más burocrático y despersonalizado. Y esta apreciación aparece ya en
la primera edición de la Teorı́a en 1911, treinta años antes de “Capitalismo,
Socialismo y Democracia”, cuando la expone en profundidad.
20
Revista de Administración, Finanzas y Economı́a
Por último se intenta mostrar cómo sus principios se hallan presentes no
sólo en la escuela neo-schumpeteriana, sino también en el seno de la escuela
neoclásica donde ha cobrado especial valor como componente de sustancia de
los modelos de crecimiento endógeno, y en las teorı́as contemporáneas de innovación, competitividad y emprendedorismo.
La principal conclusión de este trabajo es que Schumpeter estaba en lo
correcto sólo a medias. Parte de su teorı́a efectivamente cayó en el olvido
como él esperaba. Pero la mayor parte conserva una vigencia envidiable y
se ha constituido en inspiración de economistas tan disı́miles que el propio
Schumpeter se asombrarı́a de los efectos de su obra.
8. Referencias
Adamou, A. y Sasidharan, S. (2007), “The Impact of R&D and FDI on Firm
growth in Emerging-Developing Countries: Evidence from Indian Manufacturing Industries”, from SSRN: http://ssrn.com/abstract=987024
Aghion, P., Howitt, P., “A Model of Growth Through Creative Destruction”,
Econometrica, Vol. 60, No. 2, 1992
Almus, M., y Nerlinger, E., “Growth of New Technology-Based Firms: Which
Factors Matter?”, Small Business Economics, Vol. 13, 1999
Berumen, S., “El legado de Schumpeter al estudio de la administración de empresas”, Cuaderno de Difusión 12 (22), Real Academia de Ciencias Morales
y Polı́ticas, Madrid, 2007
Berumen, S., “Una Aproximación a la Construcción del Pensamiento Neoschumpeteriano: Más allá del Debate entre Ortodoxos y Heterodoxos”,
ICE N 845, España, 2008
Blundell, E., Griffith, R. y Van Reenen, J., “Market Share, Market Value and
Innovation in a Panel of British Manufacturing Firms”, The Review of
Economic Studies, Vol. 66, No. 3, 1999
Cefis, E. y Marsili, O., “Survivor: The Role of Innovation in Firms Survival”,
2003, Disponible en http://www.sussex.ac.uk/Units/spru/events/KP
Conf 03/documents/Cefis Marsili.pdf
Christensen, C., Suarez, F. y Utterback, J., “Strategies for Survival in FastChanging Industries”, Management Science, Vol. 44, 1998
Del Monte, A. y Papagni, E., “R&D and the Growth of Firms: Empirical
Analysis of a Panel of Italian Firms”, Research Policy, Vol. 32, 2003
Dinopoulos, E., Sener, F., “New Directions in Schumpeterian Growth Theory”,
en “Edgar Companion to Neo-Schumpeterian Economics”, Editado por
Hanusch, H. y Pyka, A., Edward Elgar, Capı́tulo 42, Gran Bretaña, 2007
Foray, D., Hall, B. y Mairesse, J., “Pitfalls in Estimating the Returns to Corporate R&D Using Accounting Data”, Paper presented at the First European
Conference on Knowledge for Growth, October 8-9, 2007
Freel, M., “Strategy and Structure in Innovative Manufacturing SMEs: The
Case of an English Region”, Small Business Economics, Vol. 15, No. 1,
2000
Freeman, C., “The Economics of Industrial Innovation”, MIT Press, Cambridge, 1982
Fremman, C., “The Economics of Technical Change”, en “Trade, Growth and
Economics”, Editado por Archibugi, D., Michie, J., Cambridge University
Press, 1998
El Emprendedor Schumpeteriano Aportes a la Teorı́a Económica Moderna
21
Geroski, P. y Machin, S., “Do Innovating Firms Outperform Non-Innovators?”,
Business Strategy Review, Vol. 3, No. 2, 1992
Geroski, P., Machin, S. y Van Reenen, J., “The Profitability of Innovating
Firms”, RAND Journal of Economics, Vol. 24, No. 2, 1993
Griliches, Z., “Market Value, R&D and Patents”, NBER Chapters in “R&D,
Patents and Productivity”, pp. 249-252, 1984
Hall, B., Jaffe, A. y Trajtenberg, M., “Market Value and Patent Citations”,
Rand Journal of Economics, Vol. 36, No. 1, 2005
Heshmati, A. y LööF, H., “Investment and Performance of Firms: Correlation
or Causality?”, CESIS Electronic Working Paper Series, 2006
Howitt, P., “The Research Agenda: Peter Howitt on Schumpeterian Growth
Theory”, Economic Dynamics Newsletter, Vol. 3, No. 2, 2002
Klein, B., “Dynamic Economics”, Harvard University Press, Cambridge, 1977
Kwasnicki, W., “Schumpeterian modeling”, Wroclaw University, Poland, 2003
Lall, S., “Technological Capabilities and Industrialization”, World Development, Vol. 20, N2, 1992
Langlois, R., “Schumpeter and the Obsolescence of the Entrepreneur”, Working
Paper 2002-19, University of Connecticut, 2002
Nelson, R., Winter, S., “An Evolutionary Theory of Economic Change”, Belknap Press, Cambridge, 1982
Nelson, R., “The Moon and the Ghetto”, Norton, New York, 1977
Organización para la Cooperación y el Desarrollo Económico, “Manual de Oslo.
Guı́a para la Recogida e Interpretación de Datos sobre Innovación”, Grupo
Tragsa, España, 2005
Pavitt, K., “Sectorial Patterns of Technical Change: Towards a Taxonomy and
a Theory”, Research Policy N 13, 1984
Porta, F., “Especialización Productiva e Inserción Internacional. Evidencias
y Reflexiones sobre el Caso Argentino”, Documento presentado al PNUD,
Proyecto FO/ARG/05/012, 2007
Porter, M., “The Competitive Advantage of Nations”, Free Press, New York,
1990
Perelman, M., “Schumpeter, David Wells and Creative Destruction”, The Journal of Economic Perspectives, Vol. 9, No. 3, 1995
Phillips, A., “Technology and Market Structure: A study of the Aircraft Industry”, D.C. Heath, Massachusetts, 1971
Schumpeter, J., “Capitalism, Socialism and Democracy”, Allen & Unwin, Gran
Bretaña, 1976
Schumpeter, J., “History of Economic Analysis”, Editado por Schumpeter, E.,
Allen & Unwin, Gran Bretaña, 1954
Schumpeter, J., “Teor´ ia del Desenvolvimiento Económico”, Traducido por
Prados Arrarte, J., Fondo de Cultura Económica, México, 1957
Suárez, D., “Dinámica Innovativa y Estructura de Vinculaciones en la Industria
Manufacturera Argentina”, Ponencia presentada en ALTEC 2007, 2007
Swedberg, R., “Rebuilding Schumpeters Theory of Entrepreneurship”, Conference on Marshall, Schumpeter and Social Science, Hitotsubashi University,
Japan, 2007
Toivanen, O., Stoneman, P. y Bosworth, D., “Innovation and the Market Value
of UK Firms, 1989-1995”, Oxford Bulletin of Economics and Statistics, Vol.
64, 2002
22
Revista de Administración, Finanzas y Economı́a
Winter, S., “Economic Natural Selection and the Theory of the Firm”, Yale
Economic Essays, 4, 1964
Winter, S., “Toward a Neo-Schumpeterian Theory of the Firm”, Class at California Institute of Technology, California, 1967
Yang, C. y Huang, C., “R&D, Size and Firm Growth in Taiwans Electronics
Industry”, Small Business Economics, Vol. 25, 2005
Yasuda, T. “Firm Growth, Size, Age and Behavior in Japanese Manufacturing”, Small Business Economics, Vol. 24, 2005
Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and
Economics), vol. 5, núm. 1 (2011), pp. 23-32.
Caracterización y modelado de redes:
el caso de la Bolsa Mexicana de Valores
Linda Margarita Medina Herrera
José Benito Dı́az Hernández ∗∗
∗
Recibido 12 de agosto de 2010. Aceptado 22 de septiembre de 2010
Resumen
En este artı́culo revisaremos las principales herramientas que permiten analizar
las caracterı́sticas estadı́sticas y topológicas de redes financieras. Presentamos
un caso de estudio en la Bolsa Mexicana de Valores que exhibe árboles dinámicos
a lo largo de un periodo de 10 años y analiza los cambios importantes que han
presentado los movimientos de las acciones, impactando la longitud, el centro de
masa y los conglomerados (sectores económicos). Los sectores más importantes
dentro de la red son el de construcción y el de telecomunicaciones.
Abstract
We review the main tools which allow for statistical and topological characterization of financial networks. We present a case study in the Mexican stock
market (Bolsa Mexicana de Valores) displaying dynamic trees over a period of
10 years and analyzes the significant changes that have made the movements
of the stock, impacting the length, center of mass and clusters (economic sectors). The construction and telecommunications sectors are the most important
within the network.
Clasificación JEL: E44, G13.
Palabras clave: redes financieras, árboles dinámicos, portafolio, conglomerados.
1. Introducción
El mercado mexicano de valores es uno de los más importantes en América
Latina y uno de los diez grandes mercados emergentes, posee un número importante de compañı́as que han estado involucradas en fusiones y adquisiciones
en todo el mundo y cada vez está más integrado con mercados de valores internacionales. Esto lo convierte en un interesante caso de estudio. Este artı́culo
está enfocado en la Bolsa Mexicana de Valores (BMV). El objetivo principal
es caracterizar la topologı́a y taxonomı́a de la red formada por las principales
∗
Departamento de Fı́sica y Matemáticas, Tecnológico de Monterrey, Campus Ciudad de
México, Calle del Puente 222, Oficinas 1, Piso 2, Col. Ejidos de Huipulco, Del. Tlalpan,
14380 México, D.F., Teléfono +52(55)54832190, E-mail: [email protected].
∗∗
EGADE, Tecnológico de Monterrey, Campus Ciudad de México, Calle del Puente 222,
Oficinas 3, Piso 4, Col. Ejidos de Huipulco, Del. Tlalpan, 14380 México, D.F., E-mail:
[email protected].
24
Revista de Administración, Finanzas y Economı́a
acciones que cotizan en la BMV. También estudiamos la estructura dinámica
de las redes en la BMV, que nos da información relevante sobre las principales
empresas y sectores. Calculamos el coeficiente β de dominio, conglomerados,
centralidad, disparidad, nivel de ocupación y fortaleza, para cada vértice y
analizamos el comportamiento de algunos conglomerados en el tiempo. Estos
parámetros nos proveen información en cuanto a la heterogeneidad de la red
y de cuáles sectores son más importantes. Empezando en el 2004 formamos
ventanas móviles de un año (250 observaciones por empresa, aproximadamente).
Estimamos los parámetros para las observaciones de enero-diciembre del 2004,
enero-diciembre de 2005 y ası́ sucesivamente hasta diciembre de 2009. Además
analizaremos una ventana especial para los datos correspondientes a la crisis
de octubre del 2008 al febrero del 2010. Y el árbol total, correspondiente a los
datos del 2004 al 2010.
El estudio de las propiedades topológicas de las redes se ha convertido en
un tema central en la teorı́a de redes. En particular, se ha mostrado que muchos
sistemas naturales y sociales presentan propiedades estadı́sticas inesperadas de
relaciones que conectan diferentes elementos del sistema y que no pueden ser
descritas con gráficas aleatorias.
Investigaciones recientes han mostrado que la teorı́a de redes tiene importantes aplicaciones en el análisis de mercados financieros. El conocimiento del
comportamiento del mercado en el tiempo, permite minimizar el riesgo en los
portafolios y diseñar mejores estrategias de inversión. Es por esto que la descripción de patrones en la bolsa ha llegado a ser un objetivo popular entre
los investigadores en los últimos años. El desarrollo de la teorı́a de redes ha
permitido revelar estos patrones de una manera muy sencilla y clara.
Los trabajos fundamentales en redes financieras aparecen a finales de los
ochenta, el concepto de grafos en el ambiente de mercados financieros fue introducido por Mantenga, Bonano y otros (1989) como un método para encontrar arreglos jerárquicos de acciones a través del estudio de conglomerados de
compañı́as, usando las correlaciones de los rendimientos de las acciones. Bonano (2004) lo emplea para investigar no sólo las acciones de un portafolio, sino
también ı́ndices financieros y volatilidad. Onnela, Chakraborti, Kaski y Kertész
(2002) analizan árboles dinámicos, esto es, con ventanas en el tiempo, para
mostrar que los activos del portafolio óptimo de Markowitz están prácticamente
todo el tiempo en las ramas externas del árbol, los mismos autores (2003) usan
el concepto de vértice central, eligen el nodo más fuertemente conectado del
árbol y definen una medida importante, “el promedio del nivel de ocupación”
que durante las caı́das del mercado aparece con un valor muy bajo.
P. Hage, F. Harary (1995) emplean la noción de centralidad para analizar
grafos en contextos no financieros. M. Barthélemy, A. Barrat, R. PastorSatorras (2005) realizan una revisión de las principales herramientas en el
análisis de árboles financieros. Los artı́culos de Kim, D., and Jeong, H. (2005),
Tabak, B. Serra, T. Cajueiro, D (2010) y Medina, L. Mansilla, R. (2007) muestran evidencia empı́rica de la importancia de los árboles de expansión en el
análisis de los movimientos de los precios en mercados financieros.
No hay evidencia clara de cómo los parámetros que caracterizan una red
cambian en el tiempo. Muy pocas investigaciones de este tipo se refieren a
mercados emergentes y es aquı́ donde esta investigación busca contribuir, caracterizando redes en la Bolsa mexicana de Valores y estudiando sus cambios en
Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores
25
el tiempo. En la sección dos presentamos la definición de los parámetros que
se usarán para analizar las redes. En la tercera sección presentamos los datos
empı́ricos, los árboles dinámicos y las medidas que caracterizan a cada árbol y
en la última sección está constituida por conclusiones y consideraciones finales.
2. Redes financieras
Sea N el número de acciones con precio Pi (t) para el activo i en el tiempo t, con
t = 0, 1, 2, .., T . Tomamos Si (t) como el logaritmo de los rendimientos de los
activos Sit = ln(Pi (t)) − ln(Pi (t − 1)). Las entradas de la matriz de correlación
las calculamos mediante la fórmula de Pearson:
PT
(Sit − S̄it )(Sjt − S̄jt )
ρij = qP t=1
PT
T
2
2
t=1 (Sit − S̄it )
t=1 (Sjt − S̄jt )
donde S̄i es la media.
p
Para construir la red, usamos la distancia euclidiana di j = 2(1 − ρij ).
Debido a que −1 ≤ ρij ≤ 1 se tiene que 0 ≤ dij ≤ 2. Note que si dos acciones
están perfectamente correlacionadas (rij = 1) la distancia entre ellas es 0, y, si
están “anticorrelacionadas” (rij = −1) su distancia es 2.
El árbol de expansión es una gráfica de N objetos (vértices o nodos) unidos
por N − 1 arcos que permiten ir de un vértice a cualquier otro. Si cada arco
representa una distancia o costo, o en general si a cada arco se le asocia un peso
(número real), la suma de los pesos de todos los lados de un árbol, será el peso
total del árbol. Un árbol de expansión mı́nima es un árbol de expansión que
minimiza el peso total del árbol.
Emplearemos varias medidas para caracterizar las redes financieras. Con
el objeto de estudiar la evolución de los parámetros de las redes en el tiempo,
usaremos una ventana móvil de un año de datos, que nos permitirá estimar
y comparar los parámetros a través de los años. Este acercamiento dinámico
permitirá estudiar la evolución de la red en el tiempo.
Revisaremos brevemente las diferentes medidas y parámetros que nos permitirán una primera caracterización estadı́stica de las redes.
Peso: Las propiedades de una gráfica se pueden expresar a través de la
matriz de adyacencia, cuyos elementos toman el valor de 1 si i está conectado
con j y 0 en otro caso (con i,j = 1, , N donde N es el tamaño de la red).
Los árboles con peso usualmente se describen por medio de la matriz wij que
especifica el peso del arco que conecta el nodo i con el j. Si el vértice i no está
conectado con el vértice j, entonces wij = 0.
Grado del vértice: El grado del vértice i, ki , es el número de nodos que
están conectados directamente al nodo i, esto es, el número de elementos que
integran la vecindad de i, (V (i)).
Fortaleza del vértice: Junto con el grado del vértice, una medida muy
significativa de las propiedades de las redes en término de sus pesos se obtiene
analizando la fortaleza del vértice si definida como
si = Σj∈V (i)wij
La fortaleza del vértice integra la información de su conectividad y de la importancia de los pesos de sus vértices conectados.
26
Revista de Administración, Finanzas y Economı́a
Nivel del vértice: El nivel es la suma de los arcos que hay que pasar sobre
el aŕbol para ir del vértice i al vértice j. Si i = j entonces vij = 0.
Promedio de ocupación: Es importante caracterizar la forma en que se
extienden los nodos en el árbol. Para ello, se define la cantidad “promedio de
ocupación del vértice i” ası́:
l(vi ) =
N
1 X
niv(vij ).
N
j=1
El nodo con promedio de ocupación más baja es el centro de masa del árbol.
Un valor alto de l(vm )refleja una estructura de mercado muy fina, mientras
que en el otro extremo valores bajos se asocian con crisis en el mercado.
El vértice central: El vértice central vc es considerado como el padre de
todos los vértices del árbol o también como la raı́z del mismo. Este se usa como
punto de referencia en el árbol, contra el cual la posición de los demás vértices
es relativa. Hay un poco de arbitrariedad en la elección del vértice central, sin
embargo los siguientes criterios pueden ayudar a escoger al mejor candidato:
i) El vértice de mayor grado.
ii) El vértice de mayor peso.
iii) El centro de masa.
Centralidad: La centralidad de la gráfica nos permite comparar la centralidad del vértice central con la de los demás vértices. Si consideramos la
distancia sobre el árbol de un vértice fijo k a cada vértice h en el árbol G y encontramos R = maxh∈G dG(k, h). Podemos considerar que el árbol est inmerso
en un cı́rculo de radio R con centro en k. La centralidad es la curvatura del
cı́rculo
1
C(k) =
maxh∈G dG (k, h)
El árbol con mayor curvatura es más central.
Coeficiente del peso del conglomerado: Los conglomerados topológicos no
tienen en cuenta el hecho de que algunas vecindades son más importantes que
otras. Es por esto que se introduce una medida para los conglomerados que
combina la información topológica con la distribución de los pesos del árbol. El
coeficiente del peso del conglomerado se define como
cw (i) =
X wij + wih
1
aij aih ajh ,
si (ki − 1)
2
j,h
esta medida tiene en cuenta cada tripla que se forma en la vecindad del vértice
i. El factor de normalización si (ki − 1) asegura que 0 ≤ cw (i) ≤ 1 y que cw (i)
recupere el coeficiente topológico del conglomerado cuando wij sea constante.
Una de las aplicaciones importantes de los árboles se encuentra en la optimización de portafolios. La localización del activo con respecto al vértice central
juega un papel importante a la hora de medir el riesgo y los rendimientos.
Si rm y rM son los rendimientos mı́nimo y máximo de un portafolio P ,
respectivamente. El rendimiento esperado varı́a entre estos dos extremos, y se
puede expresar como
rP,θ = (1 − θ)rm + θrM
Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores
27
donde 0 ≤ θ ≤ 1. Se define el promedio ponderado del portafolio de la siguiente
manera:
X
lP (θ) =
wi niv(vci )
i∈P
PN
donde i=1 wi = 1 y vc es el vértice central.
Los activos que minimizan el riesgo de un portafolio se encuentran en las
ramas exteriores del árbol, por lo tanto, se espera que árboles largos (con l
grande) tengan mayor potencial de diversificación, esto es, la oportunidad del
mercado financiero para eliminar un riesgo especı́fico del portafolio de riesgo
mı́nimo.
A medida que se incrementa θ hasta llegar a la unidad, el riesgo del portafolio en función del tiempo empieza prontamente a comportarse muy diferente del
promedio de ocupación l. Consecuentemente, ya no es útil para describir la diversificación potencial del mercado. Sin embargo, emerge otro resultado interesante: el promedio ponderado del portafolio lp (θ) decrece cuando θ aumenta su
valor. Esto significa que de todos los posibles portafolios de Markovitz, las acciones del portafolio de riesgo mı́nimo están localizadas lo más lejos posible del
vértice central, y a medida que se mueve hacia portafolios con altos rendimientos esperados, las acciones incluidas en ese portafolio estarán localizadas cerca
del vértice central.
3. Árboles empı́ricos
Las series de tiempo que conforman la base de datos para este estudio están
formadas por los precios de cierre diario de 68 empresas que cotizan en la BMV,
en el periodo comprendido entre el 1/03/00 y el 2/23/10. Para la elección de
las empresas y la longitud de la serie se tuvo en cuenta la bursatilidad, capitalización y mantenimiento de las mismas. La longitud final de las series es
de 2553. Dentro de las 68 empresas seleccionadas para el estudio se encuentran representados todos los sectores económicos, las empresas elegidas tienen
la mayor bursatilidad de cada sector y juntas representan más del 90% de participación en el IPC y el 100% del ı́ndice México (INMEX). Todas las acciones
incluidas han permanecido activas en el periodo seleccionado para el estudio.
Construimos la matriz de distancia a partir de los coeficientes de correlación
y el árbol de expansión mı́nima usando el algoritmo de Kruskal. Calculamos las
medidas presentadas en la sección 3 para cada vértice (acción) y analizamos el
comportamiento de los sectores económicos. También estudiamos la evolución
de las redes en el tiempo construyendo ocho árboles. Un árbol con los 2553 datos
(del 2000 al 2010), seis árboles dinámicos para los años del 2004 al 2009 y un
árbol correspondiente a la crisis del 2008 (con datos de octubre del 2008 a febrero
del 2010). Calculamos todas las medidas en cada árbol y las promediamos por
sector económico.
La Tabla 1 muestra los cálculos obtenidos para el centro de masa, grado
y fortaleza para las empresas que obtuvieron los mejores parámetros en cada
año.
Las empresas sombreadas fueron seleccionadas como el vértice central del
año correspondiente. El vértice central del árbol completo es CEMEX siendo
el vértice con mayor fortaleza en el tiempo, el vértice con grado más alto y una
posición cercana al centro de masa. CEMEX, una de las empresas lı́deres en
28
Revista de Administración, Finanzas y Economı́a
la rama de la construcción, tiene una de las participaciones más altas del IPC,
siendo de alta bursatilidad.
GEO, la compañı́a de vivienda más rentable en el sector de la construcción,
aparece como vértice central en varias ventanas del tiempo: en el 2005 y en los
años de crisis, finales del 2008 a principios del 2010. El 2005 es el año que exhibe
el mayor promedio de ocupación, donde el árbol se despliega y el mercado
muestra cierta recuperación y los conglomerados por sectores económicos se
muestran más separados, permitiendo cierta diversificación.
En los años de crisis, el vértice central puede mostrar el sector económico
más afectado. Las empresas que aparecen en la tabla, disputándose el tı́tulo de
vértice central son todas de alta bursatilidad, juntas aportan alrededor del 80%
al IPC.
Tabla 1. Vértice Central.
América Móvil (AMX), la principal compañı́a de telecomunicaciones de
América Latina, es la empresa con mayor fortaleza promedio, las empresas
unidas a éste vértice tienen correlaciones altas, y permanecen muy cerca del
vértice central, son empresas con altos rendimientos.
En la figura 1 mostramos el promedio de ocupación, el cual oscila entre 3.16
y 4.28. El promedio de ocupación más bajo lo obtuvo el árbol correspondiente
a la crisis económica que empezó en el 2008, mostrando que efectivamente hubo
contracción en el mercado. El promedio de ocupación más alto corresponde al
año 2005.
El pico que apreciamos en el 2005 podrı́a ser explicado por algunas condiciones económicas presentes en ese año que favorecieron a la estabilidad financiera: se mantuvo la orientación a la prudencia fiscal y monetaria de la
polı́tica económica. Las tasas de interés descendieron en la segunda parte del
año y el tipo de cambio se apreció ligeramente en términos reales, lo que favoreció la baja de la inflación.
En los años estudiados, las bolsas financieras americanas mostraron un
promedio de ocupación entre 3 y 9.8, manteniéndose la mayorı́a del tiempo por
encima de 4. El rango en el que oscila el promedio de ocupación de la BMV
Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores
29
(3.16, 4.28) nos muestra que el mercado mexicano es aún un mercado en desarrollo, uno donde el comportamiento del sistema es todavı́a muy homogéneo.
El árbol con mayor centralidad corresponde a los años de crisis, confirmando la contracción en el mercado, una centralidad alta representa un árbol
sumergido en un cı́rculo pequeño, es por esto que el árbol muestra la pérdida
de conglomerados por sectores económicos. Las ramas exteriores cerca de las
interiores dificultan la clasificación de las empresas en cuanto al riesgo y los
rendimientos.
Figura 1. Variación del Promedio de ocupación en el tiempo.
Figura 2. Variación de la centralidad en el tiempo.
El árbol del 2005 (figura 3) tiene la centralidad más baja de todas las ventanas, muestra claramente las ramas exteriores del árbol (las acciones de riesgo
mı́nimo) y los vecinos del vértice central (las acciones de mayor rendimiento).
30
Revista de Administración, Finanzas y Economı́a
El árbol del 2005 es el que presenta coeficientes de peso de conglomerado
más altos, obteniendo tres conglomerados importantes: el de la construcción
con centro en GEO (figura 4), el de telecomunicaciones con centro en AMX y
el de siderurgia y metalurgia con centro en SIMEC.
Figura 3. Izquierda: Ventana Octubre 2008 - Enero 2010. Derecha: Ventana 2005.
Figura 4. Conglomerado de construcción en el árbol 2005.
A lo largo del tiempo sólo se conservan dos conglomerados: el de construcción con un coeficiente de peso de conglomerado tres veces mayor que el
siguiente conglomerado, el de telecomunicaciones. Las empresas con mayores
rendimientos son precisamente las que aparecen en la Tabla 1 y en las ramas
exteriores se mantienen a lo largo del tiempo la hotelera POSADAS, el Grupo
POCHTEC, dedicado a la producción y comercialización de productos quı́micos,
HILASA y VASCONI.
4. Conclusiones
El árbol de activos se puede ver como una poderosa herramienta en el análisis
del movimiento de las acciones en la Bolsa Mexicana de Valores, pues aunque
parece estar fuertemente reducido, contiene información esencial del mercado y
se puede usar para añadir un juicio subjetivo al problema de optimización de un
portafolio. La evidencia nos muestra que el mercado financiero mexicano forma
conglomerados en el sector de la construcción y el de telecomunicaciones. Las
Caracterización y modelado de redes: el caso de la Bolsa Mexicana de Valores
31
ramas exteriores y los centros de los árboles permanecen estables en el tiempo,
el mercado es homogéneo. Los árboles mostraron ligeras contracciones en la
crisis y extensiones en el 2005.
Las medidas de las redes sugieren que los sectores de construcción y telecomunicaciones son los sectores relativamente más importantes en los árboles
con una gran influencia sobre los demás sectores. En este artı́culo mostramos
que algunas caracterı́sticas de las redes cambian con el tiempo, más aún, la
importancia relativa de sectores especı́ficos cambia. Investigaciones posteriores
podrı́an explotar las medidas de los árboles para crear y analizar ı́ndices como
el IPC, también está abierto el tema para comparar comportamientos de bolsas
internacionalmente y de otros instrumentos financieros.
5. Referencias
Batagelj, V. and Mrvar, A. (2005) Pajek. Program for Analysis and Visualization of Large Networks. Reference Manual. http://vlado.fmf.uni-lj.si/pub/networks/pajek/.
Bonanno, G., Caldarelli, G., Lillo, F.,and Mantenga, R.N. (2002) Topology
of correlation-based minimal spanning trees in real and model markets,
Physical Review E 68 (2003) 046130.
Bouchaud, J.P., and Potters, M. (2003) Theory of Financial Risks -from statistical physics to risk management-. 2ed. Cambridge University Press,
Cambridge.
C. Eom, G. Oh, Woo-Sung Jung, H. Jeong, S. Kim, Topological properties
of stock networks based on minimal spanning tree and random matrix
theory in financial time series, Physica A: Statistical Mechanics and its
Applications 388 (2009) 900906.
J. Saramaki, M. Kivela, J. Onnela, K. Kaski, J. Kertesz, Generalizations of the
clustering coefficient to weighted complex networks, Physical Review E 75
(2007) 027105.
Kim, D., and Jeong, H. (2005) Systematic analysis of group identification in
stock markets. . e- print. http://xxx.lanl.gov/physics/0503076v1
Lee, W. (2000) Theory and methodology of tactical asset allocation. F.J.
Fabozzi Associates, New Hope, Pennsylvania.
M. Barthlemy, A. Barrat, R. Pastor-Satorras, A. Vespignani, Characterization
and modeling of weighted networks, Physica A 346 (2005) 3443.
Mantegna, R. (1998) Hierarchical Structure in Financial Markets. Eur. Phys.
J. B, 11, 193-197.
Mantegna, R., and Stanley, H.E. (2000) An Introduction to Econophysics correlations and complexity in finance. Cambridge University Press, Cambridge.
Mantegna, R. et al. (2004) Networks of equities in financial markets. e-print
http://xxx.lanl.gov/cond-mat/041300v1
Marsili, M. (2002) Dissecting financial markets: sectors and states. Quantitative Finance, 2, 297- 302.
Medina, L. Mansilla, R. Un árbol de expansión mı́nima en la Bolsa Mexicana
de Valores. Revista de Administración, Finanzas y Economa (Journal of
Management, Finance and Economics) (2007) vol. 1, issue 2, pages 116-124
M. Tumminello, T. Aste, T. Di Matteo, R.N. Mantegna, Correlation based
networks of equity returns sampled at different time horizons, EPJB 55
32
Revista de Administración, Finanzas y Economı́a
(2007) 209217.
Onnela, J.-P., Chakraborti, A., and Kaski, K. (2003) Dynamics of market correlations: Taxonomy and portfolio analysis, Physical Review E 68 056110.
Onnela, J.-P., Chakraborti, A., and Kaski, K. (2003) Dynamic asset trees and
black monday, Physica A: Statistical Mechanics and its Applications 324
247.
P. Hage, F. Harary, Eccentricity and centrality in networks, Social Networks
17 (1995) 5763.
Tabak, B. Serra, T. Cajueiro, D. Topological properties of stock market networks: The case of Brazil. Physica A 389 (2010) 3240-3249
Tumminello, M., Mateo, T., and Mantegna, R.N. (2005) A new tool for filtering information in complex systems. E-print http://xxx.lanl.gov/cond
mat/0501335v1
V. Tola, F. Lillo, M. Gallegati, R.N. Mantegna, Cluster analysis for portfolio optimization, Journal of Economic Dynamics and Control 32 (2008)
235258.
Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and
Economics), vol. 5, núm. 1 (2011), pp. 33-49.
Value at risk and return from the use of Bayesian
methods for stress testing in a world asset
allocation and the 2008-2009 crises
Humberto Valencia Herrera
∗
Recibido 22 de julio de 2010. Aceptado 30 de septiembre de 2010
Resumen
El rendimiento y el valor en riesgo de una propuesta asignación de activos
obtenida usando métodos de carteras Bayesianas tipo Black-Litterman y Markowitz aplicado a una cartera mundial de ı́ndices es fuertemente dependiente del
parámetro de escala de las distribuciones de retornos a priori. Sin embargo, el
rendimiento y valor en riesgo observado con la cartera recomendada durante el
perı́odo 2008 y 2010 es menos sensible a este parámetro.
Abstract
The return and value at risk return of a proposed asset allocation obtained
using Black-Litterman and Markowitz Bayesian portfolio methods applied to a
world portfolio of indexes is strongly dependent on the scale parameter of the
prior return distribution. However, the observed mean and value at risk during
the 2008 to 2010 period with the proposed allocation is relatively less sensible
to this parameter.
Clasificación JEL : G11, G15
Palabras clave: financial studies, international security markets, Black-Litterman model,
Bayesian portfolio optimization
1. Introduction
The 2008-2009 global financial crises has been described as the worst financial
crises in the United States and many other countries after the great depression of 1929, which was characterized by negative information effects during
the financial panic, which resulted in negative movements and contagion across
funds [Jinjarak and Zheng, 2010], in particular, during September 2008 [Idier,
∗
Humberto Valencia-Herrera is finance research professor at Instituto Tecnológico y de Estudios Superiores de Monterrey, Campus México City. Email: [email protected].
Telephone: 52-55-54832241. Address: Office Building 3, 2nd Floor, Calle del Puente 222,
Ejidos de Huipulco, México, D.F., 14380, México. I thank the comments received from an
anonymous referee, the participants at the Banco de México Economic Research Seminar and
the research assistance of Nayeli Carranco. Any remaining errors are the author’s responsability.
34
Revista de Administración, Finanzas y Economı́a
2011]. 1 The crises started in the debt market, but extended to other assets
because funds could not be raised easily and quickly, which affected the fundamental values of many assets, which became separated from its real value.
These distortions resulted in real consequences in the economy that affected
many assets far from the toxic subprime mortgage assets, which were the root
of the problem, Krishnamurthy [2010]. These effects not only were limited to
the period of the financial crises. Hall [2010] discuses persistent adverse effects
of a temporary crises that can have adverse effects on employment and output
and they can be fell for many years after the crises, even after the financial
crises subsided.
Here, we propose to use two formulations to incorporate information in
portfolio selection. Bayesian updating applied directly to the Markowitz [1952]
optimization problem and the use of the views in the Black Litterman portfolio model to update information and to incorporate past information in the
portfolio decision. In those frameworks, we explore how changes in the scale
parameters of the prior portfolio distribution modify the asset allocation, the
return, and the value at risk of the forecasted posterior portfolio distribution
and the resulting ones in the 2008 to 2010 period.
1.1. Bayesian updating in the Markowitz optimization problem
The mean variance portfolio optimization problem was initially proposed by
Markowitz [1952], who showed the problem of an investor who minimizes his/her
expected portfolio variance given a desired level of return. An alternative formulation is the problem of an investor who maximizes an expected utility function
of future returns, E(U (RT +τ )), whose probability depends on an expected return vector µ, a covariance matrix Σ and the proportions invested on each asset,
w, that add on to one,
maxω E(U (ω0 RT +τ )) = maxω
Z
U (ω0 RT +τ )pT +τ (RT +τ |µ, Σ)dRT +τ
(1)
subject to ω0 1 = 1. The investor has an expected quadratic utility function of
return a time T + τ of the form
E(U (ω0 RT +τ )) = µp −
A 2
σ
2 p
(2)
where A is the relative risk aversion coefficient, a measure of the rate at which
the investor is willing to accept extra risk for a one unit increase in expected
return.
If there is uncertainty in the parameters, it can be accounted for using a
Bayesian framework. If the next-period excess return data is RT +1 the predictive return density is 2
1
Jinjarak and Zheng [2010] shows contagion an negative feedback in emerging-market
funds during the 2008-2009 period. Idier [2011] shows extreme volatility comovements during
September 2008.
2
For a more extensive discussion, see Rachev et al. [2008]
Value at risk and return from the use of Bayesian...
p(RT +1 |R) ∝ p(RT +1 |µ, Σ)p(µ, Σ|R)dµdΣ,
35
(3)
where R = return data available up to period T , a T × N matrix,
p(µ, Σ|R) = joint posterior density of the two parameters of the multivariate
normal distribution, p(RT +1 |µ, Σ) = multivariate normal density and ∝= proportional to.
Substituting in (1), the predictive density of excess returns (3), the investor’s optimization problem becomes
maxω E(U (ω0 RT +1 )) = maxω
Z
U (ω0 RT +1 )p(RT +1 |R)dRT +1
(4)
subject to ω0 1 = 1.
In this problem, the optimal weights depend on the expected
return vector
P
µ
eT +τ and the inverse of the expected covariance matrix T +τ :
P−1
µ
eT +τ
∗
ω = T +τ
(5)
A
If the investor has informative beliefs about the mean vector and the covariance matrix of excess returns and they can be represented by conjugate
priors, 3 the mean vector will be normal with mean η a variance covariance
matrix (1/τ )Σ and the covariance matrix will be Wishart with parameters Ω
and ν. The prior parameters τ and ν reflect the confidence that the investor
has on the parameters η and Ω, respectively. The larger the τ and ν, the less
confidence the investor has on those values, respectively,
µ|Σ ∼ N (η, (1/τ )Σ)
and
Σ ∼ IW (Ω, ν).
The predictive distribution of next-period excess return is a Student’s t
distribution with mean and covariance parameters, respectively,
e=
Σ
µ
e=
τ
T
η+
µ
b
T + τ)
T + τ)
T +1
Tτ
0
b
Ω + (T + 1)Σ +
(η − µ
b)(η − µ
b)
T (ν + N − 1)
T +τ
The vector of optimal portfolio weights, ω∗ is a function of the forecasted
e and is given by (5). The efficient
mean, µ
e and the forecasted variance matrix, Σ
3
In Bayesian probability theory, if the posterior distributions p(θ|x) are in the same
family as the prior probability distribution p(θ), the prior and posterior are called conjugate
distributions, and the prior is called a conjugate prior for the likelihood, see [Raiffa and
Schlaifer, 1961]. The Gaussian family is conjugate to itself (or self-conjugate) with respect to
a Gaussian likelihood function. If the likelihood function is Gaussian, a Gaussian prior over
the mean ensures that the posterior distribution is also Gaussian.
36
Revista de Administración, Finanzas y Economı́a
0
frontier can by traced out by the optimal weights (µ∗p , σp∗ ) where µ∗p = ω∗ µ
e and
2
∗0 e ∗
σp = ω Σω , for varying values of the risk-aversion parameter A, in the relation
(2).
1.2 Black Litterman optimization problem
The Black and Litterman [1991, 1992] portfolio model (BL model, hereafter)
is appealing for many investors because it can combine subjective information
with objective one. The BL model is based on the Sharpe [1964] and Lintner
[1965] Capital Asset Pricing Model, CAPM, hereafter. The model assumes
that there is one risk factor that explains returns in equilibrium, the market
return. 4 Numerous extensions have been made to the basic model, both in
the industry and in the academics. See, for example, Martellini and Ziemann
[2007], Nardari and Scruggs [2007], Giacometti et al. [2007], Zhou [2009], Bade
et al. [2009], Meucci [2009], and Kooli and Selam [2010].
b assets, let us assume that
If the asset universe (the market portfolio ) are N
b
the equilibrium risk premiums are the N ×1 vector R, R = Ra −Rf 1, where Ra
b × 1 vector of market asset returns, 1 is a N
b × 1 vector of ones, and Rf is
is a N
b
the risk-free rate. If weq are the N ×1 vector of market capitalization weights of
the resampling portfolio in BL, the market portfolio, and the CAPM holds, R
is equal to β(Rm − Rf ), where Rm − Rf is the market risk premium, β is equal
2
b × 1 vector of asset betas and R0 weq is the market
to cov(R, R0 weq )/σM
is a N
2
2
0
return, and σM is the variance of the market return, that is, σM
= weq
Σweq ,
where Σ is the asset return covariance matrix.
If the Sharpe ratio of the market portfolio is R = δΣweq , with δ equal to
2
(Rm − Rf )/σm
, the vector of equilibrium risk premiums R can be written as
R = δΣweq
(6)
After rearranging, we obtain
weq =
1 −1
Σ R
δ
(7)
and δ is the risk aversion parameter A of the relation (2).
The market on average is expected to be in equilibrium, but at any point in
time, the equilibrium can be perturbed by shocks. Therefore, the return will be
µ = Ra +, where the N × vector includes the perturbations to the equilibrium,
which we assume that they have a multivariate normal distribution and that the
prior distribution of µ is given by µ ∼ N (Ra , τ Σ), that is, the prior covariance
matrix of the mean is a scaled covariance matrix of the sampling distribution.
The scale parameter τ can be interpreted as the uncertainty in the accuracy
with which Ra can be estimated or the confidence that the analyst has on the
CAPM. A small τ reflects high accuracy and confidence.
4
Even though the CAPM model has been strongly criticized in the literature, it is a
useful approximation for the true market model. Further extensions are Fama and French
[1993] and Carhart [1997], who extended the CAPM model, to account for other factors, to
a multifactor market model, which better explains returns.
Value at risk and return from the use of Bayesian...
37
Notice that the covariance matrix is a square symmetric matrix, and the
inverse of a block symmetric square matrix can be written, see Jo et al. [2004],
Bernstein [2005, p44-45], as
AT A AT B
Σ=
BT A BT B
=
−1
(AT PB A)−1
−(AT PB A)−1 AT B(B T B)−1
T
−1
T
T
−1
−(B PAB) B A(A A)
(B T PA B)−1
(8)
where PA = I − A(AT A)−1 AT and PB = I − B(B T B)−1 B T . If the blocks
out of the main diagonal are close to zero, and PB is close to be the identity
matrix, an allocation based on the first block will be the optimal allocation on
b assets will be the
the subset of those assets, that is, the allocation of the N
allocation based on the N assets in the market, except for the omitted ones.
b assets and the investor has K views on those
If the analysis focuses on N
b
assets, let us denote the K × N matrix of views portfolios by P . Each row of
the matrix P represents a view portfolio, where an element of P is nonzero if
the corresponding asset is associated with the view and zero elsewhere. The
K × 1 vector of expected returns on the view portfolios is given by Pµ . If the
prior distribution of returns µ is normally distributed, the investor’s subjective
views will be
Pµ ∼ N (Q, Ω) = N (Pb
, Ω),
µ
(9)
M = ((τ Σ−1 + P 0 Ω−1 P )−1 ((τ Σ)−1 R + P 0 Ω−1 Q)
(10)
where µ
b is the n
b × 1 vector of the expected prior returns, which maps to the
K × 1 vector of prior expected values Q of the views. The K × K covariance
matrix reflects the uncertainty of the views under the prior distribution of the
stress testing scenario. 5
After applying Bayes’ theorem to combine the objective information, from
µ, and subjective information, from Pµ , the posterior distribution of the expected returns µwill be normal with mean and covariance, M and V , respectively:
= ((τ Σ−1 + P 0 Ω−1 P )−1 ((τ Σ)−1 R + P 0 Ω−1 P µ
b),
where µ
b is the estimate of expected returns implied by the views,
and
µ
b = (P 0 P )−1 P 0 Q,
V = ((τ Σ)−1 + P 0 Ω−1 P )−1
5
In Black and Litterman [1991], the degree of confidence that the investor has on the
views is reflected in the diagonal elements of the prior covariance matrix Ω.
38
Revista de Administración, Finanzas y Economı́a
b assets in a stress scenario
If the returns and the covariance matrix of the N
b assets of interest, P
reflect the absolute views of the investor on each of the N
will be an identity matrix, that is, P = I,
and
M = ((τ Σ)−1 + Ω−1 )−1 ((τ Σ)−1 Ra + Ω−1 µ
b)
(12)
V = ((τ Σ)−1 + Ω−1 )−1 .
The resulting covariance matrix is the inverse of the sum of the inverse of
the covariance, multiplied by τ , and the inverse of the prior views covariance,
that is, a kind of harmonic weighted average of the covariance matrix Ω and Σ.
1.2.1 The parameter τ in Black-Litterman
If the market portfolio has mean expected return µ, the distribution of the
vector µ − R is
µ − R ∼ N (0, τ Σ)
(13)
where Σ is the covariance matrix of returns computed separately.
The parameter τ can be interpreted as the remaining uncertainty in the
sample data due to the perturbations , which it is usually assumed between 0
and 1. For example, Black and Litterman [1992] proposes to use a value close
to zero, Satchell and Scowcroft [2000] proposes to use the value of one, and
Rachev et al. [2008] proposes τ = 1/T , where T is the length of the sample in
years.
For purpose of measuring uncertainty, we use two measures: standard
deviation and value at risk, VAR hereafter. We employ the delta-normal
method, 6 which uses a mean-variance approximation of the VAR and a 99%
VAR, following Basel Committee guidelines, which is the expected lost, in a
10 day period, with a 99% confidence interval. For purpose of analysis, we
use a one
√ million portfolio, so if σ is the daily standard deviation, the VAR is
(2.33)( 10)(1, 000, 000).
2. Methodology
We use data from the following stock exchange indices: the IPC from Mexico, the MERVAL from Argentina, the IPSA from Chile, the BOVESPA from
Brazil, the IBEX 35 from Spain, the DAX from Germany, the FTSE from Great
Britain, the KOSPI 20 from South Korea, the HSENG Index from Hong Kong,
the IGBL from Peru, the IGBC from Colombia, the IBC from Venezuela and the
SP500 from the United States. The data set was from Economatica, complemented with Yahoo Finance and Bloomberg. The exchange rate was obtained
from central banks web sources, the Pacific Exchange Rate Service from the
Sauder School of Business at the University of British Columbia, Canada and
Economatica. We use daily closing prices from September 10th, 1993 to December 17th, 2010. Missing data was filled with previous closing prices. Each
6
The delta-normal method assumes independence of returns. If returns exhibit positive
correlation in the short term, the delta-normal VAR can underestimate the true VAR.
Value at risk and return from the use of Bayesian...
39
of the indexes was converted to US dollars with daily exchange rates. A total of
4,505 daily return observations were calculated based on weeks with five days.
Table 1 shows basic statistics for the indexes and equivalent daily returns for
the three month T Bill rates. 7
Figure 4 shows the daily risk premium, the difference between the daily
index return and the daily T Bill return. During 2008-2010 period, there was
an increase in volatility in almost all indexes; however, other previous periods
also showed high volatility. In order to analyze previous volatility, we estimated
the yearly standard deviation for each index and built up a equally weighted
portfolio of all indexes. Figure 2 shows that the standard deviation decrease
during 2008, 2009 and 2010 to 0.24, 0.18, and 0.14, respectively. However, the
years 1997 and 1998 also showed high volatility, standard deviations of 0.13
and 0.16, respectively. If we focus on returns, in 1998 the return was below
zero, -1.1%, but it is not comparable with the sharp decreases of 2000 to 2002,
-19.7% -10.3%, and -17.8%, respectively, a period in which the volatility was
not extremely high. The returns failed strongly in 2008, to -48.7%, to recover
in 2009 and 2010, 50.2% and 15.6%, respectively, see Figure 3. The correlation
between yearly returns and standard deviation is negative, -0.527.
2.1 Bayesian Markowitz portfolio updating
For the Bayesian Markowitz portfolio exercise (BM, hereafter, we select the
time period before 2008 as the pre-sample one of daily excess returns. The annualized daily returns of a equally weighted portfolio till 2007 was 11.82%, with
a standard deviation of 0.1096 and a Sharpe ratio of 0.0667. 8 For stress testing
purposes, the prior returns must correspond to a worst case scenario, that is, a
period with high volatility and small returns. The year 1998 had relatively high
volatility but it did not have sharp decreases in return. In contrast, in the year
2000, there was large return decreases, but the volatility was relatively small.
Therefore, for stress testing purposes, we use the covariance matrix of the year
1998, as the prior covariance and the returns from the year 2000, as the prior
returns. The parameters are as follows:
a) The vector µ are the average daily excess returns till the year 2007.
b) The covariance matrix Σ is the covariance matrix from the pre-sample
period, till the year 2007.
c) The parameter T is equal to 3,731, the number of daily excess returns
in the pre-sample period, till the year 2007.
d) The vector of prior returns η is equal to the observed mean daily excess
returns during the year 2000.
7
The exchange rates have had episodes of overvaluation and undervaluation, which resulted in different return and VAR in United States dollars (USD) from the ones in native
currencies. The average return of the indexes in USD was 12.7% and the average exchange
rate yearly change was -4.2%, in the period of study. However, the exchange rates volatilities were lower than the stock markets volatilities, 11.4% and 29.3% average yearly standard
deviation, respectively.
8
The Sharpe ratio shows the same pattern as the daily returns. The Sharpe ratio, proposed by Sharpe [1966] and redefined in Sharpe [1994], is the ratio between the expected risk
premium and its standard deviation, E(Rt − Rft )/σ(Rt − Rft ).
40
Revista de Administración, Finanzas y Economı́a
e) The parameter τ is equal to 261. The parameter is usually interpreted
as the size of a hypothetical sample drawn from the prior distribution.
Here, the number corresponds to the daily observations in a year on
average.
f) The covariance matrix Ω is equal to Σ̄(ν − N − 1) where Σ̄ is its sample
counterpart, the covariance matrix from the excess return during the
year 1998. 9
g)The parameter N is equal to 15, the number of assets.
h)The parameter ν is 30, the degrees of freedom in the Wishart distribution
and a large value to make the prior of Σ informative and reflect the confidence about Ω. 10
2.2. Black-Litterman updating
In order to use BL as a stress testing tool, we consider the market from the
presample period. Because, we did not have information for a world sample
of stock indexes for the period, we took two approximations: the MSCI World
Index (MSWO) and the ex-post optimal risky portfolio during the presample
period (PRESAM), given the observed returns vector and covariance matrix.
MSWO is a index of more than 1,500 stocks from 24 developed economies. The
stock indexes here are an incomplete sample of stock indexes, slightly bias to
emerging economies. The prior views were from the stress testing scenario, the
1998 covariance matrix and 2000 observed return. Given that there is not a
consensus in the literature about the scale parameter τ , we analyze the forecast
behavior as a function of it.
3. Analysis
3.1. Bayesian Markowitz updating
The assumption of conjugate priors overstates the expected volatility, see Figure
4, which is larger than the one observed in the 2008-2010 period. However,
the observed return in 2008 was lower than the expected return, which was
comparable to the one in 2009.
From Figure 4, the portfolio expected return and the 2008 observed one
are increasing with τ , but the 2009 and 2010 observed returns are decreasing
with τ . From Figure 5, the expected portfolio VAR is increasing with τ , but
the 2008, 2009 and 2010 observed ones are smaller at 600, 570 and 510 days,
respectively, using intervals of 30 days for estimation purposes.
3.2. Black Litterman updating
The selection of the scale parameter τ can be critical for the resulting asset
allocation. The optimum portfolio composition is highly dependent on it. For
example, in the case of the MCWO benchmark, there is a large portfolio reallocation when τ changes from 0.1 to 0.15. As a result, the return and the risk
incurred can change dramatically, see Figures 6 and 7. In the MCWO benchmark case and a small τ , the return and the VAR are small, the expected and
9
10
Given that
Σ is distributed IW (Ω, ν),the prior mean of Σ̄ is Ω/(ν − N − 1).
ν > N + 1.
The Wishart distribution exists if
Value at risk and return from the use of Bayesian...
41
the observed ones during the 2008-2010 period; even though, the expected and
the observed ones in the year 2008 are larger than the ones in the years 2009
and 2010. This relation will change with τ larger than the critical point, the
expected return and observed ones for 2008 will be larger than the 2009 and
2010 returns. At large τ , the return differences subside.
Changes are also observed in the presample benchmark case at a critical
point. There is also a large change in asset allocation; however, it happens when
τ changes from 0.55 to 0.65. At this critical point, the VAR increases dramatically, then it subsides, see Figure 9. Before the critical point, the expected
return and the observed one during 2008 were smaller than the observed ones
during the years 2009 and 2010, see Figure 8. At the critical point, the relation
changes and continues for a while: the expected return and the observed one
during 2008 are smaller than the observed ones during the years 2009 and 2010.
However, at large τ , the return differences between periods diminish and the
expected return and the observed one in 2008 become smaller than the ones in
2009 and 2010.
3.3. Comparing methods
Table 2 compares differences between the forecasted Sharpe ratio and the observed one in different years with a conservative τ , that is, in the Bayesian
Markowitz method, at τ = 240 days, in BL, at τ close to zero (0.1 and 0.05,
with the MCWO Index and the optimal portfolio in the presample period as
benchmarks, respectively) or with τ equal to one. We observed that the most
consistent forecast is with the MCWO Index as market and τ equal to 0.1. The
forecast with the presample index as market was not as consistent during the
2008 and 2010 period. In BL, a small τ gave optimistic forecasts, the observed
differences were always negative. A τ equal to one gave pessimistic forecasts,
the observed differences were all positive. The BM method was not consistent,
in 2008, it was optimistic and, in 2009 and 2010, it was pessimistic.
4. Conclusions
Black Litterman portfolio optimization can be useful to obtain an asset allocation that it is little sensible to changes in the stock market if the benchmark
is a stock index. If the stock market recovers, the Black Litterman allocation
also recovers, but it also suffers in bad times. There are small differences in
allocation, risks and rewards if the market proxy is the MSWO index or the
presample ex-post optimal portfolio in the analysis of the 2008-2010 period.
Bayesian updating with conjugate priors in a Markowitz model can overestimate the forecasted VAR. However, the resulting asset allocation can be
useful to manage VAR and return as we observed during the 2008-2010 period
with a buy and hold strategy. Bayesian Markowitz portfolio optimization and
Black Litterman portfolio optimization are sensible to the scale parameter τ ,
particularly the last method mentioned. Black Litterman portfolio optimization
shows strong changes in asset allocation close to a critical scale parameter value
and jumps in VAR and return. This value can be small, as in the MSWO case.
If BL is used, the selection of the scale parameter demands special care.
42
Revista de Administración, Finanzas y Economı́a
5. References
Bade, Alexander, Gabriel Frahm, and Uwe Jaekel (2009). A general approach
to bayesian portfolio optimization. Mathematical Methods of Operations
Research, Vol. 70, No.2, pp. 337356.
Bernstein, Dennis (2005). Matrix Mathematics. Princeton University Press.
Black, Fischer and Robert Litterman (1991). Asset allocation: combining
investor views with market equilibrium. Journal of Fixed Income, Vol.
September, pp. 718.
Black, Fisher and Robert Litterman (1992). Global portfolio optimization.
Financial Analysts Journal,Vol. 48, No. 1, pp 16.
Carhart, M. (1997). On the persistence in mutual fund performance. Journal
of Finance,Vol. 52, No.1, pp. 5782.
Fama, E. F. and K. R. French (1993). Common risk factors in the return of
stocks and bonds. Journal of Financial Economics, Vol. 33, No. 1, pp.
356.
Giacometti, Rosella, Marida Bertocchi, Svetlozar T. Rachev, and Frank J.
Fabozzi (2007). Stable distributions in the Black-Litterman approach to
asset allocation. Quantitative Finance, Vol. 7, No. 4, pp. 423433.
Hall, Robert E. (2010). Why does the economy fall to pieces after a financial
crisis? Journal of Economic Perspectives, Vol. 24, No. 4, pp. 320.
Idier, Julien (2011). Long-term vs. short-term comovements in stock markets:
the use of markov-switching multifractal models. European Journal of
Finance, Vol. 17, No. 1, pp. 2748.
Jinjarak, Yothin and Huanhuan Zheng (2010). Financial panic and
emerging market funds. Applied Financial Economics, Vol. 20, No. 23,
pp. 17931805.
Jo, S., S. W. Kim, and T. J. Park (2004). Equally constrained affine projection algorithm,. In Conference Record of the Thirty-Eighth Asilomar
Conference on Signals, Systems and Computers, Vol. 1, pp. 955959.
Kooli, Maher and Margaux Selam (2010). Revisiting the Black-Litterman
model: The case of hedge funds. Journal of Derivatives & Hedge Funds,
Vol. 16, No. 1, pp. 7081.
Krishnamurthy, Arvind (2010). How debt markets have malfunctioned in the
crisis. Journal of Economic Perspectives, Vol. 24, No. 1, pp. 328.
Lintner, J. (1965). The valuation of risky assets and the selection of risky
investments in stock portfolios and capital budgets. Review of Economics
and Statistics, Vol. 47, pp. 1337.
Markowitz, Harry M. (1952). Portfolio selection. Journal of Finance, Vol. 7,
pp. 7791.
Martellini, Lionel and Volker Ziemann (2007). Extending Black-Litterman
analysis beyond the mean-variance framework. Journal of Portfolio Management, Vol. 33, No. 4, pp. 3344.
Meucci, Attilio (2009). Enhancing the Black and Litterman and related approaches: Views and stress-test on risk factors. Journal of Asset
Management, Vol. 10, No. 2, pp. 8996.
Nardari, F. and J.T. Scruggs (2007). Bayesian analysis of linear factor models
with latent factors, multivariate stochastic volatility. Journal of Financial
& Quantitative Analysis, Vol. 42, No. 4, pp. 857892.
Value at risk and return from the use of Bayesian...
43
Svetlozar Rachev, John S.J. Hsu, Biliana S. Bagasheva, and Frank J. Fabozzi
(2008). Bayesian Methods in Finance. John Wiley & Sons, Inc., Hoboken,
New Jersey.
Howard Raiffa and Robert Schlaifer (1961). Applied Statistical Decision Theory. Division of Research, Graduate School of Business Administration,
Harvard University, Cambridge, Ma.
Satchell and A. Scowcroft (2000). A demystification of the Black-Litterman
model; managing quantitative and traditional portfolio construction. Journal of Asset Management, Vol. 1, No. 2, pp. 138150.
Sharpe, William F. (1964). Capital asset prices: A theory of market equilibrium under conditions of risk. Journal of Finance, Vol. 19, pp. 425442.
Sharpe,William F. (1966). Mutual fund performance. Journal of Business,
Vol. 39, No. 1,pp. 119138.
Sharpe, William F. (1994). The Sharpe ratio. Journal of Portfolio Management, Vol. 21, No. 1, pp. 4958.
Zhou, Guofu (2009). Beyond Black-Litterman: Letting the data speak. Journal of Portfolio Management, Vol. 36, No. 1, pp. 3645.
44
Revista de Administración, Finanzas y Economı́a
Value at risk and return from the use of Bayesian...
45
46
Revista de Administración, Finanzas y Economı́a
Value at risk and return from the use of Bayesian...
47
48
Revista de Administración, Finanzas y Economı́a
Value at risk and return from the use of Bayesian...
49
Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and
Economics), vol. 5, núm. 1 (2011), pp. 50-64.
Estimación del residual de un bono respaldado por
hipotecas mediante un modelo de riesgo crédito:
una comparación de resultados de la teorı́a de
cópulas y el modelo IRB de Basilea II en
datos del mercado hipotecario mexicano
Arturo Cortés Aguilar
∗
Recibido 10 de agosto de 2010. Aceptado 12 de octubre de 2010
Resumen
El residual en un bono respaldado por hipotecas, tiene impacto en la calificación
de la emisión, por lo que debe reflejar el riesgo de crédito de la estructura
financiera. Se propone el uso de un enfoque de riesgo crédito para su estimación
como la pérdida no esperada de las hipotecas que respaldan al bono a través de
la aplicación de la teorı́a de cópulas, se presenta la comparación de los resultados
obtenidos de la cópula t-Student, cópula Normal, cópula Gumbel, del modelo de
capital económico para cartera hipotecaria de Basilea II y del residual real del
bono, mostrando que se obtienen estimaciones inferiores al aplicar los modelos
de cópulas que el análisis de escenarios empleado en la definición del residual
del bono.
Abstract
Residual tranche in a mortgage backed security is a determinant issue in its
grade and it should show the credit risk profile. I propose residual tranche
estimation in a credit risk view with the application of copula theory to calculate
unexpected losses in the collateralized mortgages. The comparison of results
between t-Student copula, Normal copula, Gumbel copula, Basel II economic
capital model and the residual tranche in a Mexican MBS show that residual
as economic capital estimated with copula implementation are less than the
scenario analysis that had defined that tranche in the structure. Keywords:
Mortgage backed security, credit risk, copula theory, Basel II.
Clasificación JEL : G21, G32.
Palabras clave: Bono respaldado por hipotecas, riesgo crédito, teorı́a de cópulas, Basilea II.
∗
Programa Doctoral en Ciencias Financieras. Tecnológico de Monterrey, Campus Ciudad
de México. E-mail: artur [email protected]. Tel: 55282493.
Estimación del residual de un bono respaldado por hipotecas...
51
1. Introducción
En el mercado mexicano, el originador de los créditos hipotecarios recurre a
la estrategia de bursatilización traspasando activos crediticios a un fideicomiso
con la finalidad de obtener más recursos para generar nuevos préstamos, al
respecto, los agentes estructuradores están enfocados en resolver el problema
de la falta de liquidez de los originadores de los créditos hipotecarios, más que
en establecer juicios respecto al uso óptimo del capital, si se considera a la
misma estructura como una entidad financiera, resultando en residuales que
pueden sobre o sub valorar el riesgo de crédito de la estructura de acuerdo a lo
que reflejarı́a un modelo de estimación de pérdidas esperadas y no esperadas,
derivado de este hecho, este trabajo de investigación tiene por objetivo mostrar
que el uso de los modelos aquı́ empleados disminuyen el requerimiento de capital
o residual de la estructura comparado con lo que se obtiene con el análisis de
escenarios empleado en la práctica, el beneficio de esta disminución en la porción
subordinada de la estructura permitirá un incremento en la porción de bonos
emitidos.
2. Riesgo crédito en bonos respaldados por hipotecas
Los originadores de créditos recurren a la venta de sus activos hipotecarios
para la emisión de bonos y ası́ obtener recursos financieros y emplearlos para
originar más créditos, dicho mercado ha sido el que más ha entrado en el negocio
de la bursatilización. En una estructura de bursatilización, la porción que no
forma parte de los bonos emitidos y constituye parte del capital del fideicomiso,
funciona como una porción de seguro contra incumplimiento en los pagos de los
créditos, esto significa que es la parte que absorbe las pérdidas y generalmente
es posesión del cedente, esto quiere decir que como el cedente ya recibió el valor
de los créditos al momento de la transferencia para la originación de nuevos
créditos, con excepción de esa proporción, tiene un cambio en su exposición al
riesgo crédito y este cambio se refleja en un menor requerimiento de capital en su
balance general, sin embargo tiene la desventaja de tener un activo subordinado,
el cual regresará a formar parte de su balance en el caso de que se cumplan
las siguientes dos condiciones: los bonos emitidos deben estar completamente
pagados y las pérdidas realizadas sean menores que el residual.
El riesgo de incumplimiento de un bono respaldado por hipotecas resulta
de una omisión de pagos del suficiente número de acreditados que impidan el
cumplimiento del pago del cupón a los inversionistas, es decir, que la amortización de los créditos hipotecarios no es suficiente para afrontar el compromiso
adquirido en la emisión del bono, este riesgo es absorbido por el residual y el
papel que desempeña en la estructura impacta en la calificación del bono por
lo que el residual debiera ser establecido por el riesgo crédito de los colaterales,
comprometiendo los flujos de acuerdo a la subordinación definida siguiendo los
criterios que marcarı́a un agente calificador para el efecto de un alto grado
de inversión, en este negocio el originador que se queda con el residual, visto
como un inversionista que compra una nota subordinada no calificada, estarı́a
dispuesto a obtener el diferencial entre las pérdidas esperadas y las pérdidas
realizadas o cero en el escenario extremo.
Dentro de una institución financiera, este riesgo se cubre mediante una
porción de capital que se mantiene de acuerdo a las pérdidas potenciales surgidas
52
Revista de Administración, Finanzas y Economı́a
por los factores que afectan a las transacciones realizadas por las instituciones,
esto es, la pérdida esperada (EL), la cual se puede considerar como una prima
de riesgo 1 y está en función los siguientes tres factores: una porción de pérdida
realizada que es determinada por la experiencia del originador del portafolio y
que es conocida como pérdida dado que la contraparte incumplió (LGD), de
la probabilidad de que la contraparte caiga en incumplimiento (P D) y de la
exposición a un evento de incumplimiento (EAD), mientras que la cantidad
de capital necesario para proteger o respaldar a un portafolio de créditos es
un estimado de la máxima pérdida posible en una ventana de tiempo de un
año a un determinado nivel de confianza menos la pérdida esperada, es decir,
U Lα = (Qα EL), donde Qα es el α-cuantil de la distribución de pérdidas y U Lα
es la pérdida no esperada. Básicamente, la noción de modelar el riesgo crédito,
se debe a la necesidad de una protección contra pérdidas, esto es, la estimación
de una prima por riesgo para cada crédito y administrarlas dentro de una cuenta
interna llamada reservas por riesgo crédito, estas reservas tendrán la función
de cubrir las pérdidas ocasionadas por incumplimiento en los créditos; en este
sentido, el capital económico tiene la función de proporcionar cierta protección
en los eventos en los que la estimación del riesgo crédito sea excedida por otra
pérdida.
En general, si en un portafolio de créditos se establece que ocurre una
pérdida cuando el valor de los activos Xi de la contraparte cae por debajo de
un umbral ui establecido, se tiene lo siguiente:
pi = P [Xi < ui ] = N (ui )ui = N −1 [pi ]
(1)
Es decir, si se define que el evento de incumplimiento ocurre cuando el rendimiento de los activos del acreditado es menor a cierto umbral y además si se
establece que este rendimiento está sujeto a riesgo sistemático y riesgo idiosincrásico o especı́fico, se puede establecer la siguiente relación:
p
√
Xi = ρY + 1 − ρZi
(2)
donde X representa a un conjunto de variables aleatorias con distribución conjunta normal estándar y correlaciones ρ e Y , y Z1 , Z2 , ..., Zn son variables
normal estándar mutuamente independientes y se refieren a factores de riesgo
común y riesgo especı́fico, respectivamente.
√
√
Por lo tanto, el incumplimiento ocurre si ρY + 1 − ρZi < ui , equiva√
√
lentemente ρY + 1 − ρZi < N −1 [pi ], es decir, el incumplimiento ocurre si y
sólo si:
p
√
Zi < (N −1 [pi ] − ρY )/ 1 − ρ
(3)
Considerando que Zi es una variable normal estándar, el evento de incumplimiento ocurre con probabilidad condicional:
−1
√ N [pi ] − ρY
√
pi (Y ) = P [Li = 1|Y ] = N
(4)
1−ρ
1
Esto se debe a que la pérdida esperada, de acuerdo a los mejores estimados de las
instituciones, puede ser equivalente a la misma cantidad de recursos que éstas mantienen
como protección, es decir, como un seguro contra incumplimiento.
Estimación del residual de un bono respaldado por hipotecas...
53
Estableciendo que para un portafolio con m créditos, la exposición total
se incrementa a medida de que el número de individuos se incrementa y que
cada exposición individual se diluye a medida de que el tamaño del portafolio
tiende a infinito es suficiente para garantizar que en el lı́mite, la pérdida total
del portafolio Lm y la esperanza condicional de la pérdida E[Lm |Y ] son iguales
a.s. tal que:
P limm→∞ (Lm − E[Lm |Y ]) = 0 = 1
(5)
cuando
m
X
EADi ↑ ∞ si m → ∞
(6)
√ N −1 [pi ] − ρY
√
→ p(Y ) = N
a.s.
1−ρ
(7)
i=1
Ası́ cuando m → ∞:
Lm
Ahora, si se tiene que P [L ≤ x] = P [p(Y ) ≤ x], se sigue que:
P [L ≤ p(−qα (Y ))] = P [p(Y ) ≤ p(−qα (Y ))]
= P [Y ≥ −qα (Y )]
= P [−Y ≤ qα (Y )]
donde Y ∼ N (0, 1) y qα es el α-cuantil de la distribución normal estándar. Por
lo tanto, se tiene que:
−1
√
N [pi ] − ρqα Y
√
qα (L) = p(−qα (Y )) = N
(8)
1−ρ
De la expresión anterior se desprende el modelo de capital económico de Basilea
II considerando la severidad de la pérdida (LGD) y la pérdida esperada como
P ixLGD a un cuantil del 99.9%, teniendo ası́:
0.5
R
K = LGD×N (1−R)−0.5 ×G(Pr )+
×G(0.999) −Pr ×LGD (9)
1−R
siendo
K =requerimiento de capital
Pr =probabilidad de incumplimiento
X =exposición
LGD =Pérdida dado que hubo incumplimiento o severidad de la pérdida
R =Coeficiente de correlación, establecida en 0.15 para préstamos hipotecarios
N (x) : Denota la función de distribución acumulativa Normal estándar.
54
Revista de Administración, Finanzas y Economı́a
G(z) : Denota la función de distribución acumulativa inversa para una variable
aleatoria Normal estándar.
La expresión anterior proporciona como resultado el capital económico para
cubrir pérdidas no esperadas, al percentil 99.9%.
3. Cópulas
La teorı́a de cópulas es el fundamento de modelos de riesgo crédito tal como
los basados en calificaciones internas (BIS, 2006) y otros modelos estructurales
derivados del modelo de Merton (1974), (Vasicek 2002), sin embargo, una caracterı́stica principal de dichos modelos es el supuesto de un solo factor de riesgo
sistemático (ASRF, por sus siglas en Inglés). Puesto que la estructura de dependencia que se trata de capturar a través del modelo de cópula Gaussiana, se
obtiene de la correlación entre los activos de las entidades bajo estudio, surge
la necesidad de retomar los fundamentos de esta teorı́a para extender a otros
factores de riesgo cuando no es posible observar la variable de activos, más
aún, cuando se desea considerar la existencia de eventos extremos, los cuales
no pueden ser modelados bajo el escenario de normalidad.
En varios campos de estudio, el uso de cópulas ha sido una herramienta
muy útil para el análisis de dependencia entre vectores aleatorios que tienen
una función de distribución conjunta, la cual está definida por las distribuciones marginales de cada uno de los vectores considerados, particularmente en
riesgo crédito, los nuevos enfoques para valuación de activos financieros sujetos a
riesgo de incumplimiento, han mostrado mejores resultados empleando cópulas
para obtener la estructura de dependencia entre dos eventos de incumplimiento
conjunto (Li, 2000) para la valuación de derivados de crédito, estimación del
requerimiento de capital o pérdida no esperada (Gordy 2003) y para una colocación eficiente de capital mediante el estudio de la dependencia de ı́ndices de
mercado (Cherubini y Luciano, 2000), entre otras aplicaciones.
Una Cópula n-dimensional es una función de distribución multivariada con
distribuciones marginales estándar C : [0, 1]d → [0, 1], es decir, una función de
n dimensiones que mapea desde el cubo unitario de n dimensiones al intervalo
unitario y que está caracterizada por las siguientes tres propiedades:
1. C(u1 , u2 , ..., ud) es creciente en cada componente ui .
2. C(1, ..., 1, ui, 1, ...1) = ui para cada i ∈ {1, 2, .., d} y ui ∈ [0, 1].
3. Para cualesquiera (a1 , a2 , ..., ad), (b1 , b2 , ..., bd) ∈ [0, 1]d con ai ≤ bi se
tiene:
2
2
X
X
...
(−1)i1 +i2 +...+id C(u1i1 , udid , ..., udid ≥ 0
i1
i1
con uj1 = aj y uj2 = bj para todo j ∈ {1, 2, .., d}.
Ası́, si se supone un vector aleatorio X = (X1 , X2 , .., Xd)0 con distribución
conjunta F y marginales continuas F1 , F2 , ..., Fd aplicando una transformación
adecuada se obtiene un vector de la forma (F (X1 ), F (X2 ), ..., F (Xd)) cuya
función de distribución es por definición una cópula, la cual se denota por
C, lo anterior queda establecido mediante el teorema de Sklar (Nelsen, 2006).
Teorema de Sklar. Sea H una función de distribución n-dimensional con
marginales F1 , F2 , ..., Fn, entonces existe una cópula C n-dimensional tal que
para todo x ∈ Rn ,
Estimación del residual de un bono respaldado por hipotecas...
H(x1 , x2 , ..., xn) = C(F1 (x1 ), F2 (x2 ), ..., Fn(xn ))
55
(10)
Si F1 , F2 , ..., Fn son continuas, entonces C es única, de lo contrario C está
definida únicamente sobre Ran F1 × Ran F2 × ... × Ran Fn .
Recı́procamente, si C es una cópula n-dimensional y F1 , F2 , ..., Fn son funciones de distribución, entonces la función H definida en (10) es una función de
distribución n-dimensional con marginales F1 , F2 , ..., Fn.
3.1 Cópula t-Student
Ésta Cópula es estudiada con gran detalle en Demarta y Mcneil (2004) donde
se definen algunas variantes importantes como la cópula t-Student agrupada y
la de valores extremos, esto debido a la habilidad de la cópula t de capturar
mejor el fenómeno de dependencia de valores extremos, la cópula t-Student está
definida mediante la expresión (11):
−1
t
Cv,P
(u1 , u2 , ..., ud) = tv,P (t−1
v (u1 ), ..., tv (ud ))
(11)
En la expresión (11) anterior, t−1
v es la inversa de la distribución t-Student
univariada o función de cuantiles, mientras que tv,P es la distribución t-Student
multivariada con v grados de libertad, media cero y matriz de correlaciones P ,
la cual se define como:
td (v, 0, P ) =
Z
t−1
v (u1 )
...
−∞
Z
t−1
v (ud )
−∞
Γ( v+d
2 )
Γ( v2 )
v+d
2
X 0 P −1 X
1+
dX
v
(12)
donde X = (X1 , X2 , ..., Xd)0 es un vector aleatorio de mezcla normal en varianza
definido como:
√
Xd = µ + W Z
(13)
donde Z ∼ Nd (0, Σ), W es independiente de Z y satisface v/W ∼ χ2v , equivalentemente W tiene distribución gamma inversa W ∼ Ig (v/2, v/2).
Para el caso particular de dos factores de riesgo o dos variables aleatorias
de interés con distribuciones marginales t-Student, la cópula t-Student bidimensional, está definida mediante la distribución t-Student bivariada:
t
C (u; θ) =
Z
tθ1 (u1 )
−∞
Z
tθ2 (u2 )
−∞
−θ12+2
(1 − θ22 )−1/2
s2 − 2θ2 st + t2
1+
dsdt (14)
2π
v(1 − θ22 )
donde u = (u1 , u2 ), θ = (θ1 , θ2 ) y θ1 son los grados de libertad, el cual controla
el peso de la cola y si θ1 → ∞,
C t (u1 , u2; θ1 , θ2 ) → ΦN (u1 , u2 ; θ2 ),
θ2 es el parámetro de dependencia o correlación.
56
Revista de Administración, Finanzas y Economı́a
3.2 Cópula Normal
Una de las cópulas más usadas en finanzas es la cópula normal, el modelo de
calificaciones internas de BASILEA II (BIS, 2006) se fundamenta en el supuesto
de un solo factor de riesgo sistemático (ASRF por sus siglas en inglés), mismo
que se distribuye normal con media cero y varianza uno. La cópula normal se
define como:
−1
−1
CPn (u1 , u2 , ..., ud) = ΦP (Φ−1
P (u1 ), ΦP (u2 ), ..., ΦP (ud ))
(15)
donde Φ es la distribución normal multivariada estándar, Φ−1 la distribución
normal univariada estándar inversa, P es la matriz de correlaciones con 1 en la
diagonal y ρ (la correlación del vector ui fuera de la diagonal, ası́ para el caso
bivariado, la expresión (15) toma la forma siguiente:
t
C (u1 , u2 ) =
Z
Φ−1 (u1 )
−∞
Z
Φ−1 (u2)
−∞
x2 − 2ρxy + y2
exp −
dxdy (16)
2(1 − ρ2 )
1 − ρ2
1
2π
p
3.3 Cópula Gumbel
La cópula Gumbel es la más común de las cópulas de valores extremos y está
definida mediante la expresión:
CαG(u1 , u2 )
1/α α
α
= exp − (ln(u1 )) + (ln(u2 ) )
(17)
para α ∈ [1, +∞].
El parámetro α controla el grado de dependencia y cuando es igual a uno,
la dependencia no existe, si α = +∞ hay dependencia perfecta.
3.4 Cópula empı́rica
Las cópulas empı́ricas son empleadas para realizar pruebas de independencia
no paramétricas y para la estimación no paramétrica de cópulas.
Sean u1 ≤ u2 ≤ ... ≤ un y v1 ≤ v2 ≤ ... ≤ vn los estadı́sticos de orden
de muestras univariadas de la cópula C, la cópula empı́rica Ĉ se define en los
puntos (i/n, j/n) por:
n
i j
1X
Ĉ
,
=
I{uk ≤ui ,vk ≤vj }
(18)
n n
n
k=1
para i, j = 1, 2, ..., n.
Ası́ mismo, Ĉ converge uniformemente a C, cuando el tamaño de la muestra
tiende a infinito.
La cópula empı́rica de frecuencia ĉ está dada por la siguiente expresión:
1
i j
si (ui , vi ) son elementos de la muestra
ĉ
,
= n
(19)
n n
0
en cualquier otro caso
Estimación del residual de un bono respaldado por hipotecas...
57
4. Resultados
Se analiza un bono respaldado por hipotecas a través de la aplicación del modelo de calificaciones internas básico (BIS, 2006) y la teorı́a de cópulas a los
créditos hipotecarios que respaldan dicha estructura financiera, estimando el
residual mediante un nivel de capital económico (U Lα ) resultado de ambos
modelos. Para estimar los parámetros de riesgo crédito del portafolio, éste se
segmentó mediante la técnica de árboles de segmentación basados en pruebas
χ2 (CHAID), para esto se consideró la razón valor de la garantı́a a monto
financiado (LT V ) en el momento de la originación del crédito y de acuerdo con
Kaskowitz et al (2002), se consideró una ventana de 5 años para observar el
incumplimiento, mismo que ocurre si los créditos que tenı́an un atraso igual o
menor a 3 meses al inicio del periodo de observación, al final de 5 años tienen más
de tres meses de atraso, esta segmentación se realizó en el paquete estadı́stico
SPSS y los grupos resultantes se muestran en el cuadro 1.
Cuadro 1. Grupos y probabilidad de incumplimiento
resultado de la prueba CHAID.
Posterior a la segmentación, se construyeron las curvas de tasas de incumplimiento históricas por grupo, considerando el incumplimiento con atraso
en el pago mayor a 3 meses en un año, esta estimación es consistente con la
probabilidad de incumplimiento anual que se obtiene en los métodos de calificaciones internas. En la práctica, el indicador de incumplimiento es 3 pagos
atrasados o más, en el caso especı́fico de este trabajo, se empleará superior a
3 considerando un mayor periodo de observación antes de definir a un crédito
con estatus de incumplimiento. Ası́, el incumplimiento está definido por:
Îit =
n
X
1Dit
(20)
i=1
donde
1Dit =
1 si atraso mayor a 3 meses
0 si atraso menor a tres meses
(21)
Dado lo anterior, la tasa de incumplimiento está definida como la razón de
incumplimientos a total de observaciones de acuerdo a lo siguiente:
58
Revista de Administración, Finanzas y Economı́a
T it =
Iˆit
Nt
(22)
donde Tit es la tasa de incumplimiento observada en el periodo t y Nt el número
total de créditos hipotecarios (vigentes y vencidos).
La composición de la estructura de bursatilización se muestra en el cuadro
2, la primera estimación se realizó mediante simulación histórica de las pérdidas
obteniéndose la pérdida esperada, pérdida no esperada, α-cuantil y déficit esperado (P E, U Lα , Qα , ESα respectivamente) en lo que respecta al U Lα , α-cuantil
y al ESα , se obtuvieron para α = 99.9% que es el equivalente a la calificación
BBB en escala global de un bono y también a manera de comparación se presentan valores de 99% y 99.5%, el residual va a estar definido mediante el resultado
del α-cuantil menos la pérdida esperada, dado que la tasa activa 2 de un crédito
incluye la estimación de este tipo de pérdida como un costo a ser cubierto, este
resultado es el concepto de capital económico, estos resultados se muestran en
el cuadro 3.
Cuadro 2. Composición actual de la estructura de bursatilización.
* La exposición es la proporción del saldo del grupo respecto al total.
Dentro del enfoque regulatorio y de mejores prácticas bancarias, la correlación en el modelo de Basilea II es un parámetro exógeno establecido, para el
caso de créditos hipotecarios este valor es 0.15 y la probabilidad de incumplimiento se puede obtener mediante un modelo que asigne una calificación o
probabilidad de acuerdo a ciertas caracterı́sticas de segmentación, la severidad
de la pérdida puede ser obtenido también mediante un modelo estadı́stico o
puede considerarse como un parámetro establecido de acuerdo a si se trabajará
bajo el enfoque avanzado o estándar, respectivamente. En este caso, se empleará la probabilidad promedio de cada grupo de segmentación como insumo
para el modelo de capital económico; la severidad se considera un parámetro
constante en 50%. Adicionalmente, se incrementa el supuesto de correlación
entre incumplimientos para obtener una estimación más severa de la pérdida
no esperada, es decir, se prueba con una correlación de 0.20 para probar los
resultados del modelo con el supuesto del 0.15.
2
En términos generales, la tasa activa podrı́a definirse como la tasa de interés que cobra
una institución al financiar a una contraparte, la cual incluye el costo de financiamiento de
la institución, el riesgo crédito, un margen financiero, entre otros conceptos.
Estimación del residual de un bono respaldado por hipotecas...
59
Cuadro 3. Resultados de la simulación histórica.
Cuadro 4. Parámetros para la expresión (1)
*El nombre del escenario no tiene relación con calificaciones crediticias.
Los resultados del modelo de BASILEA II de acuerdo a los parámetros
del cuadro 4, son mostrados en el cuadro 5, para el escenario KB1 significan el
empleo de una probabilidad promedio a 5 años resultado del cuadro 1 y una
correlación de 0.20, mostrando que la estimación del capital económico bajo
estos supuestos es mayor que con los parámetros establecidos del modelo de
Basilea II (expresión (9)) para un cuantil del 99.9%, el valor resultante del
promedio ponderado por exposición de cada grupo de riesgo es de 23.3% menor
que el bono bajo análisis que fue emitido con un residual igual al 27.9% de
toda la estructura, el cual está respaldado por hipotecas a 30 años y formado
por un tramo senior, un tramo subordinado y el residual que tiene la menor
subordinación en la estructura.
Cuadro 5. Estimación del residual por el modelo de
Basilea II, expresión (1) con parámetros de acuerdo al cuadro 4.
El análisis siguiente que se presenta, se desarrolló con el sistema estadı́stico
de libre acceso R (Develompent Core Team, 2010), empleando el paquete cópula
(Kojadinovic y Yan 2010) y de acuerdo a la teorı́a expuesta en la sección 3,
60
Revista de Administración, Finanzas y Economı́a
se tiene como primer caso la estimación paramétrica de la cópula t-Student
bivariada, que como ya se comentó en dicho apartado, supone que las marginales
univariadas son t-Student con v grados de libertad, por lo que es preciso estimar
los parámetros de la cópula (α) y de las marginales (β) de la expresión (14),
partiendo de la misma, la expresión de log-verosimilitud es la siguiente:
l(θ) = log(c(t1 (Xi , β), t2 (Xi , β); α) +
n X
2
X
log(tj (Xi , β))
(23)
i=1 j=1
donde θ(β T , αT )T es el vector de parámetros a ser estimados y el estimador de
máxima verosimilitud está dado por θ̂M L = arg maxθ∈Θ l(θ).
Figura 1. Panel de grupos de Ti y EAD. Densidades de las cópulas ajustadas.
La estimación de los parámetros de las cópulas y las marginales es un
proceso numérico complicado si se quiere llevar a cabo en un solo paso, por
lo que se implementó máxima verosimilitud en dos etapas, es decir primero se
estiman los parámetros de las marginales t-Student y en una segunda etapa se
estiman los parámetros de la cópula t-Student bivariada para los 5 pares de
variables Ti y EAD, las densidades de las cópulas ajustadas se muestran en
la figura 1, misma que muestra colas más pesadas para la cópula del par Ti
y EAD que representa al total del portafolio de créditos hipotecarios (grupo
Total).
Teniendo ajustada la cópula a los datos, se procede a simular las pérdidas
históricas y a obtener la pérdida esperada (P E), pérdida no esperada (U Lα ),
Estimación del residual de un bono respaldado por hipotecas...
61
para cada uno de los pares de variables T ii , EADi de acuerdo a lo visto en la
sección 3. Estos valores se estimaron para los cuantiles 95% que es el cuantil
al que se define el V aR, al 99.9% que es la probabilidad a la cual se asigna la
calificación BBB en escala global a un bono, también a manera de comparación
se consideran 99% y 99.5%.
Cuadro 6. Pérdida esperada para los grupos de Ti y EAD y pérdida
no esperada a diferentes cuantiles para la cópula t-Student paramétrica.
Como segundo caso, se lleva a cabo la estimación semi-paramétricamente
de las cópulas t-Student, Normal y Gumbel, de acuerdo con Neelsen (1999) y
Genests y Favre (2007), dentro del análisis de cópulas se presenta el problema
de subestimación de las marginales ajustadas a los datos bajo estudio, este
problema se minimiza empleando la distribución empı́rica de las marginales,
obteniendo con esto la cópula empı́rica la cual está definida de acuerdo a la
expresión (18), este análisis se refiere a la estimación no paramétrica de cópulas
que de acuerdo a la sección III, dada la continuidad del par de vectores aleatorios
(X, Y ), existe una única cópula asociada a dicho vector la cual es invariante bajo
transformaciones monótonas no decrecientes de las marginales, es decir,
Ĉ(i/n, j/n) → C(X, Y )
cuando n → ∞, ası́ la dependencia entre Ĉ es capturada por la cópula empı́rica
como la mejor representación muestral de la cópula teórica C. En este sentido,
se desarrolla el siguiente análisis mediante la estimación no paramétrica de las
marginales y parámetrica para las cópulas t-Student, normal y Gumbel a los
vectores (T i,EAD).
Cuadro 7. Pérdida esperada para los grupos de Ti y EAD y pérdida
no esperada a diferentes cuantiles para la cópula t-Student semi-paramétrica.
62
Revista de Administración, Finanzas y Economı́a
Cuadro 8. Pérdida esperada para los grupos de Ti y EAD y pérdida
no esperada a diferentes cuantiles para la cópula Normal semi-paramétrica.
Cuadro 9. Pérdida esperada para los grupos de Ti y EAD y pérdida
no esperada a diferentes cuantiles para la cópula Gumbel semi-paramétrica.
Definiendo al residual como el resultado de los modelos analizados para
un cuantil del 99.9% para el caso de las cópulas (U L0.999 ), se obtiene un nivel
inferior al residual real con el que se emitió la estructura de bursatilización que
fue del 27.9%, éste comparativo puede observarse en el cuadro 10, donde los
resultados para las cópulas, son una ponderación entre los niveles de U L0.999
de los cuadros 6 a 9 y el cuadro 2, estos resultados son ligeramente mayores y
por consiguiente más conservadores que los resultados obtenidos por el modelo
de calificaciones internas (BIS 2006), cuyo valor máximo fue de 23.3%. Se
notará que para el caso de las cópulas el resultado no tiene gran variación, esto
indica que los parámetros de riesgo considerados son poco sensibles respecto a
la cópula empleada.
Cuadro 10. Comparativo de estimaciones.
Estimación del residual de un bono respaldado por hipotecas...
63
5. Conclusiones
Los resultados obtenidos muestran que las estimaciones basadas en el modelo
de Basilea II y Cópulas son inferiores al residual real con el que fue emitida
la estructura y que fue estimado mediante análisis de escenarios, esto sugiere
que el empleo del modelo de la agencia calificadora pudiera sobreestimar el
riesgo crédito de la estructura, por lo tanto se considera importante señalar
que el uso de modelos estadı́sticos como los empleados en esta investigación,
permiten disminuir el tamaño del residual o requerimiento de capital empleando
un nivel de confianza de 99.9%, obteniendo aún ası́una sobrecolateralización que
proporcione un desempeño satisfactorio de la estructura, ya que los modelos que
se emplearon en el presente trabajo, utilizan variables estadı́sticas que reflejan el
riesgo crédito de los activos subyacentes de los bonos respaldados por hipotecas.
Una caracterı́stica adicional a analizar es el plazo legal del bono el cual es
superior a los 25 años y la estrategia de realizar pagos anticipados al principal
en los casos donde se presentan excesos de flujos posteriores al pago de los respectivos cupones, disminuye significativamente el plazo de la estructura que de
acuerdo a las caracterı́sticas del escenario base de la proyección de su amortización, puede llegar a ser hasta de 10 años generando un riesgo de prepago, que
se presenta al amortizar anticipadamente el principal del bono cuando las tasas
de reinversión en el mercado son inferiores a la que paga dicho instrumento
financiero. Esta particularidad disminuye el riesgo de crédito del bono respaldado por hipotecas, ya que al amortizar anticipadamente las obligaciones del
fideicomiso, disminuye la exposición que éste tiene ante un eventual incremento
de la tasa de incumplimiento de los activos subyacentes de la estructura en el
futuro, éste efecto de prepago y su efecto en el residual, no se ha analizado a
profundidad de lo que se puede desprender una investigación posterior.
6. Referencias
Artzner, P.; Delbaen, F.; Eber, J. M.; Heat, D. 1999. Coherent measures of
risk. Mathematical Finance.
Bank for International Settlement (BIS). 2006. International convergence of
capital measurement and capital standards. Basel Committee on Banking
Supervision.
Cherubini, U; Luciano, E. 2000. Value at risk trade-off and capital allocation
with copulas. Turin.
Davidson, Andrew; Sanders, Anthony; Wolff, Lan-Ling; Ching, Anne. 2003.
Securitization: Structuring and investment analysis. Wiley.
Demarta, Stefano; McNeil, Alexander J. 2004. The t copula and related copulas. Department of Mathematics ETHZ Zürich.
Frey, Rüdiger; McNeil, Alexander J. 2002. Var and expected shortfall in portfolios of dependent credit risks: conceptual and practical insights.
Frey, Rüdiger; McNeil, Alexander J. 2001. Modeling dependent defaults.
Genest, Christian; Favre, Anne-Catherine. 2007. Everything you always
wanted to know about copula modeling but were afraid to ask. Journal of
Hydrologic Engineering. Pag 347-368.
Gordy, Michael B. 2003. A risk-factor model foundation for ratings-based bank
capital rules. Journal of Financial Intermediation. Pag. 199-232.
64
Revista de Administración, Finanzas y Economı́a
Kojadinovic, Ivan, Yan, Jun. (2010). Modeling multivariate distributions with
continuous margins using the copula r package. Journal of Statistical Software, 34(9), 1-20. URL http://www.jstatsoft.org/v34/i09/.
Kraskowitz, David; Kipkalov, Alexander; Lundstedt, Kyle; Mongo, John. 2002.
Best practices in mortgage default risk measurement and economic capital.
Washington Mutual Inc.
Li, David X. 2000. On default correlation: a copula function approach. The
RiskMetrics Group.
Merton, Robert C. 1974. On the pricing of corporate debt: the risk structure
of interest rates. Journal of Finance. Pag. 449-470.
Nelsen, Roger B. 1999. An introduction to copulas. Springer.
Vasicek, Oldrich Alfons. 2002. The distribution of loan portfolio value.
Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and
Economics), vol. 5, núm. 1 (2011), pp. 65-76.
Capital Investments and real options:
news proposes
Beatriz Mota Aragón
∗
Recibido 25 de mayo de 2010. Aceptado 26 de octubre de 2010
Resumen
La aportación más importante de este trabajo está orientada a la Teorı́a de
Opciones Reales. La investigación sostiene que el Valor Presente Neto (V P N )
es un proceso estocástico. Se sugiere un modelo de opciones reales a través de
un “modelo extendido” de Vasicek y Cox-Ingersoll-Ross (1985) para la tasa de
interés en el V P N , en el cual se consideran variables de control externas (Zt ),
mismas que cambian el curso de los flujos netos de efectivo. El VPN modificado
sugiere un valor presente neto más exacto al valuar V P N (Zt ) + φ, donde φ es
la opción real.
Abstract
The main contribution of this research to directed on Real Option Theory.
Research asserts that Net Present Value (N P V ) is stochastic processes. A
model for the real options is suggest where is constructing a continuous model
for net present value named “Vasicek extended ”and the Cox-Ingersoll-Ross
(1985) model for interest rate is examined. In the model is considering external
control variables (Zt ) which change the N CF course. The modified N P V (Zt )
this gives a more accurate value for valuating V P N (Zt ) + φ, where φ is the real
option.
Clasificación JEL: Finance 0508
Palabras Clave: Capital Investments Theory, Net Present Value, Net Cash Flow, Interest
Rate, Real Options Theory, Options Financial Theory, Stochastic Processes. Asymmetric
Information.
1. Introduction
This research suggested a different point of view about on the real options
theory. The orthodox capital investment theory is considered and thinking
about assumptions the Net Present Value (NPV), such as the assets price follows
a discrete process, or that the interest rate is constant. The research presented
assumptions a different way, at the stochastic processes theory. The work is
proposing a continuous model which explains the Net Present Value (NPV)
random evolution. And their effects on the valuation on the real options theory.
The financial options theory is considered too.
∗
Profesora Titular “C” de Tiempo Completo en la Universidad Autónoma MetropolitanaIztapalapa. E-mail: [email protected].
66
Revista de Administración, Finanzas y Economı́a
The first section presents a real option theory extended review is made and
observed the several fields the action. Second, the fundamental concepts the financial option valuation theory and real option theory are reintroduced. Third,
the capital investment theory is review and proposed a continuous model of
N P V and the real options model later.
The N P V continuous model is defined in the Net Cash Flow (N CF ) with
external control variables (Zt ) with Vasicek model (1977) and the interest rate
with Cox-Ingersoll-Ross model (1985) for determined the interest rate and finally φ is incorporated in the RO.
2. Literature Review
This section expected to show the several works development using real options
theory (Mota, 2006). The methodology developed with the real options was
first applied to investments in natural resources; nevertheless there are applications in other fields such as Research and Development (R&D), Corporate
Strategies, Mergers and Acquisitions (M&A), Innovation and High Technology, Intellectual Property Rights, Interest Rate, Capital Risk, among others,
Schwartz and Trigeorgis (2000). See table 1.
Copeland and Vladimir (2001) stated that real options may be applied on
almost any situation where it is possible to estimate a Net Present Value (NPV)
project. Merton (1988) presents an excellent review showing the ample scope
of applications that the real options theory has had.
Dixit and Pindyck (1995), Amram and Kulatilaka (1999) and Trigeorgis
(1988) provide conceptual arguments to develop real options on capital investment decisions. Other conceptual works are presented by Trigeorgis and Mason
(1987), Brealy and Myers (2000). As well as Merton (1977) and Mason and
Merton (1985) discuss connections among financial options and investment decisions.
Real options quantitative origins derivate form the works on financial options by Black-Sholes (1973) and Merton (1973). And other way, Cox, Ross
and Rubinsteins (1979) study and made possible the use binomial lattices to
evaluate options in discrete time.
Another important work is the one of Geske (1979) who evaluates compound options with differential equations. Kulatilaka and Trigeorgis (1994)
present a model in discrete time to interchange options. Dixit (1992) presents
a discrete model to valuate the expected value. Pindyck (1988) shows in a continuous expected value model using dynamic programming. Dixit and Pindyck
(1994) study the cost function and implication as diffusion processes; also see
Quigg (1993).
Cortazar (1992) makes a simulation and other numerical approximations
to valuate an European real option. Among others, as we can see, there is
an important number of works in real options literature which are focused in
quantitative valuation, the ones mentioned are important for this research.
In the following table we might observe according to their area, some of
the works developed using real options theory.
Capital Investments and real options: news proposes
67
Table 1
Real options: Topics and some Application Areas
Source: Lander y Pinches (1988), Schwartz (2001) y Mota (2006, 2008).
68
Revista de Administración, Finanzas y Economı́a
The review of the literature shown in the table above to show the fact
that real options may be used in several fields related to investment project
evaluation.
3. Fundamental concepts
As well known, the financial option valuation theory was written in the 1970s by
Black-Sholes and Merton (1973), they got a close solution for the equilibrium
price of a call option; since then, hundreds of articles and empirical studies
have been written in this direction and have been linked to the real options
theory. Myers (1977) stated that corporative assets may be seen as growth
options (as a call option) and through this he applies financial options concepts
to real assets. Brabazon (1999) states that the real options concept comes from
financial options research, among others.
A definition accepted for a real option purchase is the right, but not the
obligation of investing, postponing, expanding, contracting or quitting an investment project in the future. This decision has a predetermined cost called
exercise price which will be paid in a determined date and which exists during
the whole option life long (Copeland and Antikarov, 2001). While exercising,
the option utility is the difference between the underlying assets value and the
exercise price, and considering that in general terms real options theory is an
extension of the financial options theory applied to the non-financial real assets
valuation, so to the capital investment (Amram and Kulatilaka, 1999), therefore
we find some adaptations on the parameters to consider the valuation.
The parameters that compose a financial option are:
The underlying asset price Sf , the exercise price K, the underlying volatility σ, the risk-free rate r and the option T − t expiration date.
Table 2
Real and Financial Options Parameter Valuation
Source: Mota (2006). Adapted of Venegas, F. (2006). Riesgos Financieros y
Económicos. Thomson, México. Chapter 69, p. 801.
At the real options language: Sf is the cash flow present value expected in
t; K is the cost at present value of the project investment in t; σ is the project
cash flow volatility; r is the risk-free rate and T −t is the project maturity time.
Capital Investments and real options: news proposes
69
Finally, some methodology advantages are: first, it considers uncertainty,
which to get any type of growth opportunity, diversification or risk (Smith and
Triantis, 1998). Thus an important methodology value is given by the possibility
of according administratives abilities that from the traditional method valuation
perspective of NPV is impossible to evaluate.
Second, real options integrates technological and strategic factors inside a
general valuation model (McGrath and McMillan, 2000), it to make possible
to manage administratives abilities. Third, from the methodological viewpoint
a decision process based on real options offers a systematic approximation to
invest and evaluate in a high uncertainty and competence environment, creating
subsequent investment opportunities, evaluated as cash flows plus a group of
options (Amram and Kulatilaka 1999). Mota (2006).
3.1 Real options versus financial options
For ended, and assuming that the Real Option (RO) takes their base from
the Financial Option (F O) theory, it is important to mention differences between them because they change the RO models mathematical structure. The
F O had been used for periods, while the RO have a recent development. The
RO have a long term life, T − t = years, and the F O have a short term life,
usually T − t = months.
The underlying asset in F O is the asset price; while in RO there is an
infinite variables quantity, in our case they are the net cash flows. Since the
analysis of RO considers physical assets (real), we might be careful at the
underlying variables selection, because the mentioned volatility refers to the
underlying asset.
The OF are regulated, although in theory, stockholders manipulate asset
price for their sake. The RO are created by the enterprise and their decisions
may increase the project value. The F O have relatively got a lower value
(hundreds or thousands dollars per option), while the RO worth thousands,
millions or billions dollars per project (strategic option), Mun (2002).
Both option types may fuse by using similar approximations; close solutions, finite differences; Brennan (1979), partial differential equations; Geske
(1979), binomial and multinomial lattices; Cox, Ross and Rubinstein (1979),
Trigeorgis (1991), Hull and White (1988) and Boyle (1976), who include the
Monte Carlo simulation.
The FO models are based in a formal market, which make assets prices
to be transparent; thus model construction is more objective. The RO are not
negotiated at a formal market and financial information is just available for the
administration, therefore model designing becomes subjective.
Hence, the enterprise assumes the key is to valuate RO not F O. Having a
particular project issued, the enterprise may create strategies that might provide
by themselves future options, whose value could vary depending on how they
are constructed, (Mun, 2002).
In short, fundamental characteristics and differences of RO and F O are
presented in table 3.
70
Revista de Administración, Finanzas y Economı́a
Table 3
Differences between Real Options and Financial Options
Source: Mota (2006, 2008). Adapted from Mun, J. (2002): Real options, Analysis. J. Wiley, USA. Chapter 5, p. 100.
4. Capital investments
Is time to review the capital investment theory and proposing a continuous
model of Net Present Value and the real options model later.
Literature about capital investments may be divided in two groups; the one
formed by independent investment opportunities, situations where investments
considered are substantial and another which includes some models studying
sequential irreversible investments, Pindyck (1988).
Dixit and Pindyck (1994), Dixit (1995), Bertola (1998), Ingersoll and Ross
(1992) were the first ones who considered the stochastic interest rate impact
over investment opportunities. Alvarez and Koskela (2006) extended Ingersoll
and Ross (1992) analysis for different interest rates and uncertain income joints.
The question is: How does this work impact the real options theory? This
research to assume that in order to understand nowadays enterprise problems
we must exclude the orthodox NPV, and it shows the requirement to include
stochastic processes in N CF and N P V valuation.
The principal condemnation to the traditional N P V method is that it
produces a simple estimation, and this is a disadvantage, because the events
that affect cash flow forecasts are highly uncertain; Myers (1987), Trigeorgis
(1993), (Copeland and Vladimir, 2001). Other remarks are in Hayes and Garvin
(1982) and Hayes and Abernathy (1980), who recognize that the N P V criteria
sub estimates investment opportunities.
Capital Investments and real options: news proposes
71
Brennan and Schwartz (1985) support that the NCF presents deep limitations due to prices volatility. Paddock, Siegel and Smith (1988) list NPV
technique disadvantages.
On the other hand, Dixit and Pindick (1994) assure that:
“The simple N P V rule is not just wrong; it is often very wrong ”, (see
chap. 5:136). One of the fundamental drawbacks observed at the traditional
N P V technique is that N CF estimation depends on a constant benefit rate
and static expected flows. On several works, the method selected to solve
the expected project cash flow estimation problem consists of inferring that
the project generates perpetual rents in constant terms identical to the ones
generated on the last exercise, and the interest rate with which they discount
expected cash flows follows the CAM P rules. Copeland and Antikarov (2001),
D´ iaz (1999, 2000), Kester (1984), Gil (1991), and Smith (2001), Mota (2006,
2008, 2009), among others.
Motivated by the argument previously exposed, we to suggest the Net
Present Value continuous model, which defined the Net Cash Flow with external control variables (Zt ), and confirmed that N CF and interest rate are not
constants. A criterion distant to the one we find at ultra-traditional environment. His expression is, Mota (2006, 2009):
"Z
#
T
NP V = E
N CF (t)e−r(t)t dt
0
NP V = NP V + φ
The discrete version of the model to explain the Net Cash Flow and its
internal dynamics with variables (Zt ) and random interest rate, is presented in
the description follow, see Mota (2006):
Table 4
72
Revista de Administración, Finanzas y Economı́a
The important point in this research is that now NCF is a stochastic process
that the administration council looks forward and guides the evolution. We
have used diffusion processes with control variables (Zt) and showed that these
processes not only explain NCF evolution, but also guides it. The analysis
about how to use control variables on diffusion processes is of the form:
dN CFt = µ(Zt , N CFt, t)dt + σ(Zt , N CFt, t)dWt
In this work we have used the Vasicek model (1977) which is a diffusion process
and due to its affinity with the purpose of this work had showed been applicable,
but the possibility of studying more processes and proposing new ones is not
excluded, still more. Only by focusing in the component F (Zt ) formulation,
proposing non-linear relations, we get the possibility of entering upon complex
schemes.
In short, the modified real option is:
"Z
#
T
RO = N P V = E
N CF (t)e−r(t)t dt > 0
0
In order to review the impact on a real option value and therefore on real options
theory, it would be enough to apply modified N P V with external variables (Zt )
on a capital investment opportunity; we take back the idea that a real option
is:
NP V = NP V + φ > 0
and we ask whether the real option is such that N P V < 0, φ is call/put option
such that N P V = N P V + φ > 0. We change the path by taking more steps
before a decision is reach, instead we see the relation:
N P V (Zt ) = N P V (Zt ) + φ
and we start in the same place with N P V < 0, and φ is a call/put option, now
we suggest:
1.- Find a suitable Zt such that N P V (Zt ) > 0.
2.- If for all possible sets {Zt } N P V < 0, then find a couple {Zt , φ} such
that
N P V (Zt ) = N P V (Zt ) + φ > 0
The simple idea that takes traditional NPV ignores:
1. The {Zt} set is actually acting over the cash flow estimates.
2. N P V is a stochastic processes not a deterministic one.
The typical questions emerged from administration council while making a capital investment decision can be answered from traditional viewpoint: V P N > 0,
from real options perspective traditional: V P N + φ > 0, or even from a new
approach proposed in this research; V P N (Zt ) + φ > 0 as information joint
associated to Zt .
Classical real options inquiries investing in research and development; expanding or not annual production; postponing an investment project, etc. these
are questions on the structure N P V (Zt )+φ > 0. With this approach, accepting
or rejecting an investment project depends on variables Zt trajectories.
Capital Investments and real options: news proposes
73
The rationale behind is that with the model proposed we go into a more
accurate value rather than just doing a real option valuation. Now since N P V
is stochastic and is possible to manage its behavior through a wise use of the
control variables, now the firm has to set the level of Zt in N V P = N P V (Zt ),
which says the ability to generate wealth in the firm depends on the decisions
of the board setting the level of control (Zt ).
5. Conclusions
The work was written on the continuous objective to contribute in Real Options
Theory with news proposes. We have been proposed that the Net Present Value
is a stochastic process because we should consider a continuous models Net
Cash Flow and interest rate. The considering external control variables (Zt )
which change the Net Cash Flow course and modified the traditional N P V for
N P V (Zt ) and addition φ, where φ is the real option are some contributions.
Mota (2006, 2008, 2009).
In this research was important raised that multiples questions emerged
from administration council while making a capital investment decision can be
answered from approach proposed:
V P N (Zt ) + φ > 0
as information joint associated to Zt and these are questions on the structure
N P V = N P V (Zt ) + φ > 0. With this approach, accepting or rejecting an
investment project depends on variables Zt trajectories. In short, we find a
suitable Zt such that N P V (Zt ) > 0 and if for all possible sets {Zt }, N P V < 0
then find a couple {Zt , φ} such that N P V = N P V (Zt ) + φ > 0.
As can see, for the Investment Capital Theory this work is significant for
investment project area because the model proposed is able to offer a more
accurate valuation the real option.
6. References
Amram, M. and N. Kulatilaka (1999). Real Options Managing Strategic Investment in an Uncertain World. Boston, Massachusetts: Harvard Business
School Press.
Brabazon, T. (1999). Real Options: Valuing Flexibility in Capital Investment
Decisions. Accountancy Ireland, 31 (6): 16-18.
Breeden, D. (1979). An Intertemporal Asset Pricing Model with Stochastic Consumption and Investment Opportunities, Journal of Financial Economics, 7, 265-296.
Brennan, M. (1979). The Pricing of Contingent Claims in Discrete Time Models, Journal of Finance, pp.53-68.
Brennan, M., and E. Schwartz (September 1978). Finite Difference Methodos and Jump Process Arising in the Pricing of Contingent Calims: A
Synthesis, Journal of Finance and Quantitatve Analysis, pp. 461-474.
Brennan, M., and E. Schwartz (Spring 1985). Evaluating Natural Resources
Investments, Journal of Business, 58, 135-157.
Boyle, P. (May 1977). Options: A Monte Carlo Approach, Journal of Financial
Economics, 323-338.
74
Revista de Administración, Finanzas y Economı́a
Campbell, J., A. W. Lo and A. C. MacKinlay (1997). The Econometrics of
Financal Markets. Princenton, New Jersey: Princenton University Press.
Copeland, T. and V. Antikarov (2001). Real Options: A Practitioner’s Guide,
New York, N.Y.: Thomson Texere.
Cox, J. J. Ingersoll and S. Ross (1985). An Intertemporal General Equilibrium
Model of Asset Prices. Econometrica, 53, 363-384.
Cox, D. R. and H. D. Miller (1965). The Theory of Stochastic Processes:
Chapman and Hall.
Chiang, A. (1984). Fundamental Methods of Mathematical Economics. (3a.
ed.). USA: McGraw Hill.
Dixit, A. and Pindyck, R. (May-June 1995). The Options Approach to Capital
Investment. Harvard Business Review, 105-118.
Dixit, A. and Pindyck, R. (1994). Investment Under Uncertainty. New Jersey,
Princeton University Press.
Dohan, U. (1978). On the Term Structure of Interest Rates. Journal of Financial Economics 6, 59-69. Engle, R. and Ng, V. (2000). Measuring and
Testing the Impact News on Volatility, in ARCH Selected Readings, Edited
for Engle, R. and Ng, V. (2000). Oxford University Press.
Geske, R. (1979). The Valuation of Compounds Options. Journal of Financial
Economics 7 (1): 63-81.
Glasserman, P. (2004). Monte Carlo Methods in Financial Engineering: Verlag.
Glosten, L. R., R. Jagannathan, and D. E. Runkle (1993). On the Relation
Between the Expect Value and the Volatility of the Nominal Excess Return
on Stocks. Journal of Finance, 48, 1779-1801.
Gourieroux and Jasiak (2001). Financial Econometrics: Diffusion Process,
USA: Princeton Series in Finance.
Heath, D., R. Jarrow, and A. Merton (1990).
Bond Pricing and the
Term Structure of Interest Rates: A Discrete Approximation. Journal
of Financial and Quantitative Analysis, 25 (4): 419-440. Heath, D., R.
Jarrow, and A. Merton (1992). Bond Pricing and the Term Structure of
Interest Rates: A New
Methodology for Contingent Claims Valuation. Econometrica, 60 (1): 77105. Herath, H., and C. Park (2001). Real Options Valuation and its
Relationship to Bayesian Decision Making
Methods: The Engineering Economist, 46 (1), 1-32. Ho, T. and S. Lee (1986).
Term Structure Movements and Pricing Interest Rate Contingent Claims.
Journal of Finance, 42 (5), 1011-1029.
Hughston, L. (1996). Vasicek and Beyond: Approaches to Building and Appliying Interest Rate Models. London: Risk Publications.
Hull, J., (1993). Options, Futures and other Derivative Securities, (2nd ed.).
USA: Prentice Hall.
Hull, J. and A. White (1988). The Use of the Control Variate Technique in
Option Pricing. Journal of Financial and Quantitative Analysis, 23 (3):
237-251.
Ingersoll, J., and S. Ross (1992). Waiting to Invest: Investment and Uncertainty, Journal of Business, 65 (1): 1-29.
Kaplan, S. and R. Ruback (1995). The Valuation of Cash Forecast: An Empirical Analysis. The Journal of Finance, 50 (4):1059-1092.
Capital Investments and real options: news proposes
75
Kester, W. C. (1984). Today’s Options for Tomorrows Growth. Harvard Business Review, 62 (2): 153-160.
Kogut, B., and N. Kulatilaka (2001). Strategy, Heuristics, and Real Options.
The Oxford Handbook of Strategy.
Kulatilaka, N., and E. Perotti (1998). Strategic Growth Options. Management
Science, 44 (8), 1021-1031.
Kulatilaka, N., and L. Trigerorgis (1994). The General Flexibility to Switch:
Real Options Revisited, International Journal of Finance, 6 (2): 27-54.
Lamberton, D. and B. Lapeyre (1997). Introduction to Stochastic Calculus
Applied to Finance. (First ed.) Great Britain: Chapman & Hall.
Lander, D., and G. Pinches (1998). Challenges to the Practical Implementation of Modeling and Valuing Real Options. The Quarterly Review of
Economics and Finance, 38, 537-567.
Majd, S., and Pindyck, R. (March 1987). Time to Build, Option Value, and
Investment Decisions, Journal of Financial Economics 18: 7-27.
McDonald, R., and Siegel, D., (1985). Investment and the Valuation of Firms
When There is an Option to Shut Down. International Economic Review
26 (2): 331-349.
Mcgrath, R., and I. Mac Millan (2000). Assessing Technology Projects using
Real Options Reasoning. Research Technology Management, 43 (4), 35-49.
Merton, R. C., (1970). Optimum Consumption and Portfolio Rules in a
Continuous-Time Model. Working Papers 58, Massachusetts Institute of
Technology (MIT), Departments of Economics.
Merton, R. C., (1973). Theory of Rational Option Pricing. Bell Journal of
Economics and Management Science, 4, 141-183.
Merton (1998). Applications of Option-Pricing Theory: Twenty-Five Years
Later. American Economic Review, 88(3): 336-340.
Moel, A., and P. Tufano (2000). When are Real Options Exercised? An
Empirical Study of
Mine Closings. Review of Financial Studies, 15, 35-64.
Mota, B. (2006). La teorı́a de Opciones Reales, los Proyectos de Inversión y
las Decisiones Estratégicas de Negocios, Denarius 13: 245-266.
Mota, B. (2008). Proyectos de Inversión: Una Visión Iberoamericana. La
Teorı́a de Procesos Estocásticos en el análisis de los Flujos de Efectivo de
un Proyecto de Inversión, Cap. 7: 255, FCA-UNAM, México.
Mota, B., Ludlow, J. Williams, F. (2008). Stochastic Processes. A Critical
Synthesis. Análisis Económico, Vol. XXIII, No. 53. México.
Myers, S. (1977). Determinants of Corporate Borrowing. Journal of Financial
Economics, 5: 147-175.
Mun, J. (2002), Real Options Analysis, Tools and Techniques for Valuing
Strategic Investments and Decisions, New Jersey: John Wiley Sons, Inc.
Myers, S. and Majad, S. (1990). Abandonment Value and Project Life. Advances in Futures and Options Research, 4: 1-21.
Natenberg, S. (1994). Option Volatility Pricing. Cambridge, England: Probus
Publishing Company.
Neftci, S. N., (2000). An Introduction to the Mathematics of Financial Derivatives. (2a. ed.), New York, N.Y.: Academic Press.
Paddock, J. Siegel, D. and Smith, J. (1988). Option Valuation of Claims on
Physical Assets: The Case of Offshore Petroleum Leases, Quarterly Journal
76
Revista de Administración, Finanzas y Economı́a
of Economics 103, 479-508.
Pindyck, R. (1988). Irreversible Investment, Capacity Choice, and the Value
of the Firm. American Economic Review 78, 5: 969-985.
Quigg, L. (1993). Empirical Testing of Real Option-Pricing Models, Journal
of Finance, 48, 621-640.).
Rebonato, R. (1996). Interest Rate Option Models. England: John Wiley
Sons.
Schwartz, E., and L. Trigeorgis (2000). Real Options and Investment under
Uncertainty: Classical Readings and Recent Contributions. MIT Press.
Schwartz, E., and C. Zozaya-Gorostiza (2000). Valuation of Information Technology Investments as Real Options. AFA 2001, New Orleans Meetings.
Smith, K., and A. Triantis (1998). The Value of Options in Strategic Acquisitions, in Trigeorgis, L. (1999): Real Options and Business Strategy:
Applications to Decision-Making, Risk Books.
Trigeorgis, L., and Mason, S.P., (1987). Valuing Managerial Flexibility. Midland Corporate Finance Journal 5 (1): 14-21.
Trigeorgis, L. (1988). A Conceptual Options Framework for Capital Budgeting.
Advances in Futures and Options Research 3, 145-167.
Trigeorgis, L. (Autumm, 1993). Real Options and Interactions with Financial
Flexibility, Financial Management 22 (3): 202-224.
Trigeorgis, L. (Autumm, 1993). The Nature of Option Interactions and the
Valuation of Investments with Multiple Real Options, Journal of Financial
and Quantitative Analysis, 28 (1): 1-20.
Trigeorgis, L. (1991). A Long Transformed Binomial Numerical Analysis
Method for Valuing Complex Multi-Option Investments. Journal of Financial and Quantitative Analysis, 26 (3): 309-326.
Trigeorgis, L. (1998). Real Options, Managerial Flexibility and Strategy in
Resource Allocation, Cambridge, The MIT Press.
Vasicek, O. (1977). An Equilibrium Characterization of the Term Structure.
Journal of Financial Economics, 5, 177-188.
Venegas, F. (2006). Riesgos Financieros y Económicos: Productos Derivados
y Decisiones Económicas bajo incertidumbre. (1 ed.), México, Thomson.
Wilmott, P. (2000). Quantitative Finance. England: John Wiley Sons, Inc.
Revista de Administración, Finanzas y Economı́a (Journal of Management, Finance and
Economics), vol. 5, núm. 1 (2011), pp. 77-92.
Valuación de Swaptions Bermuda
basada en el Modelo LIBOR
adaptado a vectores frontera
Igor P. Rivera∗
Enzo D’Antonio di Vito D.
Andrés Fundia ∗∗∗
∗∗
Recibido 15 de abril de 2010. Aceptado 09 de septiembre de 2010
Resumen
El presente trabajo estudia el cálculo del precio de Swaptions tipo Bermuda,
con base en el Modelo Libor (LMM) de tasa de interés adaptado al algoritmo
de vectores de frontera de ejercicio para valuar opciones americanas. Dicho
algoritmo de la familia de la simulación Monte Carlo, obtiene una frontera
de tasas de ejercicio que permite valorar la decisión de seguir en la opción o
ejercerla de forma anticipada. Este enfoque tiene la ventaja de ser fácil de
implementar y puede obtener un resultado rápido y aproximado del valor de un
Swaption bermudano, mejor conocido en el mercado como Swaption Bermuda.
Abstract
This paper studies the computation of the price of Bermuda Swaptions type,
based on the Libor Model (LMM) interest rate vector algorithm adapted to
the exercise boundary to value American options. This algorithm about family
Monte Carlo, get a border exercise to rate the value of staying in decision
option or exercise early. This approach has the advantage of being quickly to
implement and get a result about the value of a swaption bermudano, better
known swaption market as Bermuda.
Clasificación JEL : G10, G14
Palabras clave: Valuación de derivados de tasa de interés, Swaptions Bermuda, Simulación
Monte Carlo
Introducción
Actualmente el uso de derivados sofisticados es cada vez más solicitado en los
mercados financieros y entre las razones principales de esta creciente demanda
se encuentra la posibilidad de aprovechar y generar oportunidades de negocio
∗
Escuela de Graduados en Administración y Dirección de Empresas Tecnológico de Monterrey, Campus Ciudad de México, EGADE. Calle del Puente 222, Aulas 4-Piso 4, Ejidos de
Huipulco, Tlalpan, D.F. 14380, e-mail: [email protected]
∗∗
∗∗∗
Departamento de Estructuración BBVA Bancomer (México)
Departamento de Riesgos Infonavit, México
78
Revista de Administración, Finanzas y Economı́a
que se derivan de la evolución y cambios de las necesidades de los clientes y
participantes de los mercados. Entre los productos más comunes en el mercado
de derivados de tasas, se encuentran los caps, floors y los swaps. Los caps son
opciones de tasas de interés que le garantizan al tenedor que una tasa variable
no exceda de un nivel especı́fico; los floors, contrario a los caps, garantizan al
tenedor que una tasa variable no disminuya de un cierto nivel. La cotización
de ambos en el mercado generalmente se realiza en términos de volatilidad de
tasas.
Por otra parte, los swaps son contratos en el que las contrapartes acuerdan
el intercambio de flujos futuros en una misma o en diferentes monedas y a
tasas fijas o flotantes. Dado que el uso de swaps en los mercados se ha hecho
tan común, que ha generado la necesidad de utilizar derivados sofisticados que
tengan como subyacente a los swaps, entre ellos estan los swaps adelantados, los
futuros sobre swaps y las opciones sobre swaps, mejor conocidas en el mercado
como swaptions. Los swaptions contratos que otorgan a su tenedor el derecho
de entrar en un swap, para recibir o pagar una tasa fija.
Al igual que las opciones de tasas de interés, los swaptions cotizan en
términos de volatilidad de tasas y la tasa de ejercicio está dada por la tasa fija
del swap subyacente al que se puede entrar. También, como en el caso de las
opciones tradicionales, los swaptions pueden ser de tipo europeos o americanos
aunque también son muy común los de tipo bermudano. Los swaptions europeos
pueden ejercerse únicamente a su vencimiento, mientras que los americanos
pueden ser ejercidos en cualquier momento antes del vencimiento. Entre dichos
extremos, existe una variante, llamada opción bermuda que permiten ejercer el
derecho asociado en un calendario de fechas definido antes del vencimiento. Los
vencimientos tı́picos de un swaption pueden ir desde unos cuantos meses hasta
varios años.
En el caso de los swaptions, la analogı́a entre opciones de compra (calls) y
de venta (puts) se define en términos de la clase de tasa de interés que al tenedor
corresponderı́a pagar en caso de ejercer su derecho de entrar al swap: en un
call swaption, mejor conocido como payer swaption, el tenedor tiene el derecho
de entrar al swap pagando flujos a tasa fija, mientras que en el put swaption,
tı́picamente denominado receiver swaption, el tenedor queda habilitado para
entrar al swap erogando los flujos a tasa variable si decide ejercer la opción.
Si bien los swaptions bermudanos pueden ser utilizados con objeto de negociación y especulación, han cobrado gran importancia al usarse como instrumentos de cobertura. De hecho, los swaptions bermudanos generalmente están
implı́citos en swaps que pueden ser cancelables (conocidos como callable swaps)
los cuales la mayorı́a de las veces forman parte de canastas de activos o de
bonos cancelables en las campañas de financiación corporativa. Por ejemplo,
en perı́odos de baja volatilidad, intermediarios financieros y tesorerı́as bancarias, podrı́an tomar posición larga en swaptions para compensarla en perı́odos
posteriores de mayor volatilidad; bajo esquemas de esta naturaleza generalmente se negocian swaptions tipo europeo y en estrategias básicas. Incluso, una
tesorerı́a bancaria podrı́a utilizar un swaption para cubrir niveles de volatilidad
provocados por posiciones propias o de clientes.
Existen en la literatura diversas referencias sobre los efectos de noticias y
avisos macroeconómicos tanto en el mercado de contado de tasas de interés,
como en su mercado de derivados; se sugiere al lector el trabajo de Forniari
Valuación de swaptions Bermuda ...
79
(2004) como compendio sobre el tema. Ante tales circunstancias, es común que
una tesorerı́a bancaria necesite ajustar el desbalance de duración que se genera
ante eventos de prepago de sus créditos de mediano y largo plazo. Por ejemplo,
suponga que el banco otorgó un crédito a tasa fija en el que el cliente pueda
prepagar de forma anticipada; si bien el crédito puede cubrirse por un swap,
simultáneamente el prepago puede cubrirse con la compra de un swaption que
otorgue el derecho de recibir la tasa fija. Ası́, en el caso de que el cliente decida
prepagar el crédito (esto asume que el prepago se realiza por ventajas en el
mercado), la cobertura instituı́da en forma del swap deja de tener sentido, de
modo que el banco debe ejercer el swaption a fin de compensar el swap mediante
la sustitución de los flujos. a tasa fija que proporcionaba el antiguo acreditado.
El siguiente cuadro muestra un ejemplo de cobertura contra el riesgo de
prepago por medio de un swaption.
Para el caso de los swaptions europeos, es posible obtener una solución
cerrada a la ecuación diferencial parcial del precio del swaption, en la forma de
una ecuación del tipo Black-Scholes-Merton. Sin embargo, esto no es posible en
el caso del swaption Bermuda por lo que en este trabajo emplearemos métodos
originalmente pensados para la valuación de opciones americanas para obtener
una aproximación al precio del swaption bermudano. Si bien, existe literatura
relacionada con esta conjetura (p.e. Andersen (2000)), el enfoque que en este
trabajo presenta se caracteriza por su fácil implementación. El modelo Libor
80
Revista de Administración, Finanzas y Economı́a
para determinar las tasas de mercado tanto porque se apega a los datos estilizados sin recurrir a parámetros no observables y porque es compatible con el
uso del método Monte Carlo. El trabajo está organizado de la siguiente forma:
en la sección 2 abordamos las técnicas más comunes de valuación de swaps; en
la sección 3 mostramos como la simulación Monte Carlo permite manejar la
dependencia con la trayectoria del modelo Libor de mercado, al mismo tiempo
que permite incorporar vectores frontera para hacer frente al ejercicio anticipado de las opciones americanas. En la sección 4 se revisa la implementación.
En la sección 5 se analizan los resultados y se trazan algunas conclusiones.
2. Técnicas comunes de valuación de swaptions
Como se muestra en las figuras 2.1 y 2.2, los derivados de tasas de interés se
cotizan tı́picamente en términos de una estructura de plazos de la volatilidad
implı́cita calculada con base en un modelo de Black (1976) bajo el supuesto de
una dinámica lognormal de la tasa de interés.
Figura 2.1. Cotización de caps y floors sobre la Libor del USD (Fuente: Bloomberg, L.P.)
Con el fin de obtener una ecuación para valuar un swaption como el del
ejemplo en las figuras 2.1 y 2.2, considere primeramente al swap subyacente
con una estructura de pagos, dada por el plazo θ que empezarı́a a correr si y
sólo si el swaption hubiera sido ejercido en la fecha, Tk . Dicho swap tendrı́a su
vencimiento en Tm . La condición a alcanzar al vencimiento serı́a la tasa swap
adelantada fuera mayor que la tasa de ejercicio, i.e. rsw,fwd > rk . En dicho
Valuación de swaptions Bermuda ...
81
caso, el precio del receiver swaption descontado a Tk estarı́a dado por:
RSW PTk = θmax(rk − rsw,fwd, 0)
n
X
B(Tk , Tk + θi)
i=1
donde n = (Tm −Tk )/θ y B(Tk , Tj ) serı́a el precio en Tk de un bono sin cupones
con vencimiento en Tj . La suma del precio de dichos bonos, una anualidad,
será utilizada como numeraria y cuya medida de probabilidad rsw,fwd > rk es
martingala, de modo que:
RSW P0 = θE[max(rk − rsw,fwd , 0)]B(0, Tk + θi)
Figura 2.2. Cotización de swaptions sobre la Libor del USD (Fuente: Bloomberg, L.P.)
Al transformar este resultado en una expresión tipo Black-Scholes-Merton
obtenemos un resultado conocido tal como:
RSW P0 = θ[rk Φ(−d2 ) − rsw,fwdΦ(−d1 )]B(0, Tk + θi),
donde
d1 =
2
ln(rsw,fwd /rk ) + 0.5Tk σsw
σsw (T − k)1/2
y
d2 = d1 − σsw (T − k)1/2
con σsw como la volatilidad de la tasa swap adelantada.
82
Revista de Administración, Finanzas y Economı́a
En virtud de que los swaptions americanos no son tan comunes como los
europeos, no profundizaremos en su valuación, sino en la de opciones americanas. Wilmott (2001) y Hull (2006) establecen que los árboles binomiales
son muy comunes en la valuación de opciones americanas. Un árbol binomial
representa un diagrama de diferentes trayectorias recombinantes que pudieran
seguir los precios del bien subyacente durante la vida de la opción, partiendo
del supuesto de que el subyacente en cada perı́odo de tiempo se mueve hacia
arriba o hacia abajo en una magnitud determinada con sendas probabilidades
de ocurrencia como se muestra en la figura 2.3. Una vez trazado el árbol la
forma de trabajar es partiendo del final del árbol hasta el principio, probando
cada uno de los nodos para ver donde es óptimo ejercer antes del vencimiento.
En general es un modelo muy recurrido para el cálculo de este tipo de opciones,
el cual comienza a complicarse si la función de pago de la opción depende de
la trayectoria que sigue el subyacente y no sólo del valor final en cada uno de
los pasos, además de complicarse con problemas de más de dos dimensiones.
Las simulaciones Monte Carlo, en cambio, se adaptan fácilmente al problema
de alta dimensión, como lo establecen Broadie and Glasserman (1997).
Figura 2.3. Árbol binomial de tres pasos.
En las simulaciones Monte Carlo pueden incorporarse dependencias de
trayectoria, esto dado que, como se muestra en la figura 2.4, se generan diferentes trayectorias aleatorias independientes con algún proceso estocástico definido para el subyacente, se calcula la función de pagos para cada trayectoria
y posteriormente se pueden combinar linealmente y promediar para estimar el
valor esperado de la función de pagos del derivado.
A pesar de que en Wilmott (2001) y Hull (2006) se considera como difı́cil
manejar la posibilidad de ejercicio anticipado de las opciones americanas a
Valuación de swaptions Bermuda ...
83
través de la simulación Monte Carlo, existen diversas referencias tales como
Brodie y Glasserman (1997), Dupire (1998), Fundia (2002) y Rivera (2005) en
las que se proporcionan indicios y ejemplos de cómo emplear el método Monte
Carlo para la valuación de opciones americanas.
Figura 2.4. Trayectorias de precio simuladas por Monte Carlo.
3. Modelo Libor, vectores frontera para valuar opciones americanas
En la presente sección se presentará la forma de utilizar el método Monte Carlo
para manejar la dependencia de trayectoria requerida por el modelo Libor de
mercado a las vez que los vectores frontera permiten incorporar el ejercicio anticipado, tı́pico de opciones americanas. Recuérdese ante todo que los modelos de
tasas de interés pretenden describir la evolución de las tasas de interés a través
del tiempo; algunos describen una estructura temporal de tasas basados en el
comportamiento de la tasa de corto plazo, mientras que otros se basan en procesos que siguen tasas adelantadas instantáneas, las cuales no son observables
en el mercado. Hull (2006) aborda estos modelos con profundidad intermedia
mientras que la revisión detallada de dichos modelos se puede encontrar en
Brigo and Mercurio (2001).
Diversos autores como Brace, Gatarek y Musiela (1997), Jamshidian (1997)
ası́ como Miltersen, Sandmann y Sondermann (1997) han abordado la no observabilidad de la tasa forward instantánea mediante lo que en forma unificada se
conoce como LMM, por sus siglas en inglés Libor Market Model, el cual puede
expresarse en términos de las tasas “forward ”que se observan en los mercados
actuales. Resulta conveniente usar este modelo sobre las tasas aplicables a los
derivados de tasas de interés en los perı́odos lı́quidos, que son de por lo menos
un mes y comúnmente de tres y seis meses resultando su uso menos complicado
que las tasas instantáneas no observables.
Como lo describen Hull (2006) y Jamshidian (1997) este modelo se puede
utilizar en la valuación de productos comunes del mercado de derivados de
84
Revista de Administración, Finanzas y Economı́a
tasas de interés, como caps y floors, bajo el supuesto de que las tasas forward
siguen una distribución lognormal. Comúnmente la implementación requiere
de la simulación Monte Carlo. Existen diferentes modelos para el cálculo de
primas de opciones americanas utilizando simulación Monte Carlo; en general
se caracterizan por utilizar métodos numéricos y en algunos casos métodos
iterativos; a continuación revisaremos los principales.
Longstaff y Schwartz (2001) proponen una aproximación por mı́nimos cuadrados para la valuación de opciones americanas. Bajo este enfoque es necesario
elegir en cada posible punto de ejercicio entre continuar con la opción o ejercer.
El método consiste en generar un gran número de trayectorias y analizar los
posibles valores del subyacente para cada periodo de ejercicio en cada una de
las trayectorias. Se compara el valor de ejercicio en cada punto con el valor de
no ejercer:
V = a + bS + cS 2
donde S es el precio del subyacente en el i-ésimo perı́odo y V es el valor de
no ejercer calculado al tiempo correspondiente, es decir, el valor de ejercer en
el siguiente periodo descontado al periodo i-ésimo. Para todos los valores se
encuentran a, b y c tal que se determine el mı́nimo de la suma
X
(Vi − a − bSi − cSi2 )
a través de mı́nimos cuadrados. Se realiza de atrás hacia delante hasta obtener
el valor de ejercer inmediatamente. Este modelo podrı́a llegar a complicarse
cuando el precio de la opción se vea afectado por más de un factor, resultando
la aproximación ordinaria por mı́nimos cuadrados impráctica para el cálculo de
la función condicional V ; en tal situación, resulta más eficiente utilizar otras
técnicas como mı́nimos cuadrados ponderados o mı́nimos cuadrados generalizados entre otros. Podrı́a también encontrarse algunas otras implicaciones
numéricas para la significancia estadı́stica de las regresiones de mı́nimos cuadrados al definir la función condicional, como se resume en Longstaff y Schwartz
(2001).
Por su parte Andersen (2000) propone una aproximación en la que se genera
un número considerable de trayectorias Monte Carlo, y en el que la frontera de
ejercicio es parametrizable. Primeramente se define una función de ejercicio
anticipado I(t) que es igual a 1 si el ejercicio anticipado es óptimo en el tiempo
t y 0 en otro caso. I(t) es una función con un vector de parámetros, cuyos
valores óptimos son determinados iterativamente, iniciando por el vencimiento
de la opción hasta el inicio.
Después, se prueban cada uno de los valores del precio S del subyacente,
en cada perı́odo t de las diferentes trayectorias, y en el que el valor esperado
de ejercicio sea mayor/menor dependiendo del tipo de opción, es decir, el valor
que maximice el precio promedio de la opción se definirá como punto frontera.
Se obtiene el punto frontera para cada perı́odo t y ası́ hasta llegar a t = 0 como
se sugiere en Hull(2006) o Broadie y Glasserman (1997). En este modelo la
parametrización de las fronteras es única para cada tipo de operación; y en
ocasiones podrı́a resultar complicada la forma en que debe ser parametrizada
la frontera de ejercicio anticipado.
Valuación de swaptions Bermuda ...
85
En Fundia (2002), los vectores frontera se calculan iniciando por el vencimiento de la opción hasta el inicio, es decir haciendo el recorrido hacia atrás
en el tiempo. En el tiempo final N , el vector está determinado por el precio
de ejercicio de la opción, y para encontrar sus valores en cualquier tiempo k
es necesario haber obtenido los valores futuros, es decir entre el tiempo k y N .
En cada uno de los perı́odos primeramente debe definirse el techo y el piso de
la frontera y se define a y como el punto medio de dichos puntos; entonces,
la pregunta que debe responderse es si la función de pago es mayor o igual al
valor estimado de continuar con la opción; con base en la respuesta, y será el
nuevo piso o techo del perı́odo k. Para responder a esas preguntas, se define
primero la función de valor de la opción si el tenedor decide no ejercer. Se
simulan trayectorias desde el tiempo k hasta el tiempo N ; en cada una de ellas
se obtiene un valor observado.
Para las n trayectorias que se calculan, se obtienen valores observados de los
que al obtener la media (estimador) se obtendrá el valor esperado de continuar
en la opción; las posibles respuestas en el punto de decisión son:
a) ejercer si la función de pago es mayor o igual al valor estimado de
continuar,
b) no ejercer si la función de pago es menor al valor estimado de continuar.
El proceso se repite hasta que el valor del piso y del techo coincidan (i.e.
hasta que difieran en un valor no mayor a ). Una ventaja de este modelo es que
es un método iterativo y con alta velocidad de cálculo. De hecho, el algoritmo
descrito anteriormente es el que se implementó en el presente trabajo, siendo la
base para el desarrollo en VBA. En la siguiente sección se describirá con mayor
detalle la implementación.
4. Implementación
En esta sección, se revisrá una descripción general del algoritmo a seguir para
el cálculo de la frontera de ejercicio, que combinado con el modelo Libor de
tasas, conformará un método alternativo a los ya existentes; posteriormente
se explicará a detalle tomando como ejemplo un swaption semestral con plazo
de 10 años. La idea fundamental que se propone consiste adaptar el modelo
“Fast Monte Carlo American Option Pricing”de Fundia (2002), para obtener
una aproximación de la frontera de ejercicio de tasas swaps que permita calcular
el valor de un swaption Bermuda. La implementación incluye la combinación de
dicho método de aproximación para opciones americanas con el modelo Libor
de mercado.
Es importante señalar que el ejemplo implementado con fines experimentales para el cálculo de la frontera, tiene como supuestos:
a) que se considera la curva de tasas libres de riesgo como plana en todos
los plazos para este ejemplo en particular
b) que la Curva de volatilidad se considera plana para todos los plazos para
este ejemplo en particular
c) que es un modelo de una sola dimensión.
Sin embargo destacamos que la gran ventaja de implementar esta metodologı́a es que puede aplicarse de manera general para swaps de cualquier plazo tal
y como se observan en el mercado, además de que puede generalizarse fácilmente
86
Revista de Administración, Finanzas y Economı́a
a estructuras temporales de tasas observadas y volatilidades incluso si éstas no
son deterministas.
Como se mencionó, el algoritmo se centra en calcular los vectores frontera
iniciando por el vencimiento de la opción (i.e. al tiempo N ) hasta el inicio. Al
tiempo N el valor de la frontera está determinado por el precio de ejercicio de
la opción, y para encontrar este valor en cualquier tiempo k es necesario haber
obtenido los valores futuros, es decir entre k y N .
En cada uno de los perı́odos primeramente debe definirse el techo y el
piso de la frontera, los cuales pueden ser 0 y un número B, con una realización
única u que pertenezca al intervalo (0, B) y tal que (x, u∗) sea un vector frontera.
Entonces, se define a y como el punto medio del piso y techo dados por (0, B)
y la pregunta que debe responderse es si y ≥ u∗ ; dependiendo de la respuesta y
será el nuevo piso o techo de u∗ ; el proceso se repetirá hasta que la diferencia
entre el piso y el techo no sea mayor al nivel de precisión dado por .
Para abordar el proceso, se define primero a gk como el valor de la opción
si el tenedor decide no ejercer. Se simulan trayectorias comenzando en Sk , es
decir, se obtienen los valores (Sk , Sk+1 , ..., SN ) con cada una de ellas se obtiene
un valor observado Gk que se define como:
Gk = Dk,t h(St )
donde
t = min(k + 1, ..., N )
si St ≥ V para cualquier V que pertenezca a la frontera de ejercicio, o t = N
si St < V , h() representa el valor de ejercer en este instante, y Dk,t es el factor
de descuento.
De hecho para las n trayectorias
que se calculan, se obtienen valores de
P
Gk ; si se hace que gk = (1/n) Gk , es decir el estimador del valor esperado de
continuar, las posibles respuestas a las preguntas antes mencionadas serı́as las
siguientes:
a) y ≥ u∗ si h(x) ≥ gk , es decir, ejercer si la función de pago es mayor o
igual al valor estimado de continuar,
b) y < u∗ si h(x) < gk , es decir, no ejercer si la función de pago es menor
al valor estimado de continuar.
Este procedimiento itera hasta que el valor del piso y del techo coincidan es
decir, difieran en un valor no mayor a . El número de trayectorias y el tiempo
de simulación dependerán del subyacente sobre el que se esté calculando y del
proceso estocástico que se defina para este.
A continuación se desarrolla un ejemplo en el que se supone que el producto
a valuar es un swaption tipo bermuda sobre un swap con periodicidad semestral,
en el que se adquiere el derecho de pagar la tasa fija (“payer”) y con posibilidad
de ejercer en cualquier perı́odo de vencimiento de cupón.
Antes de iniciar con el algoritmo para construir la frontera de tasas se
presentan las caracterı́sticas del instrumento en la tabla siguiente y se describirá
el proceso a utilizar con el modelo Libor de mercado, para las simulaciones de
trayectoria de tasas.
Valuación de swaptions Bermuda ...
87
Como ya se mencionó anteriormente el modelo Libor de Mercado puede
ser implementado usando simulación Monte Carlo y expresado en términos de
volatilidad.
El modelo libor que se utilizará es el proceso definido para tasas forwards,
de las cuales pretende obtenerse las tasas swaps; entonces la expresión a utilizar
que define el proceso estocástico de las tasas forward, es como sigue:
δF (t, j)σ 2
σ2
1/2
−
F (t, j + 1) = F (t, j)exp
δ + σZδ
1 + δF (t, j)
2
donde
a)F (t, j + 1) es la tasa forward para el siguiente perı́odo,
b)F (t, j) es la tasa forward para el perı́odo actual,
c)δ es la periodicidad de la tasa,
d)σ es la volatilidad de la tasa forward,
e)y Z es una variable aleatoria con distribución normal estándar.
Por medio de la simulación, esta expresión permitirá obtener trayectorias
de las tasas forwards de las que derivarán las tasas swaps que formarán parte
de la frontera de ejercicio. De acuerdo a la descripción general anterior, se tiene
que el algoritmo inicia el cálculo en el vencimiento del subyacente, es decir al
tiempo N , en este caso 10 años.
Como se ha definido una frecuencia semestral, dicho plazo equivale a 20
perı́odos. En virtud de que el punto frontera en el perı́odo 20 está dado por el
precio de ejercicio que es igual a la tasa forward a esa fecha, el primer punto de
análisis es al tiempo N − 1, es decir el perı́odo 19 en este ejemplo.
El análisis inicia con definir un piso (0) y un techo (B) iniciales, los cuales
se irán cerrando a través de un proceso iterativo, hasta hacer convergencia con
la tasa forward frontera que se busca. En este ejercicio se definió como techo
inicial B = 2K, es decir B = 19%, de modo que el intervalo inicial está dado
por los valores (0,19%).
Siguiendo con la descripción del modelo hecha anteriormente, se encuentra
el punto medio del intervalo (0, B), es decir y = 9.5%, y a partir de este valor se
harán simulaciones que permitirán obtener el valor esperado de la tasa forward
como se muestra en la gráfica 4.1.
Usando el proceso de tasas forward definido con anterioridad, se tiene que:
(0.5)(0.095)((0.1215)2 (0.1215)2
−
0.5+0.1215Z(0.5)0.5
F (20i) = 0.095exp
1 + (0.5)(0.095)
2
88
Revista de Administración, Finanzas y Economı́a
donde el valor Z es un número aleatorio con distribución normal estándar
N (0, 1). Para obtener el valor esperado de F es preciso realizar un número
importante de simulaciones; tı́picamente en la industria se harı́an de 10,000
a 100,000 simulaciones dependiendo de la velocidad de los compiladores disponibles como se establece en Dupire (1998).
Gráfica 4.1. Simulaciones para el tiempo (N - 1)
Para cada valor de F (20, i) debe determinarse el valor Gk dado por:
Gk = (F (20, i) − K)F D,
donde F D es el factor de descuento dado por la tasa libre de riesgo entre
el periodo n
Py n − 1. Con base en el número de simulaciones n, se calcula
gk = (1/n) Gk y se obtiene el valor esperado de permanecer en la opción si
ası́ conviene el tenedor.
A partir de la comparación del valor gk con el valor y, en caso de que
el valor de permanecer en la opción sea mayor que ejercer; entonces y será
el nuevo piso para la siguiente iteración, es decir el procedimiento de cálculo
descrito anteriormente se realiza ahora con el intervalo (y, B) ó (9.5%,19%) en
este caso.
Este proceso se repite hasta que la diferencia entre el piso y el techo sea
inferior a , que representa el error con el que finalmente está calculado el valor
frontera. Una vez que se calculó el valor en el perı́odo N − 1, es decir el perı́odo
19 en este ejemplo, se debe continuar con el perı́odo inmediatamente anterior
N − 2 que en este caso serı́a el perı́odo 18.
En este punto se parte nuevamente del piso y techo iniciales definidos
anteriormente (0, B), se obtiene el valor medio y , y se harán simulaciones,
esta vez desde el perı́odo N − 2 hasta N ; en general, las trayectorias inician
en el perı́odo N − i y terminarán en el punto en que se encuentren por arriba
Valuación de swaptions Bermuda ...
89
del punto frontera anteriormente calculado o en el perı́odo N . La gráfica 4.2
muestra como se generan las trayectorias desde cualquier punto N −i con i > 1.
Gráfica 4.2 Simulaciones para el tiempo N - i.
Con los valores Gk generados por medio de las simulaciones, se encuentra
el valor esperado gk ; se compara con el punto medio y, y ası́ se procede de
forma sucesiva hasta llegar al perı́odo N = 1. Una vez obtenida la tasa forward
frontera para cada uno de los puntos; se puede obtener la tasa swap de cada
uno de ellos; esto a través de la relación entre estas tasas y que se describe a
continuación:
Qn−1
j=i (1 + δF (ti )) − 1
Si = Pn−1 Qn−1
j=i
k=j−1 (1 + δF (tk ))
donde
a) Si es la tasa swap para el siguiente perı́odo,
b)F (tk ) es la tasa forward para el perı́odo actual, y
c)δ es la periodicidad de la tasa.
Finalmente el precio de la opción en el perı́odo actual corresponde al valor
de permanecer en la opción ya que el tenedor no ejercerı́a de forma instantánea,
es decir el valor de gk en t = 0.
5. Análisis de resultados y conclusiones
Para el ejemplo anterior, por medio de simulación se obtendrı́an sendas
fronteras, de tasas forward y de tasas swap, como las que se muestran en las
gráficas 5.1 y 5.2. La interpretación de esta frontera de ejercicio indica que si
la tasa observada se encuentra por arriba de dicha frontera, en el caso de un
payer swaption, al tenedor le convendrı́a ejercer la opción de forma anticipada.
90
Revista de Administración, Finanzas y Economı́a
Para obtener el precio de la opción en el tiempo cero, sólo es necesario calcular
el valor de permanecer en la opción como se realizarı́a en cualquier tiempo t.
Gráfica 5.1 Frontera de tasas forward.
Gráfica 5.2 Frontera de tasas swap.
En el ejemplo el precio de la opción resulta 1.75%; este valor parece ser
razonable, pero para saber realmente la efectividad del algoritmo, a continuación se presenta un cuadro comparativo del precio de algunos swaptions
Valuación de swaptions Bermuda ...
91
tipo bermuda que se cotizan en el mercado y cuyo proceso de cálculo puede
tener un grado mayor de sofisticación, aunque no necesariamente de rapidez.
Como se muestra en el cuadro anterior, los resultados obtenidos por la
metodologı́a sugerida en este trabajo, son comparables con los niveles de compra
y de venta que se cotizan en el mercado mexicano.
El objetivo del presente trabajo, fue proponer una alternativa eficiente
de cálculo para valuar los swaptions de tipo Bermuda, con base en un modelo
iterativo para el cálculo de opciones americanas y aplicado al Modelo Libor o de
mercado se logró obtener una rápida aproximación del valor de dicho producto.
El modelo iterativo, fundado en simulaciones Monte Carlo, permite calcular
el valor de permanecer en la opción o de ejercerla en cada un de los perı́odos
definidos.
El número de simulaciones que después de diferentes corridas se sugiere
manejar, es de al menos 10,000; un número menor de simulaciones puede causar
desviaciones grandes en el resultado. Por otro lado en cada uno de los puntos,
el número de iteraciones sugeridas es 15, es decir el subproceso de definir un
nuevo piso o techo para definir el valor frontera, se repite 15 veces. Esto implica
que el grado de error, es decir la diferencia entre el piso y el techo es menor a
0.00001. El proceso estocástico utilizado en las simulaciones es el modelo Libor
estándar para tasas forward. El algoritmo aquı́ definido encuentra una frontera
de tasas forward y a partir de estas es posible encontrar la frontera de tasas
swap.
Este modelo tiene la ventaja sobre algunos ya existentes, de que es fácil
de implementar y se puede obtener un resultado rápido y muy aproximado del
valor de un swaption bermuda; entre las desventajas, en esta versión, es que
se trabaja en una sola dimensión y el modelo Libor de un factor lognormal.
En la comparación de precios realizada al final de la sección anterior, puede
observarse que los precios calculados por el modelo de vectores son cercanos a
las cotizaciones de compra y venta encontradas en el mercado mexicano; pero
si se supone que el precio teórico real, se aproxima al precio promedio entre las
posturas de compra y de venta, se puede observar que los precios calculados
están subvaluados, esto se atribuye a los supuestos considerados de volatilidad,
curva de tasas de interés y de modelo. Con base en estas dos consideraciones,
en investigaciones futuras se puede ampliar la precisión del enfoque a través
de un modelo multifactorial, ası́ como incorporando dinámicas estocásticas más
ricas para la volatilidad. Asimismo, trabajos posteriores podrı́an realizarse
desarrollos para el cálculo de sensibilidades y compararlas con otros modelos.
Sin embargo cabrı́a mencionar que estudios empı́ricos como el de Driessen,
Klaassen y Melenberg (2003) han demostrado que no es necesario utilizar un
92
Revista de Administración, Finanzas y Economı́a
modelo de muchos factores para capturar la volatilidad total de los mercados;
tres factores son suficientes para explicar en promedio el 97.8% de las variaciones y un sólo factor explica en promedio más del 80% por lo que la eficiencia
obtenida con este enfoque de poder calcular un precio en menos de 10 segundos con un compilador de bajo nivel como VisualFortranMR hacen atractivo el
resultado.
6. Referencias
Wilmott, Paul (2001) Wilmott introduces Quantitative Finance. John Wiley
& Sons Ltd. England.
Hull, John C. (2006) Options, Futures and Other Derivatives. Prentice Hall.
Sixth Edition. New Jersey.
Jamshidian, Farshid (1997) Libor and swap market models and measures. Finance & Stochastics. 1,293-330.
Andersen, Leif & Andreasen, Jesper (2000) Volatility skews and extensions of
the Libor Market Model. Applied Matemathical Finance. 7,1-32.
Broadie, Mark & Glasserman, Paul (1997) Pricing American-style securities
using simulation. Journal of Economic Dynamics & Control. 21, 13231352.
Fundia, Andrés (2002) A Fast Monte Carlo Algorithm for Pricing American
Options. REMEF, Revista Mexicana de Economı́a y Finanzas. 1(3). 243253.
Andersen, Leif (2000) A simple approach to the pricing of Bermudan swaptions
in the multifactor Libor market model. General Re Financial Products.
New York.
Brigo, Damiano & Mercurio, Fabio (2001) Interest Rate Models. Springer
Finance. First Edition. Italy.
Litterman and Scheinkman (1991) Common Factors Affecting Bond Returns.
Journal of Fixed Income. 1:54-61.
Longstaff, Francis A. & SCHWARTZ, Eduardo S. (2001) Valuing American
Options by Simulation: A Simple Least-Squares Approach. The Review of
Financial Studies. 14(1). pp 113-147.
Driessen, Joost, Klaassen, Pieter & Melenberg, Bertrand (2003) The Performance of Multi-Factor Term Structure for pricing and Hedging Caps
and Swaptions. Journal of Financial and Quantitative Analysis. 38, 3;
ABI/INFORM Global pg. 635 Di Vito, Rivera, Fundia 17.
Rivera, Igor P. (2005) Aproximación numérica al precio de las opciones americanas: una evaluación al año de su aparición en MexDer. REMEF, Revista
Mexicana de Economı́a y Finanzas. 4(3). 212-222.
Fornari, Fabio (2004) Macroeconomic announcements and implied volatilities
in swaption markets. BIS Quarterly review. September, 79-86.
INSTRUCCIONES PARA LOS AUTORES
1) La Revista
de Administración, Finanzas y
Economía
(Journal
of
Management, Finance and Economics) recibe trabajos de investigación en cualquiera
de las áreas o especialidades de administración, economía, contabilidad y finanzas; en
la dirección electrónica:
< [email protected]>
2) Los trabajos que se sometan a arbitraje y dictaminación deberán ser inéditos y no
podrán ser enviados simultáneamente para su publicación en otro medio.
3) Los trabajos pueden ser escritos en español o inglés.
4) El documento puede ser escrito en cualquier editor de texto (Word, PcTex,
MigTex, LaTex) con letra tipo Times New Roman, tamaño 12 a doble espacio.
El justificado no se deberá realizar en los primeros párrafos de cada sección o
después de una tabla o fórmula.
5) Los títulos y subtítulos de secciones se escribirán de tamaño 14 y en negritas,
comenzando siempre con una capitular. Se numerarán empleando la numeración
arábiga. La numeración para los subtítulos será una numeración anidada: 2.1., 2.2.,
2.3., etc.
6) La primera página del
documento deberá contener a) título del trabajo;
b) nombre del autor o autores, sin incluir el grado académico; c) institución de
filiación; d) resumen de no más de 100 palabras en inglés y en español; palabras
claves en Inglés y Español; f) clasificación JEL, disponible en el sitio electrónico:
http://www.aeaweb.org/journal/jel_class_system.html#G y g) al pie de página deberán
incluirse domicilio, teléfono y correo electrónico del autor o de los autores para recibir
correspondencia.
7) Sólo podrá existir un pie de página adicional en la primera hoja. En dicho pie
podrán los autores expresar sus agradecimientos o incluir alguna información
adicional que consideren relevante.
8) Las ecuaciones deben estar numeradas consecutivamente, al igual que los
cuadros, las figuras y las gráficas.
9) Los cuadros, gráficas y figuras deben poseer un título o encabezado que las distinga.
Cada cuadro, gráfica o figura deberá incluir alguna referencia, el origen de la fuente de
información y siempre deberá presentarse en blanco y negro.
10) La relación bibliográfica deberá presentarse al final del documento, en orden
alfabético de autores y éstas deben ser como:
Casar, J. I., G. Rodríguez y J. Ros (1985). Ahorro y balanza de pagos: un
análisis de las restricciones al crecimiento económico de México. Economía
Mexicana, núm. 7, pp. 21-33.
Cox, J. C, J. E. Ingersoll, and S. A. Ross (1985). An Intertemporal General
Equilibrium Model of Asset Prices. Econometrica, 53(2), pp. 363-384.
Fuller, W A. (1996). Introduction to Statistical Time Series. 2nd ed., John
Wiley, New York.
Granger, C. W. (1980). Long Memory Relationships and the Aggregation of
Dynamics Models. Journal of Econometrics, 14(1), pp. 227-238.
The
Trouble
with
Rational Expectations and the Problem of Inflation
Stabilization, en R. Fredman y E. S. Phelps (comps.).
INSTRUCTIONS TO AUTHORS
1) Revista
de
Administración,
Finanzas
y
Economía
(Journal of
Management, Finance and Economics) is a peer reviewed scientific journal and
receives manuscripts with subject matter in Management, Economics, Accounting and
Finance. Articles should be sent to:
< raf.ccm@servicios. itesm.mx>
2) Manuscripts will be considered for possible publication provided they are unpublished
and not submitted elsewhere.
3) The articles could be written in English or Spanish.
4) The manuscripts could be written in Microsoft Word, PcTex, MigTex, or LaTex format,
the font must be Times New Roman, size 12 and pages must be double spaced. Do not
use indentation in the first paragraph of each section or after a table or equation.
5) Titles and subtitles of sections should be written in size 14 and bold faces. It should use
the arabic numerals. Numerals for the subtitles should be consecutive: 2.1., 2.2., 2.3.,
etc.
6) The Cover page should include: a) titles of the paper; b) full name of the author(s), no
specification of academic grade; c) institutional affiliation(s) ; d) a summary of your
…paper in English and Spanish of at most 100 words; e) keywords in English and
…Spanish;_f)_JEL_classification,_which_can_be_found_in:_http://www.aeaweb.org/journ
…al/j_el_class_system.html#G and g) footnote should has: address, telephone and
…electronic mail of the author(s).
7) Only one footnote at the first page is allowed. In the footnote, the author(s) could
include some relevant information.
8) The equations should be in consecutive arabic numerals, and the same applies for the
tables, figures and graphics.
9) Tables, figures and graphics should have a title. Each table, figure, graphic should
include any reference or source.
10) Bibliographical references will be at the end of text with the author(s) in
….alphabetical order, according to the following examples:
Casar, J. I., G. Rodríguez y J. Ros (1985). Ahorro y balanza de pagos: un
análisis de las restricciones al crecimiento económico de México. Economía
Mexicana, núm. 7, pp. 21-33.
Cox, J. C, J. E. Ingersoll, and S. A. Ross (1985). An Intertemporal General
Equilibrium Model of Asset Prices. Econometrica, 53(2), pp. 363-384.
Fuller, W A. (1996). Introduction to Statistical Time Series. 2nd ed., John
Wiley, New York.
Granger, C. W. (1980). Long Memory Relationships and the Aggregation of
Dynamics Models. Journal of Econometrics, 14(1), pp. 227-238.
The
Trouble
with
Rational Expectations and the Problem of Inflation
Stabilization, en R. Fredman y E. S. Phelps (comps.).
EGADE BUSINESS SCHOOL
Revista de Administración, Finanzas y Economía (Journal of Management,
Finance and Economics) es una revista de investigación científica con arbitraje,
sus artículos son responsabilidad de los autores, son ajenos a ella las instituciones que representan, la revista o el Tecnológico de Monterrey.
Índice en el que aparece la revista: IDEAS-RePEc.
Revista de Administración, Finanzas y Economía
(Journal of Management, Finance and Economics)
EGADE Business School
Calle del Puente 222, Col. Ejidos de Huipulco, Tlalpan. C.P. 14380, México D.F.
Aulas III, cuarto piso. Tel.+52(55) 54832020 ext. 1390 y 1392
Correo electrónico: [email protected]
Página: http://www.csf.itesm.mx/egade/publicaciones

Documentos relacionados