Análisis aplicado. Convergencia global.
Transcripción
Análisis aplicado. Convergencia global.
Análisis aplicado. Convergencia global. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Departamento de Matemáticas. ITAM. 2009. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. El problema por resolver. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. El problema por resolver. Problemas reales que se pueden formular como: minimizar f (x), f : Rn → R, en donde f es una función con derivadas continuas de orden 1. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. El problema por resolver. Problemas reales que se pueden formular como: minimizar f (x), f : Rn → R, en donde f es una función con derivadas continuas de orden 1. Soluciones locales débiles: x ∗ ∈ Rn , tal que existe una vecindad N (x ∗ ; ρ) f (x ∗ ) ≤ f (x), José Luis Morales http://allman.rhon.itam.mx/∼jmorales ∀x ∈ N (x ∗ ; ρ) Análisis aplicado. Convergencia global. El problema por resolver. Problemas reales que se pueden formular como: minimizar f (x), f : Rn → R, en donde f es una función con derivadas continuas de orden 1. Soluciones locales débiles: x ∗ ∈ Rn , tal que existe una vecindad N (x ∗ ; ρ) f (x ∗ ) ≤ f (x), ∀x ∈ N (x ∗ ; ρ) Aproximaciones para x ∗ ⇐ Algoritmos. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. El problema por resolver. Problemas reales que se pueden formular como: minimizar f (x), f : Rn → R, en donde f es una función con derivadas continuas de orden 1. Soluciones locales débiles: x ∗ ∈ Rn , tal que existe una vecindad N (x ∗ ; ρ) f (x ∗ ) ≤ f (x), ∀x ∈ N (x ∗ ; ρ) Aproximaciones para x ∗ ⇐ Algoritmos. Direcciones de descenso pk . Longitudes de paso αk José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. El problema por resolver. Problemas reales que se pueden formular como: minimizar f (x), f : Rn → R, en donde f es una función con derivadas continuas de orden 1. Soluciones locales débiles: x ∗ ∈ Rn , tal que existe una vecindad N (x ∗ ; ρ) f (x ∗ ) ≤ f (x), ∀x ∈ N (x ∗ ; ρ) Aproximaciones para x ∗ ⇐ Algoritmos. Direcciones de descenso pk . Longitudes de paso αk Convergencia desde cualquier punto inicial José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Condiciones de Wolfe José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Condiciones de Wolfe Descenso suficiente f (xk + αk pk ) ≤ f (xk ) + c1 αk ∇f (xk )T pk José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Condiciones de Wolfe Descenso suficiente f (xk + αk pk ) ≤ f (xk ) + c1 αk ∇f (xk )T pk Curvatura (condición débil) ∇f (xk + αk pk )T pk ≥ c2 ∇f (xk )T pk José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Condiciones de Wolfe Descenso suficiente f (xk + αk pk ) ≤ f (xk ) + c1 αk ∇f (xk )T pk Curvatura (condición débil) ∇f (xk + αk pk )T pk ≥ c2 ∇f (xk )T pk Curvatura (condición fuerte) |∇f (xk + αk pk )T pk | ≤ c2 |∇f (xk )T pk |. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Condiciones de Wolfe Descenso suficiente f (xk + αk pk ) ≤ f (xk ) + c1 αk ∇f (xk )T pk Curvatura (condición débil) ∇f (xk + αk pk )T pk ≥ c2 ∇f (xk )T pk Curvatura (condición fuerte) |∇f (xk + αk pk )T pk | ≤ c2 |∇f (xk )T pk |. Valores tı́picos 0 < c1 < c2 < 1, c1 = 1.0 × 10−4 , José Luis Morales http://allman.rhon.itam.mx/∼jmorales c2 = 0.9 Análisis aplicado. Convergencia global. Lema técnico. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Lema técnico. Consideremos cualquier iteración de la forma xk+1 = xk + αk pk , en donde pk es una dirección de descenso y αk satisface las condiciones de Wolfe. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Lema técnico. Consideremos cualquier iteración de la forma xk+1 = xk + αk pk , en donde pk es una dirección de descenso y αk satisface las condiciones de Wolfe. θk : ángulo entre pk y −∇fk cos θk = −∇fkT pk ||∇fk || ||pk || José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Supongamos que f es acotada por abajo en Rn y que f es continuamente diferenciable en un abierto N que contiene al conjunto L = {x : f (x) ≤ f (x0 )}, en donde x0 es el punto inicial de la iteración. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Supongamos que f es acotada por abajo en Rn y que f es continuamente diferenciable en un abierto N que contiene al conjunto L = {x : f (x) ≤ f (x0 )}, en donde x0 es el punto inicial de la iteración. Supongamos también que ∇f es una función de Lipschitz en N. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Supongamos que f es acotada por abajo en Rn y que f es continuamente diferenciable en un abierto N que contiene al conjunto L = {x : f (x) ≤ f (x0 )}, en donde x0 es el punto inicial de la iteración. Supongamos también que ∇f es una función de Lipschitz en N. Entonces X cos2 θk ||∇fk ||2 < ∞. k≥0 José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Prueba De la segunda condición de Wolfe (∇fk+1 − ∇fk )T pk ≥ (c2 − 1)∇fkT pk utilizando la continuidad de Lipschitz, (1) + desigualdad de Schwartz (∇fk+1 − ∇fk )T pk ≤ αk L||pk ||2 combinando los resultados αk ≥ c2 − 1 ∇fkT pk L ||pk ||2 sustituyendo en la primera condición de Wolfe fk+1 ≤ fk − c1 1 − c2 (∇fkT pk )2 L ||∇fk ||2 José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. fk+1 ≤ fk − c cos2 θk ||∇fk ||2 , c = c1 (1 − c2 )/L. Finalmente, sumando sobre los ı́ndices ≤ k se tiene que fk+1 ≤ f0 − c k X cos2 θj ||∇fj ||2 j=0 puesto que f es acotada por abajo, entonces la cantidad f0 − fk+1 está acotada por un número positivo para toda k. Por lo tanto tenemos que X cos2 θk ||∇fk ||2 < ∞. k≥0 2 José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Zoutendijk José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Zoutendijk Si X cos2 θk ||∇fk ||2 < ∞. k≥0 entonces cos2 θk ||∇fk ||2 → 0 José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Zoutendijk Si X cos2 θk ||∇fk ||2 < ∞. k≥0 entonces cos2 θk ||∇fk ||2 → 0 método “ideal” cos θk ≥ δ > 0, José Luis Morales http://allman.rhon.itam.mx/∼jmorales para toda k. Análisis aplicado. Convergencia global. Zoutendijk Si X cos2 θk ||∇fk ||2 < ∞. k≥0 entonces cos2 θk ||∇fk ||2 → 0 método “ideal” cos θk ≥ δ > 0, para toda k. Es inmediato que lim ||∇fk || = 0 k→∞ José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Ejemplos José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Ejemplos Cualquier método pk = −Bk−1 ∇fk , en donde Bk es simétrica positiva definida: Newton, cuasi-Newton (BFGS). José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global. Ejemplos Cualquier método pk = −Bk−1 ∇fk , en donde Bk es simétrica positiva definida: Newton, cuasi-Newton (BFGS). Supongamos que la sucesión de matrices {Bk } tiene número de condición uniformemente acotado. Es decir que existe una constante positiva M tal que : cond (Bk ) ≡ ||Bk || ||Bk−1 || ≤ M, José Luis Morales http://allman.rhon.itam.mx/∼jmorales ∀k. Análisis aplicado. Convergencia global. Ejemplos Cualquier método pk = −Bk−1 ∇fk , en donde Bk es simétrica positiva definida: Newton, cuasi-Newton (BFGS). Supongamos que la sucesión de matrices {Bk } tiene número de condición uniformemente acotado. Es decir que existe una constante positiva M tal que : cond (Bk ) ≡ ||Bk || ||Bk−1 || ≤ M, ∀k. Entonces, se puede probar que (Tarea) cos θk ≥ José Luis Morales http://allman.rhon.itam.mx/∼jmorales 1 . M Análisis aplicado. Convergencia global. Ejemplos Cualquier método pk = −Bk−1 ∇fk , en donde Bk es simétrica positiva definida: Newton, cuasi-Newton (BFGS). Supongamos que la sucesión de matrices {Bk } tiene número de condición uniformemente acotado. Es decir que existe una constante positiva M tal que : cond (Bk ) ≡ ||Bk || ||Bk−1 || ≤ M, ∀k. Entonces, se puede probar que (Tarea) cos θk ≥ 1 . M Por lo tanto hemos probado que los métodos: Newton, cuasi-Newton (BFGS) convergen globalmente. José Luis Morales http://allman.rhon.itam.mx/∼jmorales Análisis aplicado. Convergencia global.