Análisis aplicado. Convergencia global.

Transcripción

Análisis aplicado. Convergencia global.
Análisis aplicado. Convergencia global.
José Luis Morales
http://allman.rhon.itam.mx/∼jmorales
Departamento de Matemáticas. ITAM. 2009.
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
El problema por resolver.
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
El problema por resolver.
Problemas reales que se pueden formular como:
minimizar
f (x),
f : Rn → R,
en donde f es una función con derivadas continuas de orden 1.
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
El problema por resolver.
Problemas reales que se pueden formular como:
minimizar
f (x),
f : Rn → R,
en donde f es una función con derivadas continuas de orden 1.
Soluciones locales débiles:
x ∗ ∈ Rn , tal que existe una vecindad N (x ∗ ; ρ)
f (x ∗ ) ≤ f (x),
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
∀x ∈ N (x ∗ ; ρ)
Análisis aplicado. Convergencia global.
El problema por resolver.
Problemas reales que se pueden formular como:
minimizar
f (x),
f : Rn → R,
en donde f es una función con derivadas continuas de orden 1.
Soluciones locales débiles:
x ∗ ∈ Rn , tal que existe una vecindad N (x ∗ ; ρ)
f (x ∗ ) ≤ f (x),
∀x ∈ N (x ∗ ; ρ)
Aproximaciones para x ∗ ⇐ Algoritmos.
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
El problema por resolver.
Problemas reales que se pueden formular como:
minimizar
f (x),
f : Rn → R,
en donde f es una función con derivadas continuas de orden 1.
Soluciones locales débiles:
x ∗ ∈ Rn , tal que existe una vecindad N (x ∗ ; ρ)
f (x ∗ ) ≤ f (x),
∀x ∈ N (x ∗ ; ρ)
Aproximaciones para x ∗ ⇐ Algoritmos.
Direcciones de descenso pk . Longitudes de paso αk
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
El problema por resolver.
Problemas reales que se pueden formular como:
minimizar
f (x),
f : Rn → R,
en donde f es una función con derivadas continuas de orden 1.
Soluciones locales débiles:
x ∗ ∈ Rn , tal que existe una vecindad N (x ∗ ; ρ)
f (x ∗ ) ≤ f (x),
∀x ∈ N (x ∗ ; ρ)
Aproximaciones para x ∗ ⇐ Algoritmos.
Direcciones de descenso pk . Longitudes de paso αk
Convergencia desde cualquier punto inicial
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Condiciones de Wolfe
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Condiciones de Wolfe
Descenso suficiente
f (xk + αk pk ) ≤ f (xk ) + c1 αk ∇f (xk )T pk
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Condiciones de Wolfe
Descenso suficiente
f (xk + αk pk ) ≤ f (xk ) + c1 αk ∇f (xk )T pk
Curvatura (condición débil)
∇f (xk + αk pk )T pk ≥ c2 ∇f (xk )T pk
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Condiciones de Wolfe
Descenso suficiente
f (xk + αk pk ) ≤ f (xk ) + c1 αk ∇f (xk )T pk
Curvatura (condición débil)
∇f (xk + αk pk )T pk ≥ c2 ∇f (xk )T pk
Curvatura (condición fuerte)
|∇f (xk + αk pk )T pk | ≤ c2 |∇f (xk )T pk |.
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Condiciones de Wolfe
Descenso suficiente
f (xk + αk pk ) ≤ f (xk ) + c1 αk ∇f (xk )T pk
Curvatura (condición débil)
∇f (xk + αk pk )T pk ≥ c2 ∇f (xk )T pk
Curvatura (condición fuerte)
|∇f (xk + αk pk )T pk | ≤ c2 |∇f (xk )T pk |.
Valores tı́picos
0 < c1 < c2 < 1,
c1 = 1.0 × 10−4 ,
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
c2 = 0.9
Análisis aplicado. Convergencia global.
Lema técnico.
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Lema técnico.
Consideremos cualquier iteración de la forma
xk+1 = xk + αk pk ,
en donde pk es una dirección de descenso y αk satisface las
condiciones de Wolfe.
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Lema técnico.
Consideremos cualquier iteración de la forma
xk+1 = xk + αk pk ,
en donde pk es una dirección de descenso y αk satisface las
condiciones de Wolfe.
θk : ángulo entre pk y −∇fk
cos θk =
−∇fkT pk
||∇fk || ||pk ||
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Supongamos que f es acotada por abajo en Rn y que f es
continuamente diferenciable en un abierto N que contiene al
conjunto
L = {x : f (x) ≤ f (x0 )},
en donde x0 es el punto inicial de la iteración.
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Supongamos que f es acotada por abajo en Rn y que f es
continuamente diferenciable en un abierto N que contiene al
conjunto
L = {x : f (x) ≤ f (x0 )},
en donde x0 es el punto inicial de la iteración.
Supongamos también que ∇f es una función de Lipschitz en
N.
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Supongamos que f es acotada por abajo en Rn y que f es
continuamente diferenciable en un abierto N que contiene al
conjunto
L = {x : f (x) ≤ f (x0 )},
en donde x0 es el punto inicial de la iteración.
Supongamos también que ∇f es una función de Lipschitz en
N.
Entonces
X
cos2 θk ||∇fk ||2 < ∞.
k≥0
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Prueba
De la segunda condición de Wolfe
(∇fk+1 − ∇fk )T pk ≥ (c2 − 1)∇fkT pk
utilizando la continuidad de Lipschitz, (1) + desigualdad de
Schwartz
(∇fk+1 − ∇fk )T pk ≤ αk L||pk ||2
combinando los resultados
αk ≥
c2 − 1 ∇fkT pk
L
||pk ||2
sustituyendo en la primera condición de Wolfe
fk+1 ≤ fk − c1
1 − c2 (∇fkT pk )2
L
||∇fk ||2
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
fk+1 ≤ fk − c cos2 θk ||∇fk ||2 ,
c = c1 (1 − c2 )/L.
Finalmente, sumando sobre los ı́ndices ≤ k se tiene que
fk+1 ≤ f0 − c
k
X
cos2 θj ||∇fj ||2
j=0
puesto que f es acotada por abajo, entonces la cantidad f0 − fk+1
está acotada por un número positivo para toda k. Por lo tanto
tenemos que
X
cos2 θk ||∇fk ||2 < ∞.
k≥0
2
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Zoutendijk
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Zoutendijk
Si
X
cos2 θk ||∇fk ||2 < ∞.
k≥0
entonces
cos2 θk ||∇fk ||2 → 0
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Zoutendijk
Si
X
cos2 θk ||∇fk ||2 < ∞.
k≥0
entonces
cos2 θk ||∇fk ||2 → 0
método “ideal”
cos θk ≥ δ > 0,
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
para toda k.
Análisis aplicado. Convergencia global.
Zoutendijk
Si
X
cos2 θk ||∇fk ||2 < ∞.
k≥0
entonces
cos2 θk ||∇fk ||2 → 0
método “ideal”
cos θk ≥ δ > 0,
para toda k.
Es inmediato que
lim ||∇fk || = 0
k→∞
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Ejemplos
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Ejemplos
Cualquier método
pk = −Bk−1 ∇fk ,
en donde Bk es simétrica positiva definida: Newton,
cuasi-Newton (BFGS).
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.
Ejemplos
Cualquier método
pk = −Bk−1 ∇fk ,
en donde Bk es simétrica positiva definida: Newton,
cuasi-Newton (BFGS).
Supongamos que la sucesión de matrices {Bk } tiene número
de condición uniformemente acotado. Es decir que existe una
constante positiva M tal que :
cond (Bk ) ≡ ||Bk || ||Bk−1 || ≤ M,
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
∀k.
Análisis aplicado. Convergencia global.
Ejemplos
Cualquier método
pk = −Bk−1 ∇fk ,
en donde Bk es simétrica positiva definida: Newton,
cuasi-Newton (BFGS).
Supongamos que la sucesión de matrices {Bk } tiene número
de condición uniformemente acotado. Es decir que existe una
constante positiva M tal que :
cond (Bk ) ≡ ||Bk || ||Bk−1 || ≤ M,
∀k.
Entonces, se puede probar que (Tarea)
cos θk ≥
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
1
.
M
Análisis aplicado. Convergencia global.
Ejemplos
Cualquier método
pk = −Bk−1 ∇fk ,
en donde Bk es simétrica positiva definida: Newton,
cuasi-Newton (BFGS).
Supongamos que la sucesión de matrices {Bk } tiene número
de condición uniformemente acotado. Es decir que existe una
constante positiva M tal que :
cond (Bk ) ≡ ||Bk || ||Bk−1 || ≤ M,
∀k.
Entonces, se puede probar que (Tarea)
cos θk ≥
1
.
M
Por lo tanto hemos probado que los métodos: Newton,
cuasi-Newton (BFGS) convergen globalmente.
José Luis Morales http://allman.rhon.itam.mx/∼jmorales
Análisis aplicado. Convergencia global.

Documentos relacionados