Capítulo 2 Identificación y control predictivo no lineal

Transcripción

Capítulo 2 Identificación y control predictivo no lineal
Capítulo 2
Identificación y control predictivo no lineal
2.1 Introducción
Entre las técnicas de control usadas en la industria se aprecian en su mayoría el uso de
controladores PID y controladores predictivos lineales. Éstos últimos constituyen una
técnica de control avanzada con una tendencia de gran impacto en la industria. Aunque
estos controladores se han diseñado para modelos lineales, la mayoría de procesos
industriales tienen un modelo no lineal bastante marcado, por lo que uno lineal no
funcionaría adecuadamente.
Estudios realizados a esta problemática conllevan a aplicar modelaciones para poder
sobrellevarla y emplear esta técnica de control para poder alcanzar la consigna requerida en
tiempos adecuados y con gastos menores de energía.
En este capítulo se desarrollará la teoría que se aplicará en las etapas de identificación y
control, en simulación y en aplicación real en un módulo de pH. Realizar el proceso de
identificación y un diseño adecuado del controlador optimiza las variables de trabajo y
reduce los errores.
Estos procesos para el tratamiento de sistemas no lineales están aún en prueba para
poder aplicarlos a gran escala en los procesos industriales con no linealidad marcada,
donde otros controladores no tendrían las prestaciones adecuadas para trabajar bien.
22
2.2 Sistema
Como sistema se puede considerar al ámbito en el que interactúan básicamente las
variables de entrada, de salida y perturbaciones. En la figura 1 se esquematiza un sistema
con las variables de interacción.
Figura 2.1 Esquema de un sistema.
La entrada es la variable manipulable, es decir, la que el usuario entrega al sistema
según el requerimiento del proceso. La salida es la respuesta del sistema a la entrada y a las
perturbaciones, que son entradas no controlables propias del sistema del ambiente
adicionada en conjunto con el efecto del ruido que son entradas no controlables propias del
sistema o del ámbito del mismo.
2.3 Modelación de un sistema
La modelación de un sistema consiste en obtener una representación del sistema para
poder experimentar con el modelo obtenido a nivel de simulación. Este modelo puede
obtenerse por experimentación (entradas y salidas), por ecuaciones matemáticas, físicas o
químicas. El producto obtenido es conocido como modelo del sistema, con ayuda de este
modelo se puede describir y predecir cómo responderá el sistema a entradas aplicadas,
además permite simular el control para estimar si es válido o no el tipo de control que
desee implementarse.
2.3.1 Tipos de modelos
Se puede hacer una clasificación de los modelos aplicados a procesos industriales de
acuerdo a distintos criterios:
-
Según el nivel de formalismo matemático
A. Modelos paramétricos. Son los modelos obtenidos a partir de relaciones entre
variables internas aplicando para ello ecuaciones de fenómenos físicos, químicos
y matemáticos. Con esto se puede encontrar una ecuación que relacione la
entrada o entradas del proceso con la salida o salidas según corresponda. Estos
procesos se pueden trabajar en sistema continuo (utilizando ecuaciones
diferenciales), o en sistema discreto (usando ecuaciones diferencia).
23
B. Modelos no paramétricos. Son los modelos obtenidos a partir de gráficos de
respuesta (salida) del sistema ante una entrada aplicada al sistema. En sistemas
lineales por ejemplo, es suficiente con aplicar una entrada escalón y analizar su
salida para encontrar la función de transferencia para el modelo.
-
Según la relación entre las entradas y salidas
A. Modelos lineales. Un modelo es lineal cuando cumple el principio de
proporcionalidad y el de superposición. Esto quiere decir, que la salida es
proporcional a la entrada ingresada y que a señales sumadas de entrada, la salida
será la suma de los dos efectos superpuestos. Los modelos lineales son aplicables a
sistemas de temperatura, sistemas eléctricos y otros.
B. Modelos no lineales. Los modelos no lineales no cumplen el principio de
proporcionalidad ni el de superposición. Este tipo de modelos se asemeja más a los
procesos industriales, que son por lo general de no linealidad marcada. Estos
modelos permiten describir el comportamiento del sistema en un rango mayor que
el que puede describir un modelo lineal.
Los modelos se obtienen por identificación (método experimental de pruebas entrada –
salida), o por modelación teórica (usando ecuaciones físico-químicas). Sin embargo
ninguno de los dos métodos por sí solos permite obtener un modelo preciso.
La modelación por identificación se restringe a un rango limitado de validez, y la
modelación teórica descuida algunos parámetros desconocidos como condiciones
ambientales que afectan a la respuesta del sistema, por ello, lo ideal es realizar una
combinación de ambos métodos para obtener un modelo de mejor aproximación.
2.4 Identificación de un sistema
Es la fase inicial para poder estimar las variables necesarias para el modelo que se
creará, con el objetivo de asemejarlo lo más posible al proceso real. Los sistemas que se
requieren identificar pueden ser lineales o no lineales.
2.4.1
Identificación de sistemas lineales
Los sistemas lineales son fáciles de identificar y no presentan mayor problema,
muchos métodos pueden ser aplicados, entre los más comunes se encuentran el desarrollo
de ecuaciones de fenómenos físico-químicos y la aplicación de entradas escalón para
encontrar una función de transferencia con la salida. Otra señal utilizada es la PRBS
(Pseudo Random Binary Secuence), que permite observar la dinámica del proceso (ver
figura 2.2). Se emplea esta tipo de identificación cuando el rango de trabajo no es muy
grande y por tanto permite aproximar con una linealización de la zona de trabajo.
24
-3
7
x 10
6
5
Amplitud Señal
4
3
2
1
0
0
100
200
300
TIempo (s)
400
500
600
Figura 2.2 Señal PRBS.
2.4.2 Identificación de sistemas no lineales
El proceso de identificación de sistemas no lineales es más complicado, que el antes
expuesto, sin embargo es muy importante para poder realizar un control en un rango más
amplio, donde una modelación lineal deja de tener buenas prestaciones.
Para realizar este estudio es muy importante disponer de señales entrada – salida
adecuadas considerando todas las frecuencias posibles y abarcando todo el rango de
amplitud en el que se desarrollará el control posterior. Además el periodo de muestreo
debe permitir obtener toda la información importante sin descuidar una excesiva toma de
datos innecesarios.
Suele emplearse para la dinámica de estos procesos señales PRS (Pseudo Random
Signal) como la que se puede apreciar en la figura 2.3.
-3
6
x 10
5
Amplitud señal
4
3
2
1
0
0
2000
4000
6000
8000
10000
Tiempo (s)
Figura 2.3 Señal PRS.
12000
14000
16000
18000
25
2.5 Identificación no paramétrica de modelos no lineales
Un proceso de identificación no paramétrica se realiza excitando el sistema con señales
de ingreso como escalón, sinusoidal, PRS, PRBS y analizando la salida a estas entradas en
un intervalo de tiempo, dependiendo de la señal de ingreso.
La estructura y los parámetros del proceso no se pueden determinar, por tanto deben
obtenerse de manera iterativa, lo que implica un proceso de corrección continua hasta
encontrar el mejor resultado.
El proceso de identificación se esquematiza en la figura 2.4:
Figura 2.4 Proceso de identificación no paramétrica.
La adquisición de información se constituye por la selección de datos experimentales
de entrada y salida para poder realizar el análisis con los datos relevantes. En la selección
de la estructura del modelo es necesario tener un previo conocimiento del proceso y de las
perturbaciones que lo afectan. La elección de algoritmos para determinar parámetros debe
realizarse como recursivos para poder optimizar el modelo. Por último debe realizarse la
validación del modelo identificado con un criterio de reducción del error (comparación con
el proceso real). Como se puede observar en el esquema 2.4 si el modelo final no es
satisfactorio, se debe regresar a cualquiera de las etapas anteriores y modificar la
estructura, datos o modificar el método de identificación.
2.5.1
Tipos de modelos no paramétricos
La identificación no paramétrica permite obtener modelos que son descritos por un
número infinito de parámetros, que asume la restricción de ser bueno solo para propósitos
de identificación y control.
Los modelos principales que se tratarán son de tipo entrada – salida dinámicos y
SISO (single input single output).
26
Series de Volterra. Fueron desarrolladas en 1887 por Vito Volterra. Es un modelo del
comportamiento no lineal, muy similar a las series de Taylor, pero que difiere en la
habilidad de capturar efectos de memoria. Son utilizadas en sistemas de no linealidad leve.
Por lo tanto un sistema estático con no linealidad leve puede describirse con una señal de
entrada u(t) y una de salida y(t).
A medida que el valor de n se incrementa se obtiene una mejor aproximación,
además será analítico si tiene característica de ‘single value’, que hace referencia a un solo
valor salida para cada valor de entrada (lo que significaría que tenga la característica de
función inyectiva).
Para un sistema dinámico lineal, la salida se halla con la integral de convolución en
dominio continuo de la siguiente manera:
Y en dominio discreto de la siguiente manera:
Donde:
Los modelos de Volterra presentan muchos parámetros, por ello se usan en algunas
aplicaciones como neurociencia, biología, medicina, controladores humanos, presión
sanguínea y otros.
Series de Hammerstein. Es la extensión de la función ponderada usada en el caso lineal
para el caso no lineal. Está constituida de una parte estática y una parte dinámica en
cascada.
Son expresadas en el dominio continuo como:
Y en dominio discreto como:
Series de Wiener. Estas series dependen del sistema y de las señales de entrada. Expresan
el modelo no lineal con ayuda de las series de Laguerre, obteniendo la siguiente expresión
para el dominio continuo:
27
Y para el sistema discreto se obtiene la siguiente expresión:
2.6 Identificación paramétrica
En su forma general, un modelo paramétrico puede representarse de la siguiente
manera en sistema discreto:
Donde:
La ecuación 2.1 tiene su representación en diagrama de bloques como se muestra en la
figura 2.5.
Figura 2.5 Diagrama de bloques para un modelo general.
Para un modelo de una entrada y una salida, la ecuación 2.10 se convierte en:
28
Donde:
-
Cuando
expresión:
se obtiene por reducción de la ecuación 2.11 la
De esta expresión se obtiene el valor del error, como la diferencia entre la salida
medida y la salida del modelo.
-
Cuando
-
Cuando
se obtiene la expresión:
se obtiene:
A esta estructura del modelo se le conoce como ARMAX (AutoRegresive
Moving Average).
-
Y cuando
la expresión se convierte en:
Esta estructura del modelo es conocida como ARX (AutoRegresive with
eXternal input).
2.7 Validación de modelos
Realizada la identificación del sistema se procede a la obtención del modelo, que debe
probarse para poder compararlo con el proceso real. La validación por tanto indicará
cuando un modelo es lo suficientemente adecuado para predecir la respuesta que
entregaría el sistema, y si no lo es, cuáles son los posibles defectos.
29
Un procedimiento para realizar esta validación del modelo encontrado, consiste en dar
entradas distintas a las utilizadas para la identificación tanto al modelo como al proceso
real y comparar ambas respuestas. Este método es conocido como validación cruzada.
Para poder dar un valor cuantitativo de la medida de la calidad del modelo encontrado
se usan índices de prestación, entre ellos, el índice RMS (Relative quadratic average) y el
MSE (quadratic average error). El primero indica una medida del error respecto al valor
real. El segundo indica la variación del error.
Donde:
2.8 Identificación recursiva
Se realiza cuando se necesita estimar los parámetros mientras se reciben los datos
entrada-salida, por lo tanto, estos parámetros son constantemente actualizados con el uso
de algoritmos conocidos como métodos de identificación recursiva.
Este algoritmo ha sido enunciado como:
∧
y
Siendo:
∧
y
Donde:
30
∧
y
2.9 Modelos orientados al bloque
Los modelos orientados al bloque han sido desarrollados para superar el problema de la
no linealidad de manera práctica, es por ello que han adquirido gran importancia en los
últimos años. Sus prestaciones son muy adecuadas para modelar sistemas no lineales.
Se componen por dos bloques en cascada, uno de ellos representa la no linealidad del
sistema y el otro representa la dinámica lineal del mismo. Esto permite extender los
conocimientos de control de los sistemas lineales a los no lineales evitando las
complicaciones en el análisis.
En algunos casos estos modelos son retroalimentados como se aprecia en la figura 2.6
Figura 2.6 Modelo orientado al bloque retroalimentado.
Es necesario tener en cuenta que esta modelación sirve solamente para sistemas no
lineales en estado estacionario. Por ello se mostrará a continuación algunos tipos de no
linealidades estáticas (ver tabla 2.1).
Tabla 2.1 Tipos de funciones continuas y discontinuas
N°
Tipo
Características
Derivada
1
Función continua
Continua
2
Función continua con
derivada discontinua
Discontinua (punto de
quiebre)
3
Función discontinua con
derivada discontinua
Discontinua
31
Se le considera función continua si sus derivadas también lo son en todo el rango, y
función discontinua se le considera si presenta puntos de quiebre o una derivada
discontinua.
Durante el proceso de aproximación de funciones no lineales, se emplean usualmente
curvas polinómicas, sin embargo en algunos casos se emplean otras funciones de
aproximación (ver tabla 2.2)
Tabla 2.2 Funciones empleadas para aproximación.
N°
Tipo
1
Curva original
Representación gráfica
Ecuaciones
Y = f (u )
Y = f (U i ) + (U − U i )x
2
Stepwise lineal
f (U i +1 ) − f (U i )
U i +1 − U i
Si: U i ≤ U ≤ U i +1
Y = f (U i )
3
Stepwise constante
Si U i ≤ U ≤ U i +1
Como ya se mencionó en el apartado 2.5.1, existen relaciones llamadas de valor
simple (single value), que presentan relación unívoca entre la señal de entrada y la de
salida, sin embargo, el que una función sea unívoca no es condición suficiente para que su
inversa también lo sea.
Existen funciones simples con inversa de valor simple, funciones simples con
inversa de valor múltiple, funciones múltiples con inversa de valor simple y funciones
múltiples con inversa de valor múltiple.
La tabla 2.3 permite observar de manera gráfica la clasificación antes realizada.
32
Tabla 2.3 Relaciones de no linealidades simples y múltiples
N°
Nombre
1
Valor simple con inversa de valor
simple
Función
Función Inversa
Y
2
Valor simple con inversa de valor
múltiple
3
Valor múltiple con inversa de valor
simple
4
Valor múltiple con inversa de valor
múltiple
U
Según se presenten estas relaciones se debe hacer un estudio para la parte de la no
linealidad, no todos los métodos pueden cumplir para todos los casos de no linealidad.
2.10
Modelos orientados al bloque en cascada
Estos modelos presentan una sola parte dinámica pero pueden presentar más de una
no linealidad estática conectada en cascada (serie) a la anterior (ver figura 2.7)
No linealidad
estática
Dinámica del
proceso
33
Figura 2.7 Representación de bloques en cascada (1 sola no linealidad).
Se puede apreciar un sistema de bloques en cascada en el que todas las señales
pueden medirse en la etapa de simulación (una vez obtenida la no linealidad y la
dinámica), pero cara a la identificación de un proceso real, es imposible medir este
parámetro (un proceso real no puede separar su no linealidad de su linealidad).
Entre las principales estructuras de modelos orientados al bloque en cascada se
encuentra el modelo Hammerstein, el modelo Wiener y el modelo Hammerstein-Wiener.
Los bloques o elementos constituyentes de la representación cascada pueden tener
distintas maneras de obtenerse, se estudiará a continuación algunos de ellos.
A. Bloque estático no lineal.
Este elemento puede acogerse a ilimitadas estructuras debido a que no almacena
información referente a las entradas, desde las más simples hasta las más complejas.
Es importante para decidir por alguna estructura, el conocimiento de la no linealidad
que presente el sistema (continua o discontinua)
Entre las opciones de modelación se encuentran:
-
Representación polinomial. Es muy flexible y su forma de implementación es más
sencilla. Puede emplease desde el polinomio cuadrático simple (grado 2) hasta uno
de orden muy superior.
-
Series de potencia. Las funciones en esta modelación son simples potencias de una
variable. Se adecuan al funcionamiento en las zonas de trabajo adyacentes a un
punto específico respecto al cual se ha identificado, sin embargo sus prestaciones
son pobres al alejarse de ese punto. Su expresión es la siguiente:
(2.20)
-
Funciones spline. Un spline es una curva definida en porciones mediante
polinomios. Es una interesante alternativa de representación por su facilidad de
cálculo. Esta aproximación permite obtener modelos de no linealidades
discontinuas, que se producen por saturación, ganancia variable, y otros.
El spline siempre es de un grado mayor al de los polinomios empleados. Por
ejemplo, si se emplea un polinomio de orden n, el spline correspondiente será de
orden n+1. Una forma bastante conveniente de representar los splines es como una
expansión de funciones básicas.
-
Función lineal a tramos. Son conocidas también como funciones piecewise y se
usan para aproximar funciones genéricas. Son muy buenas para representar no
linealidades porque permiten un tratamiento sistemático y exacto de las funciones
de aproximación.
34
B. Bloque dinámico lineal
Por ser un sistema dinámico lineal, se trabaja con modelos lineales dando énfasis al
trabajo en sistemas discretos.
Destacan entre estos modelos discretos:
-
Representación ARX. (AutoRegressive with eXogenous inputs). Muy empleado
para representar modelos paramétricos donde el subsistema lineal H(z) puede ser
representado como sigue:
(2.21)
Donde los parámetros p y q son de orden finito, y la ganancia en estado
estacionario es dada por:
(2.22)
-
Respuesta finita a entrada impulso (FIR). Es conocido también como modelo de
convolución y está referida a la siguiente relación entre la entrada y la salida del
proceso:
(2.23)
En la expresión mostrada,
representa la salida muestreada al excitar al
proceso con una señal impulso unitario durante el período de muestreo.
Cuando la función se discretiza, se obtiene la expresión:
(2.24)
-
Respuesta finita a estrada escalón (FSR). Presenta como única diferencia con el
modelo anterior, la señal empleada, en este caso se usa escalón en lugar de
impulso. Viene definida de la siguiente manera:
(2.25)
Y al discretizar el modelo, se encuentra la expresión:
(2.26)
35
-
En estas expresiones, el término
representa los valores de la salida
.
muestreada para una entrada escalón y
Bases ortonormales racionales.
Representación por espacio de estados. Los espacios de estado son modelos
paramétricos que tienen la ventaja de poder trabajar con procesos multivariables
(MIMO), su representación es la siguiente:
(2.27)
(2.28)
Donde:
.
.
.
Q: matriz de salida.
Con este modelo se pueden trabajar los procesos multivariables (MIMO), sin
embargo, las variables de estado no tienen un significado físico
2.11 Modelación Hammerstein
Un modelo Hammerstein consiste en la unión en cascada una no linealidad estática
(Nonlinear system) y en seguida de un sistema dinámico lineal (linear system). Debido a
que muchos procesos presentan esta estructura, esta modelación resulta ser muy útil.
En los modelos Hammerstein la variable de entrada u(k) ingresa al sistema y es
transformada por el bloque de no linealidad estática para convertirse en la señal interna
v(k) de ingreso al bloque dinámico, luego de este último bloque, se obtiene la salida del
sistema, que debe coincidir con la salida del sistema real.
En la figura 2.8 se aprecia una estructura Hammerstein y las variables implicadas en
el proceso. La no linealidad convierte la variable u(k) en la variable v(k), de modo que
, y el modelo dinámico proyecta la variable intermedia v(k) en la salida
.
total del modelo y(k), cumpliendo
No linealidad
estática (Ne)
Sistema dinámico
lineal: H(z)
Figura 2.8 Estructura del modelo Hammerstein.
Según el modelo, la variable u(k) se transformará en la variable v(k) sin afectarse
sus propiedades, si se ingresan señales pulso, escalones o secuencias binarias, la variable
intermedia v(k) también presentará la misma característica general, pero con valores
36
diferentes. Por lo tanto, la respuesta cualitativa del sistema será determinado por el bloque
dinámico lineal H(z).
La modelación Hammerstein implica un poco más de esfuerzo durante el desarrollo
que el invertido en un modelo lineal, sin embargo, los resultado obtenidos ofrecen mejores
características, con lo que el rango de operación puede ampliarse a la vez que se evitan
complicaciones con operadores no lineales.
Como ya se ha expuesto, la modelación no lineal se da en la entrada por lo que puede
representar convenientemente procesos industriales como:
-
Hornos industriales.
Intercambiadores de calor.
Columnas de destilación.
Regulación de pH.
Planta térmica de generación de energía.
Unidad de potencia eléctrica.
2.11.1 Estructuras del modelo Hammerstein.
Con el objetivo de encontrar los modelos de los subprocesos, tanto del no lineal
como del dinámico lineal, se estudian posibilidades que originan distintas combinaciones
para representar los bloques.
Con ayuda de la figura 2.9 se realizará un estudio de las principales posibilidades
de representar los subprocesos.
Figura 2.9 Estructura Hammerstein con disturbio a la salida.
A.
Estructura NARX. Esta estructura se origina cuando el bloque estático no lineal
se trabaja con una expresión polinomial o B-spline y el bloque dinámico lineal
con una representación ARX.
Con ayuda de la ecuación 2.17 y considerando que
obtiene:
, se
(2.29)
37
Donde como ya se mencionó, la función Ne puede ser una expresión polinomial o
una función B-spline.
En estado estacionario, el valor de la salida será:
(2.30)
Donde
B.
viene a ser la ganancia en estado estacionario para el modelo lineal.
Estructura B-spline. Respuesta finita a entrada escalón. Esta estructura se
origina cuando el modelo estático no lineal está conformado por una función Bspline y el bloque dinámico lineal un modelo de respuesta finita a entrada escalón.
La salida del bloque dinámico para esta estructura es expresada como:
(2.31)
Y la del bloque estático no lineal es expresada como:
(2.32)
Donde
es un spline de orden r.
Y el modelo Hammerstein en conjunto sería expresado como:
(2.33)
C.
Estructura de funciones LAT-espacios de estado. Esta estructura se genera al
considerar al bloque estático no lineal como una función lineal a tramos y al
bloque dinámico lineal un modelo en espacio de estados.
La salida del bloque dinámico lineal se expresa como:
(2.34)
(2.35)
Y la salida del bloque estático no lineal se expresa como:
(2.36)
Por lo tanto el modelo Hammerstein final será representado por las ecuaciones en
espacio de estado:
(2.37)
(2.38)
38
D. Estructura de bases ortonormales. Esta estructura es generada cuando se trabaja el
bloque no lineal como representaciones polinomiales o B-splines y el bloque
dinámico lineal se trabaja con bases ortonorrmales.
La salida del bloque lineal será por tanto:
(2.39)
Y como la salida del bloque no lineal es:
(2.40)
El modelo Hammerstein obtenido será:
(2.41)
Como se puede observar, la estructura del modelo Hammerstein será definida por
las estructuras escogidas para los bloques de subprocesos lineal y no lineal.
2.11.2 Identificación de modelos Hammerstein.
Dada la variedad de procedimientos de identificación, se hará una clasificación para
estos elementos en cascada orientados al bloque.
A. Identificación en una etapa.
La información dinámica es utilizada para identificar la parte lineal y la no lineal del
modelo en un paso. Es útil cuando el sistema en estudio no presenta una no linealidad
muy marcada (de grado inferior).
Los parámetros de identificación son calculados con algoritmos basados en técnicas
para modelos residuales es decir, mínimos cuadrados y predicción del error
principalmente.
B. Identificación en dos etapas.
La identificación en dos etapas se realiza primero identificando un bloque para luego
usar esa información e identificar el segundo bloque. Según el orden de identificación
de los bloques se puede dar:
Enfoque N-L. En este caso, lo primero en desarrollarse es la identificación de la no
linealidad estática para su uso posterior en la obtención del modelo de dinámica lineal.
Siguiendo el orden de identificación de bloques se aplica:
39
Para la no linealidad estática: Se identifica utilizando algoritmos basados en el método de
los mínimos cuadrados (incluyendo sus variantes). Los datos estacionarios de salida para
cada entrada escalón se ajustan para obtener una representación de la no linealidad.
Obtenido este modelo, es necesario analizar y calcular la variable intermedia
valores usados en la primera identificación.
para los
Para la dinámica lineal: Se identifica utilizando datos en estado transitorio
correspondientes a la variable intermedia y a la variable de salida y. Para esta
identificación se emplean algoritmos basados en estimación para modelos residuales
lineales paramétricos.
Enfoque L-N. En este enfoque lo primero en desarrollarse es el bloque lineal y luego el no
lineal.
Siguiendo este orden se trata a los bloques de la siguiente manera:
Para la dinámica lineal: La identificación de este bloque lineal se realiza utilizando
principalmente el método de correlación paramétrica a partir de una descripción entradasalida del proceso.
Para la no linealidad estática: Se realiza la identificación del bloque no lineal con pruebas
que exciten la totalidad del proceso, y con el bloque lineal se obtienen las señales
intermedias , con la que se ajusta la ganancia empleando algoritmos basados en el método
de mínimos cuadrados y sus variantes.
En el desarrollo de estructuras Hammerstein se da un caso especial de identificación, en la
que la parte no lineal se representa con dos segmentos de aproximación polinomial (f y g)
y la parte dinámica por una función de transferencia. Los métodos de identificación
recursiva son importantes tanto por el hecho de poder ser calculados en tiempo real como
por poder ser combinados con estrategias de control on- line para producir algoritmos de
control adaptativo.
Empleado el esquema de la figura 2.10, el sistema dinámico lineal puede ser descrito
como:
(2.43)
Donde
representa el retraso puro del sistema,
y
son las entradas y salidas,
y
son escalares polinomiales en el operador
de
respectivamente,
retraso de la unidad. Se definen:
(2.44)
(2.45)
40
Y
es el ruido de salida. El bloque no lineal es caracterizado por:
Donde
y
son las entradas y salidas, respectivamente.
(2.47)
Figura 2.10 Estructura del modelo Hammerstein
Por tanto, al definir una función de conmutación (expresión 2.43)
La relación entre la entrada
expresada como:
y la salida
de la no linealidad asumida puede ser
(2.49)
O como:
(2.50)
En el caso de que los polinomios puedan aproximarse a :
De esta manera, al remplazar la expresión 2.50 en la 2.43, el modelo Hammerstein se
expresa como:
41
Las estimaciones de parámetros desconocidos pueden ser generadas por el algoritmo de
mínimos cuadrados usando entradas y salidas medidas en el sistema y estimación de
variables internas.
2.12
Control predictivo basado en el modelo (MPC)
El control predictivo basado en el modelo (model predictive control) hace
referencia a una familia del control predictivo, cuyas bases se fundamentan en algunas
ideas comunes como el uso explícito de un modelo de predicción de la salida en instantes
futuros (horizontes), cálculo de secuencias de control para minimizar la función objetivo
tratada y estrategia recesiva para que el horizonte se desplace hacia el futuro.
Estos algoritmos MPC difieren entre sí en los modelos usados para representar al
proceso, en los ruidos y en la función de costo que requiere ser minimizada. Es muy
utilizado en aplicaciones industriales como en torres de secado, columnas de destilación,
plantas de PVC y otros.
Las ventajas que permite alcanzar este tipo de métodos son:
-
Sintonización relativamente fácil.
Permite controlar procesos con largos tiempo de retardo, a fase no mínima, y
también inestables.
El caso multivariable es tratado adecuadamente con esta modelación.
Presenta una compensación intrínseca de tiempos muertos.
Introduce el control feed forward en adelanto para compensación de disturbios
medibles.
Los principales objetivos perseguidos por esta familia de controladores predictivos son:
-
Estabilidad. Se busca un comportamiento sin oscilaciones en la variable de control.
Rendimiento. Se debe alcanzar el setpoint en el tiempo deseado.
Robustez. Este controlador busca mantener la estabilidad y rendimiento frente a
errores o perturbaciones externas.
Adaptatividad. Debe responder adecuadamente en caso los objetivos cambien o las
características de la planta cambien.
Rapidez en el cálculo. El cálculo de la señal óptima de control se realiza on-line, en
cada muestreo.
Es muy importante que el modelo obtenido y el proceso real no tengan
discrepancias importantes significativas, de lo contrario, no se satisfarán estos
objetivos.
42
2.12.1
Estrategia de control predictivo basado en el modelo.
La estrategia planteada para los métodos de control predictivo son:
-
-
-
Predicción de las salidas futuras en cada instante t para un horizonte de predicción
determinado usando para ello el modelo obtenido del sistema. Estas predicciones
dependen de los valores pasados de entradas y salidas, y de las señales de control
futuras.
Las señales de control futuras son calculadas optimizando un criterio que
usualmente es una función cuadrática de errores entre la salida predicha y la
trayectoria de la referencia.
En el un instante determinado solamente se envía la señal actual, ya que las
calculadas para instantes posteriores son recalculadas con los datos recibidos de la
lectura de la última salida. Este proceso se repite en cada muestreo.
El modelo obtenido con la identificación es muy importante en la fase de diseño del
controlador, ya que debe ser capaz de captar la dinámica del proceso para poder predecir
con exactitud las salidas futuras.
2.12.2 Elementos del MPC
Los algoritmos MPC presentan elementos comunes que son: modelo de predicción,
función objetivo y ley de control a obtener.
2.12.2.1 Modelo de predicción.
Se necesita el modelo para poder estimar las salidas del proceso en instantes
con mucha precisión. Este modelo debe haber capturado bien la
futuros
dinámica del proceso para realizar una buena representación del mismo.
Los modelos de predicción deben constar de dos partes:
A. Modelo del proceso. Para escoger la estructura de este modelo se debe conocer las
prestaciones que se desean alcanzar y las limitaciones de funcionamiento del
controlador.
Las formas más usadas en esta modelación son las siguientes:
- Respuesta al impulso. Es conocido también como modelo de convolución. La
salida viene determinada por la ecuación:
Donde es la salida muestreada cuando el proceso se excita por un impulso
unitario. La sumatoria es truncada para N valores y se expresa por la ecuación:
43
Donde
.
Por lo tanto la predicción se dará por:
- Respuesta al escalón. Es similar al caso anterior con la diferencia del tipo de
señal de entrada, ahora será una de tipo escalón.
La salida será determinada por la ecuación:
Considerando que
el predictor obtendrá la forma:
- Función de transferencia. Se utiliza el concepto de que una función de
transferencia viene determinada por
en discreto, por lo tanto la salida
será determinada por:
Donde:
- Espacio de estados. Esta modelación tiene la siguiente representación:
44
Donde x son los estados, M la matriz del sistema, N la matriz de entrada y Q la
de salida.
La predicción se dará por tanto mediante la ecuación:
B. Modelo de los disturbios. Este modelo es usado para representar disturbios y es tan
importante como la elección del modelo del proceso.
Un modelo empleado es el CARIMA, en el que la diferencia entre la salida
medida y la calculada hará referencia al disturbio expresado por la ecuación:
Donde
es un ruido blanco, el polinomio C es considerado de valor 1 y el
polinomio D incluye un integrador
.
Por lo que se obtiene la ecuación:
Donde la expresión para la predicción será:
2.12.2.2 Función objetivo.
La función objetivo es la función de costo que debe minimizarse para obtener la
ley de control, la finalidad es que la salida futura en el horizonte considerado siga la
señal de referencia considerando a la vez que la señal de control sea bien regulada.
En general, una función objetivo se enuncia por la ecuación:
Se puede encontrar en dicha función los siguientes parámetros:
-
Parámetros
y
. Son los horizontes de costo mínimo y máximo
es el horizonte de control, que no
respectivamente, mientras que
necesariamente coincide con el horizonte máximo.
45
Analizando el valor de
se puede concluir que un valor elevado implica que
no importa el error cometido en los primeros instantes de control, por lo tanto el
sistema responderá suavemente.
y
son consideradas valores constantes que
Las secuencias de pesos
ayudan en la obtención el comportamiento seguro.
-
Trayectoria de la referencia. Si es conocida esta trayectoria, se facilita el control
predictivo ya que el sistema puede reaccionar antes de que el cambio se haya
realizado efectivamente, evitando los retardos en la respuesta del proceso.
Normalmente, en muchas aplicaciones esta trayectoria ya es conocida y para
minimizar la ecuación (2.68) por lo general se utiliza una trayectoria de referencia
que no necesariamente coincide con la referencia real.
-
Restricciones. Todos los procesos presentan restricciones, como por ejemplo el uso
de válvulas cuando están limitadas por las posiciones de totalmente abierto y
totalmente cerrado, y la velocidad de respuesta.
2.12.2.3 Ley de control a obtener.
se debe
Para obtener los valores futuros de la variable de entrada
minimizar la función J, descrita por la ecuación (2.68). Con ayuda del modelo obtenido en
la identificación, y después de sustituirlo en la función de costo, se obtienen una expresión
que al minimizarla da como resultado los valores buscados.
Al estructurar la ley de control, que está basada en el concepto de horizonte de
control, se mejora la robustez y el comportamiento general del sistema.
2.13
Control Predictivo Generalizado (GPC)
El controlador predictivo generalizado se ha convertido en uno de los métodos MPC
más importantes, ya que ha sido implementado en aplicaciones industriales y se han
obtenido mejores prestaciones que con otros controladores aplicados.
El problema de control es manejado con la utilización de un número razonable de
variables de diseño, que deben ser especificadas por el usuario teniendo en cuenta los
objetivos de control y las leyes físicas que gobiernan los procesos industriales.
La idea en la que se fundamenta este controlador, es en obtener señales futuras
secuenciales que minimicen una función de costo definida sobre un horizonte de
predicción. Se optimiza una suma de dos funciones: la primera es una función cuadrática
que se encarga de regular la distancia entre la salida predicha por el sistema y la secuencia
46
de referencia (lo que minimiza el error y el tiempo de establecimiento) y la segunda es
también una función cuadrática que minimiza el esfuerzo de control (para obtener una
mejor señal de entrada de control).
El controlador GPC presenta entre sus ventajas el trabajar con soluciones analíticas y la
posibilidad de trabajar con sistemas inestables y de fase no mínima, además de ponderar
los incrementos de la señal de control para ahorrar energía.
2.13.1 Formulación del Control Predictivo Generalizado
Se trabajará con un sistema de una entrada y una salida que puede ser descrito en
dominio discreto por la ecuación:
Donde se aprecia la secuencia de control
y el tiempo muerto se expresa por d.
Además los polinomio
continuación:
,la salida de la planta
, el ruido blanco
son expresados por los polinomios mostrados a
Si los disturbios son no estacionarios, es necesario usar el modelo de la ecuación 2.73, que
es muy útil en aplicaciones industriales para sobrellevar este problema.
Siendo:
El polinomio C simplemente es considerado igual a 1, y la función de costo que será
minimizada con la aplicación de la secuencia de control es la siguiente:
El objetivo del control predictivo es el de calcular una secuencia de control futura
… para asegurar que la salida futura de la planta se encuentre cercana a la
47
referencia futura
citada.
que se asegura cuando se minimiza la función de costo antes
Para optimizar la función de costo se obtendrá la predicción óptima de
. Se considerará la siguiente ecuación Diofantina:
valores de
El polinomio
es de grado
y el polinomio
para
es de grado
. Estos
hasta lograr que el residuo sea
polinomios se obtienen realizando la operación
factorizado como
. El cociente de la división da como resultado el polinomio
Multiplicando la ecuación (2.73) por el término
Diofantina, esta misma ecuación puede ser ordenada como
, y considerando la ecuación
Dado que el grado del polinomio
es
, el término del ruido
encuentra en el futuro, por lo tanto la mejor predicción de
es:
se
En la que
El cálculo de los polinomios
y
es recursivo y dado de la siguiente manera:
(2.79)
El polinomio
y el polinomio
se obtienen en la siguiente división como:
(2.80)
Considerando que
.
48
Los coeficientes del polinomio
, pueden expresarse como:
; donde i = 0, 1, ….. (na-1)
Además el polinomio
continuación:
(2.81)
puede ser obtenido de manera recursiva como se muestra a
(2.82)
Por lo tanto los primeros coeficientes de
coeficientes restantes estarán dados por:
serán idénticos a aquellos de
y los
(2.83)
Considerando un tiempo muerto de períodos de muestreo, la salida del sistma será
influenciada por la señal
después del periodo de muestreo
.
Por lo tanto:
.
Entonces considerando las predicciones óptimas:
(2.84)
Que pueden ser escritas como:
Donde:
49
Y además se visualiza que los dos últimos términos de la ecuación (1.75) solo
dependen del pasado y pueden ser agrupados como . Por lo tanto dicha ecuación queda
expresada como:
(2.86)
La primera columna de la matriz G puede ser calculada como la respuesta al escalón
de la planta cuando el escalón unitario es aplicado a la variable manipulable.
Además, la respuesta
puede ser calculada recursivamente como:
(2.87)
Considerando además que
y que
para
.
La ecuación (2.74) puede ser escrita como:
(2.88)
Donde el valor de referencia viene dado por el vector:
(2.89)
Por último, la ecuación (1.79) puede ser escrita como:
(2.90)
Donde:
(2.91)
El primer término de u es aplicado y el procedimiento se repite en el siguiente
periodo de muestreo. La solución del GPC involucra invertir la matriz
, que requiere
una cantidad considerable de cálculos. Sin embargo el horizonte de control permite reducir
50
la cantidad de cálculos necesarios considerando que las señales de control serán constantes
después de que sea mayor que , que implicaría la inversión de una matriz de menor
orden
.
2.14 Control Predictivo no lineal basado en la modelación Hammerstein
Hasta ahora se han dado los conceptos necesarios de modelación Hammerstein para
sistemas no lineales y del controlador predictivo GPC lineal. En este apartado se estudiará
la forma de implementar un controlador predictivo GPC lineal a un proceso no lineal con
el uso del modelo Hammerstein.
Según la estructura Hammerstein, un sistema no lineal puede representarse por
bloques en cascada, uno de la no linealidad estática y uno de la dinámica lineal. Si no
existiese el bloque no lineal, el controlador GPC se programaría directamente sobre el
bloque restante, sin embargo dada la presencia de la no linealidad se recurre a eliminarla
previamente con un bloque del polinomio inverso de Hammerstein.
Matemáticamente si una función es inversa a otra, el resultado en cascada sería la
unidad, que no afectaría el control GPC sobre el bloque dinámico. No hay que perder de
vista, que esto se desarrolla solo con fines de aplicar el control predictivo sobre el sistema,
ya que éste no puede ser alterado, así el polinomio inverso es considerado parte del
controlador, un bloque en cascada al GPC que regulará al sistema real.
Por lo tanto, es requerido que el modelo indentificado de Hammerstein sea lo más
cercano posible al sistema real, para que no se presenten errores en este método.
El control GPC con modelo Hammerstein presenta la estructura mostrada en la figura
2.4.
Figura 2.11 Estructura de Control GPC con modelo Hammerstein.
51
En este diagrama de bloques se aprecia el controlador Gc, el proceso Gp, el modelo
Hammerstein Gm, el polinomio inverso NL-1, la salida del proceso yp la salida del modelo
ym y el set point ysp.
2.14.1 Control Predictivo no lineal basado en modelación Hammerstein con
aproximación polinómica.
Esta estrategia de control consiste en realizar un modelo Hammerstein en el que la
parte de la no linealidad estática sea identificada con aproximación polinómica y la parte
de la dinámica lineal sea identificada por algún modelo lineal de los estudiados en el
apartado 2.10 B. Para el caso en estudio, se ha realizado la aproximación polinómica
mediante aproximación por mínimos cuadrados y la aproximación de la dinámica se ha
modelado con una estructura ARX.
La estructura de control sería aplicar el polinomio inverso del obtenido y
anteponerlo al proceso real, con esto se estaría prácticamente eliminando la no linealidad y
el GPC controlaría prácticamente un modelo lineal.
Para hacer más entendible esta técnica se muestran los siguientes casos, referidos al
análisis:
1. Desarrollo simple en el caso de un proceso lineal. Suponiendo que el proceso a
controlar es lineal, el controlador predictivo generalizado adecuadamente diseñado
lo controla sin problemas. La estructura para realizarlo puede ser la que se muestra
en la figura 2.5, en la que vemos que la señal de salida del controlador va
directamente al actuador del proceso (incluidos en un solo bloque).
Figura 2.12 Estructura de control válida aplicada a un proceso lineal.
2. Caso de control con un proceso no lineal. Si en lugar del bloque del proceso lineal del
apartado anterior, se encuentra un bloque de proceso No Lineal, el controlador lineal
GPC no tendría buenas prestaciones de control.
52
Figura 2.13 Estructura de control no válida aplicada a un proceso lineal.
3. Modelación Hammerstein del proceso no lineal. A partir del proceso No Lineal, se
puede modelar por Hammerstein, los bloques No Lineal y dinámico en cascada. De
igual manera, no puede controlarse directamente con el GPC porque existe la parte no
lineal.
Figura 2.14 Modelación Hammerstein. Estructura de control no válida.
4. Polinomio inverso de Hammerstein. La solución que se propone ante esta
problemática, es anticipar al proceso un bloque del polinomio inverso de Hammerstein
identificado. De esta manera, se reducirá el efecto de la No Linealidad y el controlador
predictivo podrá regular con buenas prestaciones. Como se observa, el polinomio
inverso transforma la señal de salida (u) en una señal intermedia (v), esta nueva señal
ingresa en el proceso real, trabaja directamente con la no linealidad y la dinámica
lineal por tanto es controlada directamente por el GPC.
53
Figura 2.15 Estuctura de control válida. Control predictivo no lineal.

Documentos relacionados