estimacion precoz del rendimiento de la vid: correlacion

Transcripción

estimacion precoz del rendimiento de la vid: correlacion
SERRANO ET AL., ESTIMACIÓN PRECOZ DEL RENDIMIENTO DE LA VID, PÁG.1
ESTIMACION PRECOZ DEL RENDIMIENTO DE LA VID: CORRELACION ENTRE EL
VOLUMEN DE LOS RACIMOS DE VITIS VINIFERA A LO LARGO DEL CRECIMIENTO Y
SU PESO DURANTE LA COSECHA
ERIC SERRANO1, SYLVIE ROUSSEL2, LAURE GONTIER1 ET THIERRY DUFOURCQ1
1
ITV France Midi-Pyrénées, V’Innopôle, BP 22, 81310 Lisle/Tarn, Francia
[email protected]
2
AGROMETRIX, 361 rue JF Breton, BP5095, 34196 Montpellier, cedex 1, Francia [email protected]
Resumen
Este estudio se inscribe dentro del marco de una investigación cuyo objetivo es la búsqueda de una
metodología simple y rápida para la estimación precoz de los rendimientos de una parcela de viña. El
método propuesto se apoya, para la estimación del peso medio del racimo, en la existencia de
relaciones entre su volumen a lo largo de diferentes estadios fenológicos y su peso en la madurez.
El volumen del racimo fue calculado a través de la fórmula de cálculo del volumen de un cono.
Se efectuó un tratamiento estadístico de más de veinte mil datos; estos datos fueron obtenidos a lo
largo de cuatro añadas (2001-2004), tres estadios fenológicos (brotación, cierre del racimo e inicio del
envero), y 19 variedades del género Vitis vinifera.
Los modelos fueron construidos para cada variedad, en cada uno de los estadios.
Se analizó la influencia de la región, del estadio fenológico, de la variedad y de la añada. El
funcionamiento de los modelos está fuertemente influido por el número de parcelas incluidas dentro
del modelo. Las predicciones de los pesos medios de los racimos son satisfactorias a partir del estadio
de cierre del racimo, con unos errores medios en la fase de validación cruzada (cross-validation)
inferiores al 10%. Los modelos fueron validados también a través de una serie de pruebas
independientes efectuadas con la añada 2004. Cuando en el modelo se incluyen varios años, aumenta
la estabilidad de la predicción, permitiendo obtener un funcionamiento medio cercano al 9 %. Se
identificaron tres grupos homogéneos de variedades, lo que permite elaborar los modelos no
separadamente, sino considerando tres grupos de variedades.
INTRODUCCIÓN
La producción vitícola esta marcada por la irregularidad del volumen de la cosecha de un año para
otro. Uno de los retos más importantes es el de poder proporcionar al conjunto de los actores de la
filiera implicados en la estimación del rendimiento un método fiable y rápido que permita unos
pronósticos precoces.
Diferentes métodos han intentado pronosticar de forma precoz el volumen de la cosecha para unos
sectores geográficos más o menos extensos. Los primeros intentos de estimación de los rendimientos
se remontan, según la bibliografía, a 1955 (Wurgler, Leyvraz et Bolay).
A nivel de parcela, los estudios más interesantes a nivel práctico se basan esencialmente en el
recuento de las inflorescencias, del numero de racinos por cepa o de bayas por racimo (Murisier,
1986). Estudios efectuados en Alsacia (1957-1971, Huglin et Schneider) indicaron que las variaciones
del peso medio de los racimos son la principal fuente de error. Dufourcq et Serrano (2003)
demostraron que el coeficiente de variación anual del peso medio de los racimos dentro de una misma
parcela de Négrette alcanza el 15%, lo que confirma los resultados de Huglin et al. (1975) con la Syrah
o de Gerbier et Remois (1977) en Champagne.
Por otro lado, algunos de los métodos propuestos permiten obtener unas estimaciones satisfactorias,
sin embargo han sido poco desarrollados en la práctica a causa de la necesidad de adquirir datos
históricos a lo largo de un periodo de tiempo largo (schneider, 1997), o bien por su aplicación
WWW.INFOWINE.COM – REVISTA INTERNET DE VITICULTURA Y ENOLOGÍA, 2007, N.11/1
SERRANO ET AL., ESTIMACIÓN PRECOZ DEL RENDIMIENTO DE LA VID, PÁG.2
demasido trabajosa (recuento del número de granos presentes en el racimo, número de granos por
sarmiento, peso de los granos) en vista de la calidad de la información ofrecida (Booysen et Al, 1978).
Este estudio puso como condición la no aplicación de las variables número de bayas por racimo y
peso medio indicativo de la baya, para evitar la pesadez de la puesta en práctica de tales
observaciones. El enfoque se basó en la existencia de una correlación entre el volumen del racimo
durante su desarrollo y su peso en el momento de la vendimia. El estudio se interesó especialmente
en el análisis de la primera fase de crecimiento de las bayas, con el fin de determinar un periodo
óptimo de medida para la puesta a punto de un modelo matemático de correlación.
Contemporáneamente, se estudió la influencia de la añada, de la variedad y de la parcela sobre la
precisión de los resultados. Se definieron por último unas reglas de muestreo a nivel de parcela vitícola
teniendo en cuenta el número de racimos por cepa.
MATERIALES Y MÉTODOS
Se recogieron más de veinte mil datos relativos al volumen del racimo en diferentes estadios
fenológicos de la vid y a su peso durante la cosecha. Esta banca de datos experimental fue creada
considerando diecinueve variedades Vitis vinifera a lo largo de seis añadas (de 1999 a 2004). Las
variedades estudiadas fueron Cabernet Franc, Cabernet Sauvignon, Chardonnay, Colombard,
Auxerois, Duras, Fer Servadou, Gamay, Grenache, Gros Manseng, Loin de l’œil, Mauzac, Merlot,
Muscadelle, Négrette, Sauvignon B., Syrah, Tannat y Ugni B. Para cada una de ellas, se identificaron
de dos a tres parcelas en función del nivel de producción y del tipo de suelo.
La forma de una racimo es parecida a la de un cono. Las medidas efectuadas sobre la fruta fueron las
relativas a la altura y a la circunferencia del racimo con la ayuda de una herramienta artesanal que
permitió una medida directa.
Las medidas fueron efectuadas durante los estadios brotación, inicio cierre del racimo e inicio envero
sobre una muestra de 50 a 200 racimos por parcela. Estos racimos fueron señalizados durante la
realización de la primera medida y fueron prensados separadamente durante la vendimia.
1- Estimación del error de muestreo
Para cada una de las cepas se determinó, en varias parcelas de viña con superficies de 0,3 ha a 0,6
ha, el número de racimos presentes. El tratamiento de los datos se efectuó considerando la
distribución de las cepas dentro de la parcela. Se simularon diversos esquemas de muestreo
basándose por una parte en el número de individuos dentro de la muestra y por otra parte en la
distribución geográfica de la muestra.
2- Modelo de correlación lineal
ˆ = ao + a1 ∗ v ,
Los modelos propuestos se basan en unas regresiones lineales, según la ecuación w
donde ŵ es la estimación del peso.
En un primer momento, los modelos se calcularon para cada variedad, añada o estadio fenológico. A
continuación se validaron mediante un tratamiento estadístico de Validación Cruzada (leave-one-out
cross-validation). Este método de validación consiste en generar N modelos por permutación, cada
uno de ellos muestreado en N – 1 individuos, y luego evaluarlo en el individuo que no haya participado
en el modelo. La pertinencia de los modelos es evaluada a partir del Error Estándar proveniente de la
Validación Cruzada (SECV – Standard Error of Cross-Validation). Este error se puede expresar en %
con respecto al peso medio del racimo propio de la parcela considerada, dando lugar a un Coeficiente
de Variación.
En un segundo momento, los modelos fueron validados a través de una serie de pruebas
independientes. Los modelos fueron calculados a partir de los datos procedentes de las añadas 2001,
WWW.INFOWINE.COM – REVISTA INTERNET DE VITICULTURA Y ENOLOGÍA, 2007, N.11/1
SERRANO ET AL., ESTIMACIÓN PRECOZ DEL RENDIMIENTO DE LA VID, PÁG.3
2002 y 2003 y evaluados en función de su capacidad para predecir los pesos medios de los racimos
de la añada 2004.
3- Análisis de Componentes Principales (ACP) y Clasificación Jerárquica Ascendente (CAH)
Los modelos de correlación establecidos por variedad y por añada fueron analizados por Análisis de
Componentes Principales (ACP). En cada estadio fenológico, los ACP fueron efectuados considerando
los coeficientes de regresión, con el fin de definir grupos potenciales de variedades o de añadas.
La Clasificación Jerárquica Ascendente (CAH) tuvo como objetivo el reagrupamiento de las añadas o
de las variedades. La similitud entre los grupos fue calculada con los resultados del ACP, y está
basada en la distancia euclidiana entre los baricentros de los grupos.
Se utilizó el software MATLAB (The Mathworks, NATIC, USA) para el tratamiento de los datos.
RESULTADOS Y DISCUSIÓN
1- Optimización del muestreo: número de pies a observar
La figura 1 presenta la parte de error inducido por el muestreo, aleatorio o en bloque, de un número
creciente de pies.
Independientemente de la configuración de la parcela, el muestreo es más preciso cuando se efectúa
de forma aleatoria. El muestreo en bloque genera un error superior de un 1% a un 5%, en función de
las parcelas y en función del número de pies considerado. Se obtiene una precisión interesante de
muestreo, definida por la desviación con respecto a la media, a partir de al menos 40 pies. Esta
desviación va desde un 14% (Duras) a un 4% (Colombard) y es función de la superficie considerada,
de su densidad de plantación y de su heterogeneidad (pies que faltan o heterogeneidad
ecofisiológica).
1
2
Moyenne globale
Moyenne avec N au hasard
Moyenne avec N par blocs de 5
0.15
Moyenne globale
Moyenne avec N au hasard
Moyenne avec N par blocs de10
0.2
0.1
0.1
0.05
Error
medio
0
0
-0.05
-0.1
-0.1
-0.2
-0.15
-0.3
10
20
30
40
50
60
70
80
90
10
100
20
30
40
Nombre de pieds
3
4
M oyenne globale
M oyenne avec N au hasard
M oyenne avec N par bloc s de10
0.1
50
60
70
80
90
100
Nombre de pieds
0.1
Moyenne globale
Moyenne avec N au hasard
Moyenne avec N par blocs de10
0.08
0.06
0.04
0.05
Error
medio
0
0.02
0
-0.02
-0.04
-0.06
-0.05
-0.08
-0.1
-0.1
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
Figura 1: Desviación con respecto a la media del número de racimos por pie, en función de una muestra de N
pies ; 1 : Négrette ; 2 : Duras ; 3 : Colombard ; 4 : Merlot ; añada 2001.
Con un recuento de más de 60 pies, la precisión no aumenta. Para limitar el error de medida y al
mismo tiempo permitir una aplicación práctica es necesario considerar una muestra de al menos 40
WWW.INFOWINE.COM – REVISTA INTERNET DE VITICULTURA Y ENOLOGÍA, 2007, N.11/1
SERRANO ET AL., ESTIMACIÓN PRECOZ DEL RENDIMIENTO DE LA VID, PÁG.4
pies. Por debajo de estos, el riesgo de error aumenta de forma importante; por encima, su pertinencia
está limitada, teniendo en cuenta el tiempo dedicado.
2- Modelos de correlación para la estimación de los pesos medios de los racimos
Independientemente del estadio fenológico, el coeficiente de correlación calculado en cada muestreo
para una cepa dada, una añada dada o un estadio fenológico dado es elevado. Las medias obtenidas
para el conjunto de las variedades y de las añadas están presentadas en la tabla 1.
2
Tabla1: Coeficientes de correlación (r ) medio de la relación lineal entre el volumen del racimo en diferentes
estadios fenológicos y su peso durante la vendimia (19 variedades, 4 añadas)
Estadio
r2 (muestreo)
Brotación
Cierre del racimo
Envero
0.91
0.90
0.91
r2 (validación
cruzada)
0.42
0.71
0.76
Los funcionamientos de los modelos en validación cruzada son más heterogéneos pero se mantienen
muy satisfactorios en el caso de los estadios más tardíos.
En la brotación, los errores son menos aceptables, estando comprendidos entre 10 y 40 g (SECV).
Independientemente de la añada y de la variedad, la estimación es sistemáticamente más precisa
cuando la medida es más tardía. Existe, en particular, una gran diferencia entre los resultados
obtenidos durante la brotación y los procedentes de los otros dos estadios fenológicos (figura 2).
Erreur de prédiction en
validation croisée (g)
60
Performance des modèles en validation croisée
Nouaison
55
Fermeture de grappe
50
Véraison
45
2
(nombre
de parcelles)
40
35
3
30
3
3
25
2
2
3
20
3
15
3
3
10
5
2001
2002
2003
Millésimes 2001-2004 - Cépage Colombard
2004
Figura 2: Funcionamiento del modelo en Validación Cruzada para Colombard en función del estadio fenológico
La figura 3 muestra los coeficientes de variación obtenidos en Validación Cruzada para el conjunto de
variedades en el estadio de cierre del racimo en 2003 y 2004. Los funcionamientos de los modelos
presentan unos errores medios cercanos al 10 %, siendo el conjunto de ellos inferior al 20%.
WWW.INFOWINE.COM – REVISTA INTERNET DE VITICULTURA Y ENOLOGÍA, 2007, N.11/1
SERRANO ET AL., ESTIMACIÓN PRECOZ DEL RENDIMIENTO DE LA VID, PÁG.5
Coefficients de
variation
(en %)
20
Performance des modèles de régression en validation croisée - Stage FGR
3
CV - 2004
CV - 2003
18
3
3
16
3
3
14
3
3
12
3
3
2
1
10
1
1
1
8
1
6
1
1
1
4
1
1
1
2
1
1
2
1
0
CF
CS
CH
CO
Ct
DU
1
FE
GA GR GM
LL
MA ME MU
NE
SA
SY
TA
UB
Cépages. (Le chiffre correspond au nombre de parcelles)
Figura 3: Coeficientes de variación en Validación Cruzada de las 19 variedades en 2003 y 2004 en el estadio
cierre del racimo
Si el modelo se construye a partir de varias parcelas por variedad, la estimación es menos precisa,
independientemente del estadio fenológico.
Las mismas tendencias se observan analizando los datos obtenidos durante el envero, con unos
coeficientes de variación ligeramente mejores, inferiores en todos los casos al 13 %, para la
estimación del peso medio del racimo por parcela.
3- Validación de los modelos mediante estimación del peso medio al año siguiente
De las 19 variedades estudiadas, sólo 4 fueron sometidas a medidas durante 4 años (de 2001 a 2004)
en los estadios fenológicos cierre del racimo y envero: Colombard, Duras, Merlot y Négrette. Un primer
análisis de los modelos muestra que éstos son diferentes en función de la añada (figura 4). La añada
2003 resultó ser atípica para 3 de las 4 variedades estudiadas (la excepción es Colombard).
Colombard - Stade FGR
Poids
récolte
(g)
Duras - Stade FGR
400
400
300
300
200
200
2001
2002
2003
100
100
2004
2001-2004
0
0
100
200
Volume mesuré (cm3)
300
0
0
Merlot - Stade FGR
2001
2002
2003
2004
2001-2004
100
200
300
400
Volume mesuré (cm3)
500
Negrette - Stade FGR
400
300
250
300
200
2001
200
150
2002
100
2003
100
2004
50
2001-2004
0
0
100
200
300
Volume mesuré (cm3)
2001
2002
2003
2004
2001-2004
400
0
0
50
100
150
Volume mesuré (cm3)
200
Figura 4: Modelos de correlación de 4 variedades en el estadio de cierre del racimo
El estudio fue realizado con la añada 2004 a partir de modelos construidos con todas las
combinaciones posibles, procedentes de las añadas precedentes (de 2001 a 2003).
WWW.INFOWINE.COM – REVISTA INTERNET DE VITICULTURA Y ENOLOGÍA, 2007, N.11/1
SERRANO ET AL., ESTIMACIÓN PRECOZ DEL RENDIMIENTO DE LA VID, PÁG.6
Cuando los modelos se elaboran con los datos de 3 años, los coeficientes de variación aumentan por
término medio de un factor de 1,5 a 2, con respecto a los mejores funcionamientos obtenidos por el
modelo en Validación Cruzada con la misma añada.
La figura 5 muestra los resultados de las estimaciones para la variedad Négrette en el estadio de
cierre del racimo.
Performance des modèles en prédiction de l'année suivante
(2004)
15%
35
30
Erreur de
prédiction
du poids
moyen
25
(g)
11%
11%
9%
9%
9%
20
15
CV = 6%
6%
SEP (2004) - 3 parcelles
10
SECV (divers millésimes)
SECV (2004) - 3 parcelles
5
2001
2002
2003
2001-02
2001-03
2002-03
Cépage Négrette, prédiction du millésime 2004
2001-02-03
Figura 5: Funcionamiento del modelo para la estimación de la añada 2004 a partir de datos anteriores
Cuando el modelo es calculado considerando un solo año, los funcionamientos son muy diferentes de
un año a otro, según la proximidad entre el año sometido a modelización y el año a predecir.
Cuando se incluyen varios años en el modelo, la estabilidad de las predicciones aumenta, permitiendo
obtener un funcionamiento medio interesante cercano al 9 %.
4- Grupos de variedades
Algunas variedades pueden ser agrupadas dentro de un mismo modelo. Este reagrupamiento permite
incrementar la banca de datos, y de esta forma aumentar la estabilidad de los modelos. El objetivo
final es el de generar un único modelo apto para variedades diferentes.
Basándose en los dos últimos estadios fenológicos estudiados, se identificaron 3 grupos que podían
depender de un único modelo de correlación.
Grupo 1 : Duras, Merlot, Mauzac, Syrah
Grupo 2 : Gamay, Chenin, Tannat
Grupo 3 : Cabernet Sauvignon, Cabernet Franc, Gros Manseng
Las otras variedades no pueden ser integradas en ninguno de estos tres grupos.
5- Grupos de añadas
Se realizó un mismo tipo de análisis con las diferentes añadas estudiadas, con el fin de identificar
grupos. El objetivo era el de poder establecer unas fórmulas medias en función de criterios climáticos
(por ejemplo añada seca y húmeda) y de esta forma poder encuadrar la previsión del volumen medio
de los racimos. El análisis estadístico muestra que no existe una fuerte heterogeneidad entre las
añadas. Sólo la añada 2003 parece ser significativamente diferente con respecto a las otras añadas.
El análisis estadístico identifica bien por tanto las condiciones excepcionales de crecimiento de
racimos observada en 2003.
WWW.INFOWINE.COM – REVISTA INTERNET DE VITICULTURA Y ENOLOGÍA, 2007, N.11/1
SERRANO ET AL., ESTIMACIÓN PRECOZ DEL RENDIMIENTO DE LA VID, PÁG.7
CONCLUSIONES
Este estudio estadístico ha puesto de manifiesto el interés de la medida del volumen de un racimo
durante su fase herbácea para estimar su peso durante la vendimia.
Se han podido evidenciar modelos de correlación estables entre la medida del volumen durante el
cierre del racimo o durante el envero, y su peso durante la vendimia.
Los modelos fueron validados por validación cruzada considerando varios años, y fueron
experimentados en lotes totalmente independientes – la añada 2004 -. Estos modelos fueron aplicados
a cada una de las 19 variedades estudiadas. Los coeficientes de variación obtenidos considerados en
conjunto son inferiores al 20 %.
Para aquellas variedades que presentaban una banca de datos importante, se obtuvieron unos errores
de estimación inferiores al10%. Se evidenció un efecto parcela que sin embargo tiende a desaparecer
con el reagrupamiento de los datos procedentes de varias añadas.
Se pudieron identificar también algunos grupos de variedades y añadas. El reagrupamiento de datos
procedentes de diferentes variedades y/o añadas deja entrever también la posibilidad de construir
unos modelos de correlación cada vez más estables y con un mejor funcionamiento. El año 2003, sin
embargo, parece atípico; la introducción de datos de esta añada produce una degrado de los
funcionamientos de los modelos.
Por último, en el marco de una aplicación en campo, el estudio demuestra que un muestreo de al
menos 40 cepas permite limitar de forma óptima el error de medida en el cálculo del número de
racimos por cepa.
BIBLIOGRAFÍA
BOOYSEN J.H., ORFFER C.J., BEUKMAN E.T., 1978. Crop forecasting for vine grapes in South-Africa. OVRI
Stellenbosch, 78-94.
GERBIER N., REMOIS P., 1977. Influence du climat sur la qualité et la production du vin de Champagne.
Monographie n°106, Météorologie Nationale.
HUGLIN P., BALTHAZARD J., 1975. Variabilité et fluctuation de la composition des inflorescences et des grappes
chez quelques variétés de V. vinifera. Vitis, 6-13.
MURISIER F., JEANGROS B., AERNY J., 1986. Maitrise du rendement et maturité du raisin. Revue Suisse Vitic.
Arboric. Hortic. Vol 18 (3) : 149-156.
SCHNEIDER C., 1995. La prévision, un outil pour la maîtrise des fluctuations de rendement en viticulture. C.R.
GESCO, 240-246.
SERRANO E., DUFOURCQ T., CHABERT M., 2002. Recherche d’une méthode simple et fiable d’estimation des
rendements à la parcelle. Actes de colloque Journée Technique Maîtrise des rendements en viticulture, dec.
2002. Station Régionale ITV Midi-Pyrénées.
W URGLER W., LEYVRAZ H. ET BOLAY A., 1955. Peut-on prévoir le rendement de la vigne avant le débourrement ?
Annuaire agr. D. I. Suisse, 766-783.
WWW.INFOWINE.COM – REVISTA INTERNET DE VITICULTURA Y ENOLOGÍA, 2007, N.11/1

Documentos relacionados