Esta primavera los aforos preliminares para la 26/27 tiran al alza. Lluvia oct-abr generosa, embalses muy recuperados —Sevilla en el 83 %, Huelva en el 87 %—, NDVI primaveral en niveles altos. Aforo: cosecha buena.
Conviene tomarse un momento antes de fiarse. En la primavera de 2022 el NDVI andaluz estaba al mismo nivel que el de cualquier año bueno (0,406, igual que 2020 que dio 1.181 kt en las ocho provincias olivareras grandes). Llegó el verano, el termómetro se disparó, y la cosecha se fue a 666 kt: un 55 % menos. Y en 2024, con embalses casi al mismo nivel bajo que en 2022 (39 % frente a 37 %), la cosecha cerró por encima de 1.250 kt porque el verano fue templado.
Cuando la primera versión de este análisis se quedó en escala provincial andaluza con cinco campañas comparables, salió una historia: el calor de mayo a julio era el predictor más fuerte. Pero al ampliar el ejercicio a veinticinco años de datos y nueve países olivareros, esa historia se vuelve más rica y, en algunos puntos, distinta. No hay un solo modelo del olivo mediterráneo. Lo que decide la cosecha en España no es lo mismo que en Italia, ni en Túnez, ni en Marruecos. Eso es lo que cuenta este artículo.
Una nota de método antes de empezar. La producción nacional anual viene del Consejo Oleícola Internacional (IOC), serie 2000-2024 por país. La climatología viene de datos diarios procesados por Olearia Intelligence, agregados al año o a la ventana fenológica relevante. Las correlaciones son Pearson; los R² son simples y se construyen incrementalmente para evitar atribuir el mismo efecto dos veces. Cuando una variable se vuelve irrelevante después de controlar por otra anterior, lo decimos.
Lo que decide la cosecha en España: el agua de enero a abril
Empecemos por casa. España produce de media 1,2 Mt al año, con oscilaciones brutales —de 618 kt en 2012/13 a 1.790 kt en 2018/19—, y veinticinco años de historia disponibles para preguntarle a los datos qué explica esas oscilaciones.
| Serie | 2000 | 2001 | 2002 | 2003 | 2004 | 2005 | 2006 | 2007 | 2008 | 2009 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 | 2023 | 2024 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Producción (kt) | 974 | 1411 | 861 | 1412 | 990 | 827 | 1111 | 1236 | 1030 | 1402 | 1392 | 1615 | 618 | 1782 | 842 | 1403 | 1291 | 1262 | 1790 | 1125 | 1389 | 1492 | 666 | 855 | 1419 |
| Lluvia ene-abr (mm × 5) | 645 | 1060 | 830 | 1155 | 1185 | 420 | 980 | 930 | 970 | 990 | 1870 | 1065 | 455 | 1585 | 1065 | 810 | 980 | 810 | 1830 | 650 | 1110 | 1085 | 1205 | 355 | 1540 |
A simple vista se ve. La cosecha catastrófica de 2022 (666 kt) coincide con uno de los peores eneros-abriles del siglo en lluvia. El récord de 1.790 kt en 2018 coincide con un invierno hidrológico muy generoso. La correlación entre lluvia ene-abr y producción nacional es +0,64 en veinticinco años.
Es robusta. Aguanta si quitamos los dos extremos (2018 récord y 2022 mínimo): r=+0,64. Aguanta en 2000-2010 (r=+0,63), aguanta en 2011-2020 (r=+0,87), aguanta en 2015-2024 (r=+0,62). No es un artefacto de un par de años raros: es señal estructural.
Cuantificándolo en términos más útiles: la lluvia de invierno explica el 41 % de la varianza interanual de la cosecha española. Para una variable única con n=25 en un sistema biológico tan ruidoso como el olivar, eso es muy mucho.
¿Y los embalses? Mucho menos de lo que parece
El sector lleva años hablando de los embalses de Andalucía como si fueran el termómetro principal de la próxima cosecha. Sevilla al 83 %, Huelva al 87 %, Jaén al 65 %. Cuando los números suben, optimismo; cuando bajan, alerta. Pero los datos cuentan algo distinto.
Probamos el nivel de embalse —agregado de cinco provincias olivareras andaluzas, datos semanales 2000-2024, año hidrológico— como predictor de cosecha nacional. La correlación bruta es de +0,34 a +0,36, débil pero positiva. Si construimos un modelo lineal que primero captura el efecto de la lluvia y luego pregunta cuánto añade el embalse, el embalse aporta solo un 2 % adicional de varianza explicada. Y al revés sí ocurre: la lluvia, después de quitar el embalse, sigue aportando un 31 %.
¿Por qué? Porque la lluvia y el embalse, contra lo que parece, no son la misma cosa a escala nacional. Su correlación entre sí es solo +0,14: hay años de lluvia abundante con embalses bajos (vaciado por riego de cultivos previos) y años de lluvia escasa con embalses altos (resto del invierno anterior). El olivar de secano, que es el grueso del olivar español, no riega del embalse. Riega de la lluvia que cae directamente sobre la parcela. Solo el regadío intensivo depende del embalse, y eso es minoría del volumen nacional.
La conclusión incómoda: los embalses son un indicador mediático, no estadístico. Visibles, fáciles de fotografiar y fáciles de comentar en prensa. Pero como predictor de cosecha nacional, la lluvia directa sobre las provincias olivareras es cuatro veces más informativa.
El calor sí importa, pero como interacción
La primera versión de este análisis, hecha solo a escala provincial con cinco campañas, decía que el estrés térmico de mayo a julio era el predictor dominante. Con veinticinco años nacionales esa lectura cambia, pero no en el sentido simple que pensábamos.
La correlación bruta entre días de calor extremo en mayo-julio y producción es de −0,19, débil pero negativa. La de la temperatura máxima media es de −0,31. Tres indicadores apuntando al mismo lado: cuando hace más calor, cae la cosecha. Hasta aquí, coherente con la fisiología.
El problema aparece cuando construimos un modelo lineal aditivo —primero lluvia, luego calor encima como suma independiente—. Después de la lluvia, la temperatura máxima añade un 0,2 % adicional. El déficit de presión de vapor, un 0,1 %. Casi cero. Eso, leído mal, sugeriría que el calor no importa. Y sería un error.
Lo que ocurre es que el efecto del calor no es aditivo, es multiplicativo. Depende de cuánta agua tenía el árbol cuando llegó el calor. Mira esta tabla, construida partiendo los 25 años de datos en regímenes hidrológicos y térmicos:
| Lluvia ene-abr / tmax junio | Verano fresco | Verano templado | Verano cálido |
|---|---|---|---|
| Año seco | 1.236 kt | 1.044 kt | 902 kt |
| Año normal | 1.162 kt | 1.335 kt | 1.351 kt |
| Año húmedo | 1.554 kt | — | 1.023 kt |
Cosecha media nacional kt por régimen, terciles de lluvia ene-abr y de tmax junio. Veinticinco años, España. Fuente: IOC y Olearia Intelligence.
Mira la fila “año húmedo”. Con verano fresco da 1.554 kt —los grandes récords—. Con verano cálido cae a 1.023 kt —cosecha mediocre, pese a la lluvia abundante—. La diferencia entre llover bien y cosechar bien la marca el verano. El calor sí mata cosecha, pero solo cuando el árbol tenía agua disponible y se la quemó. Cuando no había agua para empezar, el calor ya no importa porque la cosecha estaba perdida igual.
Eso es lo que un modelo lineal aditivo no capta. Y es lo que técnicas no lineales —como Gradient Boosting bien controlado— sí pueden capturar. Cuando entrenamos un modelo de ese tipo con tres variables seleccionadas (lluvia ene-abr, tmax junio, cosecha del año previo) y lo evaluamos con validación cruzada honesta, alcanza un R²=0,61 — el doble de lo que da la regresión lineal sobre la lluvia sola. La diferencia es exactamente la interacción que la tabla de regímenes muestra.
Hay un segundo factor que también aporta: la persistencia interanual. Si la cosecha del año pasado fue mala, la del siguiente tiende a ser peor también. La correlación de la producción con la del año previo es −0,30 sola, y sube a −0,40 después de controlar la lluvia. No es ruido: es señal real, complementaria.
Una cautela importante: este efecto de persistencia no es vecería en sentido estricto. La vecería es la alternancia bienal del árbol individual; un olivo que da mucho un año descarga reservas y rinde poco al siguiente. Eso ocurre a escala parcela. A escala país, con millones de árboles desfasados entre sí, la vecería individual se cancela en el agregado. Lo que medimos cuando correlacionamos la producción nacional consigo misma es autocorrelación interanual: shocks climáticos que duran más de un año, daños arbóreos que tardan en repararse, ciclos plurianuales de la masa olivarera. Es real y predictivo, pero llamarlo vecería sería técnicamente impreciso.
Tres familias de olivo en el Mediterráneo
Reproducir el ejercicio en cada país del Mediterráneo grande es donde aparece lo realmente interesante. Veintidós años, mismo método, ocho países con datos completos:
| País | Lluvia inv. (R²) | Persistencia (R²) | Calor mayo-jul (R²) | Predictor dominante |
|---|---|---|---|---|
| España | 41 % | 9 % | 9 % | Agua |
| Marruecos | 41 % | 47 % | 0 % | Mixto agua + persistencia |
| Portugal | 1 % | 48 % | 12 % | Persistencia |
| Italia | 11 % | 35 % | 1 % | Persistencia |
| Argelia | 3 % | 29 % | 11 % | Persistencia |
| Turquía | 12 % | 5 % | 31 % | Calor |
| Túnez | 13 % | 6 % | 22 % | Calor |
| Grecia | 8 % | 6 % | 2 % | (sin patrón claro) |
Fuente: producción anual IOC y climatología diaria por país, Olearia Intelligence. R² simple para cada variable contra producción anual. n=25 excepto Turquía (n=16, datos climáticos disponibles). El término persistencia se refiere a la autocorrelación interanual de la producción nacional —correlación de la producción con la del año anterior—, no a la vecería individual del árbol.
Hay tres familias claras. Y la geografía es la pista.
Familia 1, países-agua: España y Marruecos. Olivar mayoritariamente de secano expuesto a inviernos mediterráneos secos. El agua de enero-abril decide la campaña. Sus cosechas suben y bajan al ritmo de las precipitaciones, no del calor. Cuando llueve bien, el árbol llega a la floración con reservas hídricas, cuaja y sostiene fruto; cuando no, lo pierde aunque el verano sea moderado.
Familia 2, países-persistencia: Italia, Portugal y Argelia. Aquí el predictor más fuerte es la cosecha del año anterior, con R² de 35-48 %. Tres explicaciones plausibles que probablemente actúan a la vez: olivar más viejo y de secano que tarda más en recuperarse de un año malo, ciclos climáticos plurianuales que persisten varios años seguidos, y cambios estructurales lentos del propio sector (envejecimiento del olivar, abandono parcial). El clima del año en curso pesa menos que la inercia del año previo. Italia es el caso extremo: r de persistencia +0,59, mientras que la lluvia apenas añade nada.
Familia 3, países-calor: Túnez y Turquía. Aquí pasa lo opuesto a España. La correlación entre calor de mayo-julio y producción es positiva (Túnez +0,49, Turquía +0,56). Más calor, más cosecha. Eso suena contraintuitivo si piensas como olivarero andaluz, pero tiene sentido para un olivar adaptado a clima árido y caliente: las variedades locales (Chemlali en Túnez, Memecik en Egeo) prosperan con calor, y los años más calurosos suelen coincidir con menor humedad relativa, que reduce enfermedades fúngicas que afectan al cuajado. Además, ambos países tienen una variabilidad de cosecha enorme (CV 49 % y 47 %, frente a 27 % de España): sus cosechas oscilan tanto que cualquier correlación bruta se acentúa.
Y luego está Grecia, que escapa a las tres familias. Ningún indicador anual nacional explica más del 8 % de la varianza griega. Probablemente porque Grecia es muy heterogénea geográficamente —Creta, Peloponeso, Jónicas— y agregar al país suaviza señales que sí están a escala regional. Sería el siguiente análisis: bajar a regional griega y ver qué aparece.
| Serie | España | Marruecos | Portugal | Italia | Argelia | Turquía | Túnez | Grecia |
|---|---|---|---|---|---|---|---|---|
| Lluvia invierno R² | 41 | 41 | 1 | 11 | 3 | 12 | 13 | 8 |
| Persistencia R² | 9 | 47 | 48 | 35 | 29 | 5 | 6 | 6 |
| Calor mayo-jul R² | 9 | 0 | 12 | 1 | 11 | 31 | 22 | 2 |
Por qué la floración importa, aunque cueste medirla
Llegados aquí, una pregunta obvia: si la interacción lluvia × calor de junio explica buena parte de las oscilaciones, ¿qué pasa con la floración misma, que es de finales de abril a mediados de mayo? ¿No debería verse en los datos? Sí debería, pero la floración no se mide bien con el clima medio.
La floración del olivo en Andalucía dura unos quince a veinte días entre finales de abril y mediados de mayo. Una semana mala dentro de esa ventana —una ola de calor de cuatro días, una helada tardía, vientos secos persistentes— puede tirar el cuajado abajo aunque el promedio mensual de mayo salga normal. Cuando promediamos mayo entero, los golpes puntuales se diluyen y la señal se pierde en el ruido.
Hay un indicador que sí captura el estado real del árbol durante la floración, y es el satélite. No el clima medio. El árbol llega a florecer en un estado que es resultado de todo lo previo —el agua del invierno, el calor anómalo de marzo, el daño acumulado, la inercia de la cosecha pasada—, y ese estado se ve desde Sentinel-2 en tiempo casi real. Lo hemos probado a escala nacional en seis campañas (2019-2024) y a escala provincial en cinco. Las correlaciones son altas pero la muestra es corta. Concretamente: el índice PSRI —senescencia foliar— durante la ventana del 15 de abril al 25 de mayo correlaciona −0,88 con la producción nacional española en seis años, y entre −0,83 y −0,98 en las cuatro provincias clave (Málaga, Jaén, Granada, Córdoba). El NDWI —contenido de agua en planta— en la misma ventana correlaciona +0,79 con la cosecha nacional.
Son cifras espectaculares. Y cifras que no se publican como verdad cerrada todavía, porque n=6 con un solo año atípico puede mover la correlación de manera dramática. Internamente las usamos como una capa más de un sistema de predicción que combina varias señales y se valida cada año. Las publicaremos cuando tengamos n=10 o más y aguanten. Por ahora son hipótesis prometedora, no hallazgo.
Lo que esto cambia para los aforos del sector
Si los datos dicen lo que parecen decir, hay dos consecuencias prácticas para cualquiera que haga aforos en el Mediterráneo.
Primera, el aforo no se hace igual en cada país. Decir “mira la lluvia y los embalses” es buen consejo en España y Marruecos. Es mal consejo en Italia y Portugal, donde el predictor más fuerte es la inercia de la campaña anterior. Es consejo casi inverso en Túnez y Turquía, donde un año caluroso suele ser un buen año. Los informes que tratan al Mediterráneo como un solo sistema y aplican el mismo modelo a todos los países están haciendo exactamente lo que los datos no permiten hacer.
Segunda, en España la conversación útil es agua y calor combinados, no uno u otro. El sector lleva tres años hablando de heat stress como si fuera el factor dominante, y la respuesta intuitiva contraria sería “no, lo que manda es la sequía”. Los datos dicen algo más matizado: la lluvia ene-abr decide el suelo; el calor de junio decide el techo cuando hubo agua para perder. Un modelo no lineal con tres variables —lluvia, tmax junio, cosecha del año previo— alcanza un R²=0,61 con validación honesta, casi el doble que la regresión lineal sobre la lluvia sola. Si quieres aforar España en mayo, esas tres variables son el aforo razonable. El resto es ruido o requiere capas que aún no se publican.
Lo que mayo de 2026 nos va a decir
Aplicando lo anterior al momento actual: la lluvia ene-abr 2026 ha sido generosa, la cosecha 24/25 fue buena (1.419 kt), y la 25/26 está cerrando en torno a 1,4 Mt. Dos de las tres variables del modelo apuntan al alza. Lo que falta por ver es el calor de junio, que aún no ha pasado.
Si junio entra fresco o templado, la cosecha 26/27 tiene buenas posibilidades de quedarse en el cuadrante “húmedo + fresco” de la tabla de regímenes —el de los grandes récords, 1,5 Mt o más—. Si junio entra cálido, el modelo predice una caída sustancial al cuadrante “húmedo + cálido”, donde la cosecha cayó a 1.023 kt de media en los últimos 25 años pese a venir de inviernos lluviosos. Es un escenario que el lector puede verificar él mismo el 1 de agosto: la temperatura máxima media del junio español está disponible en datos públicos.
Esa es la diferencia entre un aforo puramente estadístico y uno con interacciones: el primero te dice “cosecha grande probable”; el segundo te dice “depende de un mes que aún no ha ocurrido”. Ambos son útiles. Pero solo el segundo te avisa de lo que puede salir mal.
Lo que no decimos
Internamente, en Olearia Intelligence, combinamos lluvia ene-abr, persistencia interanual, indicadores satelitales en ventana de floración y otras capas como una de las entradas de un sistema de predicción anual y por país. Tenemos coeficientes ponderados, intervalos de confianza cuantitativos y un track record que vamos publicando con prudencia cuando la realidad lo confirma.
Lo que no publicamos en este artículo es la fórmula. Por dos razones: el modelo se sigue ajustando cada año y enseñarlo medio terminado puede confundir; y es la inversión técnica que distingue a Olearia de un dashboard que repinta Eurostat. Lo que sí publicamos son las correlaciones crudas, reproducibles con datos públicos IOC + Open-Meteo + Copernicus por cualquier técnico riguroso. Lo que las une, lo guardamos.
Es un compromiso editorial. Compartimos lo suficiente para que se entienda qué importa y por qué; nos guardamos lo suficiente para que cuando publiquemos una predicción cuantitativa, el sector sepa que hay método detrás.
Una nota sobre los R² que damos en el artículo. Las cifras de varianza explicada (41 % en España, 35-48 % en países-persistencia, 22-31 % en países-calor) son R² simples sobre la serie completa, no R² de validación cruzada honesta. Esa distinción importa más de lo que parece, y le hemos dedicado un análisis aparte que publicaremos en el próximo artículo de esta serie: el sector entero del aforo del olivar conoce mal la diferencia, y eso es probablemente la razón por la que los aforos oficiales se equivocan tanto. Aquí queríamos contar el qué; allí contaremos el cuánto de verdad podemos saber.
Cómo lo hemos calculado
Todas las cifras de este artículo se han generado con consultas SQL directas sobre la base de datos de Olearia Intelligence el 1 de mayo de 2026.
- Producción anual por país: tabla
yearly_olive_production, fuente International Olive Council (IOC), serie 2000-2024 para España, Italia, Grecia, Portugal, Túnez, Marruecos, Turquía, Argelia, Líbano. Variable: producción de aceite de oliva en miles de toneladas por campaña. - Climatología diaria: tabla
regional_climate_daily, agregada por país y año. Estaciones por provincia/región olivarera (ocho en España, distribuciones similares en otros países). Variables: temperatura máxima/media/mínima, precipitación, evapotranspiración, balance hídrico, GDD base 10, déficit de presión de vapor, días conheat_stress_risk = true, humedad de suelo a tres profundidades. - Satélite Sentinel-2 / Copernicus: tabla
weekly_satellite_indices, agregado por región NUTS-3 olivarera, ventana 15 abril - 25 mayo (floración). Se usa la columna limpia (*_mean_clean), filtrada por nubes y corregida por calidad. Índices: NDVI, SAVI, NDWI, EVI, MSI, LAI, FPAR, PSRI. - Correlaciones: Pearson directa para señal bruta; correlación parcial sobre residuales para aislar el efecto de cada variable controlando por las anteriores. R² simple por variable. Cuando construimos modelos incrementales —primero lluvia, luego persistencia o calor sobre los residuales— sumamos varianza explicada de manera no superpuesta.
- Persistencia: definida como correlación de la producción anual con la del año anterior (lag-1). No es vecería individual del árbol —que ocurre a escala parcela— sino autocorrelación interanual a escala país. La distinción importa: con n=25 a escala nacional no se puede medir vecería individual; sí se puede medir cuánto persiste el ciclo de cosecha de un año al siguiente.
Si quieres replicar el análisis, escríbenos a [email protected] y te pasamos las queries.
¿Quieres ver estos indicadores actualizados cada semana, no congelados a una fecha? Olearia Intelligence consolida producción IOC, climatología diaria, NDVI/SAVI/NDWI/PSRI y combinaciones derivadas en un único dashboard, por país y por región. Solicita una demo.