Predicción de la serie del Índice de Producción Industrial con un modelo SARIMA

En este trabajo realizo la predicción del Índice de Producción Industrial (IPI) para Enero2017-Agosto2017 utilizando un modelo SARIMA en R.



El modelo arima permite realizar predicciones de series temporales con estacionalidad y tendencia utilizando datos de periodos anteriores. Concretamente, en este trabajo utilizo los datos del IPI del periodo Enero2010-Diciembre2016 para calcular los parámetros del modelo y hacer la predicción para el periodo Enero2017-Agosto2017. Después comparo la predicción realizada con los valores reales para comprobar la calidad de la predicción.

El Índice de Producción Industrial es "un indicador coyuntural que mide la evolución mensual de la actividad productiva de las ramas industriales, excluida la construcción, contenidas en la Clasificación Nacional de Actividades Económicas 2009 (CNAE-2009).(...)El IPI mide la evolución conjunta de la cantidad y de la calidad, eliminando la influencia de los precios", según aparece en la página web del Instituto Nacional de Estadística (INE).

Una vez importados los datos de la web del INE, hago algunas correcciones en el dataframe original y represento la serie.


Figura 1. Serie IPI Enero2010-Agosto2017

En la figura siguiente se puede ver la serie temporal original completa. La linea roja marca la partición de los datos en datos utilizados para calcular los parámetros y datos utilizados para comparar con la predicción. Se puede ver a simple que la serie tiene una cierta tendencia y una marcada estacionalidad. Como se observa en la figura siguiente, en el mes de agosto cae fuertemente la producción industrial, y al mes siguiente vuelve a recuperarse.

Figura 2. Estacionalidad de la serie IPI

A continuación hago la partición de los datos y comienzo a tratar la serie de entrenamiento.


Para obtener los valores del modelo arima es necesario convertir la serie en una serie estacionaria. Para ello elimino la tendencia y la estacionalidad de la serie.

Figura 3. Serie IPI estacionaria
Figura 4. Funciones de autocorrelación simple y parcial de la serie IPI

En la Figura 4 se muestran las funciones de autocorrelación simple y parcial de la serie. En la ACF se ve un primer retardo significativo, que indicaría un proceso de medias móviles de orden q=1. No se aprecian retardos significativos para la parte estacional. En la PACF se observan 2 retardos significativos, lo que podría indicar que hay proceso autorregresivo de orden 2 (p=2). En este caso tampoco se ven retardos significativos para la parte estacional. Por tanto, el modelo inicial que quedaría es un ARIMA(2,1,1). Sin embargo, aunque no aparecen retardos significativos que indiquen que hay estacionalida en la serie, ya se ha visto claramente que hay estacionalidad anual, por lo que el modelo inicial será un SARIMA(2,1,0)x(1,1,1)x12.

Tras estimar el modelo la función genera el gráfico siguiente.

Figura 5. Tests de residuos del modelo inicial

Se puede ver en la figura de arriba que los residuos del modelo no están autocorrelacionados y se distribuyen aproximadamente con una distribución normal. Sin embargo, el test de Ljung-Box muestra que no se puede rechazar la hipótesis de que los residuos sean independientes. Por tanto, este modelo no consigue capturar lo suficiente los procesos de la serie.

Ahora utilizo la función auto.arima(), que calcula distintos modelos y elige el que menor AIC tiene. AIC es el Criterio de Información de Akaike, que proporciona una medida de la calidad relativa del modelo. Esta medida penaliza la complejidad del modelo (número de coeficientes) y premia su bondad de ajuste.

Best model: ARIMA(0,1,3)(0,1,0)[12]


El modelo que devuelve la función auto.arima() es el que menor AIC tiene de entre todos los posible. En la figura siguiente muestro las predicciones del modelo inicial y del modelo que devuelve la función auto.arima() proyectadas sobre los valores reales de la serie IPI.

Figura 5. Predicciones de los modelos arima

Se puede ver que las predicciones de los dos modelos son bastante similares. Ambas capturan bien la tendencia de la serie pero se quedan cortas a la hora de predecir la volatilidad de la serie. Sin embargo, ambas han capturado bien el efecto estacional de la serie en el mes de Agosto.

Esta web utiliza cookies para obtener datos estadísticos de la navegación de sus usuarios. Si continúas navegando se considera que aceptas su uso. Más información Cerrar