Metodología - Nowcast de PBI
Resumen Ejecutivo
El nowcast de PBI trimestral utiliza un modelo de Factores Dinámicos (DFM) con ecuación puente Ridge para predecir el crecimiento del PBI peruano con 1-3 meses de anticipación respecto a la publicación oficial de INEI. El modelo resume 35+ indicadores mensuales de alta frecuencia en 3 factores latentes que capturan las dimensiones principales de la actividad económica.
1. Arquitectura del Modelo
1.1 Modelo de Factores Dinámicos (DFM)
El DFM asume que un panel de N indicadores mensuales puede ser resumido por K factores latentes comunes:
Ft = A1Ft-1 + ... + ApFt-p + ut
Donde:
- Xit: Indicador i en el mes t (estandarizado)
- Ft: Vector de K=3 factores latentes
- λi: Factor loadings (pesos de cada indicador)
- Ap: Matrices autorregresivas de orden p=1
1.2 Ecuación Puente (Bridge Equation)
Los factores mensuales se agregan a frecuencia trimestral y se relacionan con el PBI mediante regresión Ridge con término autorregresivo:
Donde F̄k,t es el promedio trimestral del factor k. Usamos Ridge (α=1.0) en lugar de OLS para evitar overfitting - OLS producía coeficientes de -81 en factor_1, Ridge da coeficientes estables y reduce RMSE 28% (1.41 vs 1.97).
1.3 Manejo de COVID-19
Para evitar distorsiones por el shock estructural de 2020-2021:
- Rolling window de 7 años: En lugar de ventana expansiva, usamos solo los últimos 84 meses para extracción de factores. Esto evita que el modelo "aprenda" patrones de COVID que no se repetirán.
- Exclusión de training: Post-2022, el modelo excluye 2020-2021 del entrenamiento de la ecuación puente. Pre-COVID usa todos los datos disponibles.
- Resultado: RMSE post-COVID mejora de 8.1 pp (ventana expansiva) a 7.1 pp (rolling + exclusión).
2. Fuentes de Datos
2.1 Indicadores Mensuales (35 series)
| Categoría | Indicadores | Fuente |
|---|---|---|
| Producción | Manufactura, minería, construcción, pesca | INEI, BCRP |
| Comercio Exterior | Exportaciones, importaciones (volumen y valor) | BCRP, SUNAT |
| Crédito | Crédito total, consumo, hipotecario, empresas | BCRP |
| Empleo | Empleo formal Lima, planilla privada | MTPE |
| Fiscal | Recaudación tributaria, gasto público | SUNAT, MEF |
| Expectativas | Confianza empresarial, expectativas PBI | BCRP |
| Satelital | Luces nocturnas (NTL) suma nacional | NOAA-VIIRS |
2.2 Target: PBI Trimestral (INEI)
PBI desestacionalizado, variación YoY (%). Publicado con ~45 días de rezago. Target period: último trimestre completo para el cual hay panel suficiente (>50% de series con datos).
3. Desempeño y Validación
3.1 Backtest Histórico (2010-2025)
| Período | RMSE (pp) | MAE (pp) | R² |
|---|---|---|---|
| Pre-COVID (2010-2019) | 1.47 | 1.12 | 0.89 |
| Post-COVID (2022-2025) | 7.09 | 5.21 | 0.76 |
| Período Completo | 5.45 | 3.89 | 0.93 |
3.2 Comparación vs Benchmarks
El DFM supera consistentemente a modelos naive:
- AR(1): RMSE = 7.85 pp → DFM Rel.RMSE = 0.69 (-31% error)
- Random Walk: RMSE = 8.01 pp → DFM Rel.RMSE = 0.68 (-32% error)
El valor del DFM es mayor en puntos de inflexión (recesiones, aceleraciones) donde AR(1) simplemente proyecta tendencia reciente.
3.3 Nowcast Actual (2025-Q4)
PBI 2025-Q4: +2.13% YoY
Bridge R² = 0.934 | Panel a través de Nov-2025 | 33/35 series activas
4. Desagregación Regional
El nowcast nacional se desagrega a 25 departamentos usando luces nocturnas (NTL) como proxy de actividad económica regional. Método: ntl_share (asignación proporcional).
sharedept = NTLdept / Σ NTLnacional
Supuesto: Modelo homogéneo - todos los departamentos crecen al ritmo nacional. Solo varía la participación económica, no las tasas de crecimiento. Ver mapas regionales para detalles.
⚠️ Limitaciones
- Datos faltantes: El "ragged edge" (meses recientes con series incompletas) puede introducir ruido. Truncamos meses con <50% de datos.
- Cambios estructurales: El modelo asume estabilidad de relaciones. Shocks como COVID requieren tratamiento especial (exclusión, rolling windows).
- Revisiones de PBI: INEI revisa el PBI oficial hasta 3 trimestres hacia atrás. El backtest usa datos vintage para realismo.
- Desagregación regional: El modelo homogéneo no captura heterogeneidad en crecimiento departamental. Futuros modelos usarán indicadores regionales específicos.
Referencias
Giannone, D., Reichlin, L., & Small, D. (2008). "Nowcasting: The real-time informational content of macroeconomic data." Journal of Monetary Economics, 55(4), 665-676.
Bańbura, M., & Rünstler, G. (2011). "A look into the factor model black box: Publication lags and the role of hard and soft data in forecasting GDP." International Journal of Forecasting, 27(2), 333-346.
Stock, J. H., & Watson, M. W. (2002). "Forecasting using principal components from a large number of predictors." Journal of the American Statistical Association, 97(460), 1167-1179.
Mariano, R. S., & Murasawa, Y. (2003). "A new coincident index of business cycles based on monthly and quarterly series." Journal of Applied Econometrics, 18(4), 427-443.
Código fuente disponible en el repositorio NEXUS
Ver: src/models/dfm.py, scripts/generate_nowcast.py