Metodología - Nowcast de PBI

Resumen Ejecutivo

El nowcast de PBI trimestral utiliza un modelo de Factores Dinámicos (DFM) con ecuación puente Ridge para predecir el crecimiento del PBI peruano con 1-3 meses de anticipación respecto a la publicación oficial de INEI. El modelo resume 35+ indicadores mensuales de alta frecuencia en 3 factores latentes que capturan las dimensiones principales de la actividad económica.

RMSE Pre-COVID
1.47 pp
R² In-Sample
0.93
vs AR(1)
-31%
RMSE reduction

1. Arquitectura del Modelo

1.1 Modelo de Factores Dinámicos (DFM)

El DFM asume que un panel de N indicadores mensuales puede ser resumido por K factores latentes comunes:

Xit = λi'Ft + εit
Ft = A1Ft-1 + ... + ApFt-p + ut

Donde:

  • Xit: Indicador i en el mes t (estandarizado)
  • Ft: Vector de K=3 factores latentes
  • λi: Factor loadings (pesos de cada indicador)
  • Ap: Matrices autorregresivas de orden p=1

1.2 Ecuación Puente (Bridge Equation)

Los factores mensuales se agregan a frecuencia trimestral y se relacionan con el PBI mediante regresión Ridge con término autorregresivo:

GDPt = α + β1·F̄1,t + β2·F̄2,t + β3·F̄3,t + γ·GDPt-1 + εt

Donde F̄k,t es el promedio trimestral del factor k. Usamos Ridge (α=1.0) en lugar de OLS para evitar overfitting - OLS producía coeficientes de -81 en factor_1, Ridge da coeficientes estables y reduce RMSE 28% (1.41 vs 1.97).

1.3 Manejo de COVID-19

Para evitar distorsiones por el shock estructural de 2020-2021:

  • Rolling window de 7 años: En lugar de ventana expansiva, usamos solo los últimos 84 meses para extracción de factores. Esto evita que el modelo "aprenda" patrones de COVID que no se repetirán.
  • Exclusión de training: Post-2022, el modelo excluye 2020-2021 del entrenamiento de la ecuación puente. Pre-COVID usa todos los datos disponibles.
  • Resultado: RMSE post-COVID mejora de 8.1 pp (ventana expansiva) a 7.1 pp (rolling + exclusión).

2. Fuentes de Datos

2.1 Indicadores Mensuales (35 series)

CategoríaIndicadoresFuente
ProducciónManufactura, minería, construcción, pescaINEI, BCRP
Comercio ExteriorExportaciones, importaciones (volumen y valor)BCRP, SUNAT
CréditoCrédito total, consumo, hipotecario, empresasBCRP
EmpleoEmpleo formal Lima, planilla privadaMTPE
FiscalRecaudación tributaria, gasto públicoSUNAT, MEF
ExpectativasConfianza empresarial, expectativas PBIBCRP
SatelitalLuces nocturnas (NTL) suma nacionalNOAA-VIIRS

2.2 Target: PBI Trimestral (INEI)

PBI desestacionalizado, variación YoY (%). Publicado con ~45 días de rezago. Target period: último trimestre completo para el cual hay panel suficiente (>50% de series con datos).

3. Desempeño y Validación

3.1 Backtest Histórico (2010-2025)

PeríodoRMSE (pp)MAE (pp)
Pre-COVID (2010-2019)1.471.120.89
Post-COVID (2022-2025)7.095.210.76
Período Completo5.453.890.93

3.2 Comparación vs Benchmarks

El DFM supera consistentemente a modelos naive:

  • AR(1): RMSE = 7.85 pp → DFM Rel.RMSE = 0.69 (-31% error)
  • Random Walk: RMSE = 8.01 pp → DFM Rel.RMSE = 0.68 (-32% error)

El valor del DFM es mayor en puntos de inflexión (recesiones, aceleraciones) donde AR(1) simplemente proyecta tendencia reciente.

3.3 Nowcast Actual (2025-Q4)

PBI 2025-Q4: +2.13% YoY

Bridge R² = 0.934 | Panel a través de Nov-2025 | 33/35 series activas

4. Desagregación Regional

El nowcast nacional se desagrega a 25 departamentos usando luces nocturnas (NTL) como proxy de actividad económica regional. Método: ntl_share (asignación proporcional).

GDPdept,t = GDPnacional,t × sharedept
sharedept = NTLdept / Σ NTLnacional

Supuesto: Modelo homogéneo - todos los departamentos crecen al ritmo nacional. Solo varía la participación económica, no las tasas de crecimiento. Ver mapas regionales para detalles.

⚠️ Limitaciones

  • Datos faltantes: El "ragged edge" (meses recientes con series incompletas) puede introducir ruido. Truncamos meses con <50% de datos.
  • Cambios estructurales: El modelo asume estabilidad de relaciones. Shocks como COVID requieren tratamiento especial (exclusión, rolling windows).
  • Revisiones de PBI: INEI revisa el PBI oficial hasta 3 trimestres hacia atrás. El backtest usa datos vintage para realismo.
  • Desagregación regional: El modelo homogéneo no captura heterogeneidad en crecimiento departamental. Futuros modelos usarán indicadores regionales específicos.

Referencias

Giannone, D., Reichlin, L., & Small, D. (2008). "Nowcasting: The real-time informational content of macroeconomic data." Journal of Monetary Economics, 55(4), 665-676.

Bańbura, M., & Rünstler, G. (2011). "A look into the factor model black box: Publication lags and the role of hard and soft data in forecasting GDP." International Journal of Forecasting, 27(2), 333-346.

Stock, J. H., & Watson, M. W. (2002). "Forecasting using principal components from a large number of predictors." Journal of the American Statistical Association, 97(460), 1167-1179.

Mariano, R. S., & Murasawa, Y. (2003). "A new coincident index of business cycles based on monthly and quarterly series." Journal of Applied Econometrics, 18(4), 427-443.

Código fuente disponible en el repositorio NEXUS

Ver: src/models/dfm.py, scripts/generate_nowcast.py