MacroPredict-ML: Monitor de Riesgo Económico Regional
Este proyecto es una plataforma de Inteligencia Económica desarrollada con Streamlit y Machine Learning. Permite analizar y predecir la probabilidad de recesión en diversas economías de América Latina y el mundo (México, Brasil, Argentina, USA, etc.) utilizando datos en tiempo real de la API del Banco Mundial.
Optimizar el análisis de indicadores macroeconómicos para anticipar periodos de contracción económica, facilitando la toma de decisiones informada en políticas públicas y asignación de recursos.
- Análisis Multipaís: Selector dinámico que permite cambiar el enfoque entre diferentes economías regionales de manera instantánea.
- Predicción con Random Forest: Modelo entrenado para detectar patrones no lineales en indicadores de empleo, PIB y gasto social.
- Visualización de Tendencias: Gráficas históricas (2010-2025) que muestran la evolución del riesgo año tras año.
- Interpretación Inteligente: Sistema de alertas que clasifica el riesgo en niveles (Bajo, Moderado, Crítico) con recomendaciones automáticas.
- Exportación de Datos: Botón integrado para descargar reportes históricos en formato CSV.
- Lenguaje: Python 3.10+
- ML Framework: Scikit-Learn (Random Forest Classifier).
- Frontend: Streamlit.
- Visualización: Plotly Express & Graph Objects.
- Data Source: World Bank API (
wbgapi).
nombre-del-proyecto/
data/ # Datasets (si son pequeños)
notebooks/ # Jupyters con el análisis previo
src/ # Scripts de procesamiento o lógica pesada
models/ # El archivo .pkl o .h5 del modelo entrenado
app.py # <--- ARCHIVO PRINCIPAL (Streamlit)
lanzador_app.ipynb # <--- ARCHIVO QUE LANZA LA APP (Streamlit)
requirements.txt # <--- DEPENDENCIAS (Crucial para el despliegue)
README.md # Documentación
El sistema ha demostrado gran capacidad para identificar picos de volatilidad en economías como México y Brasil, detectando con éxito las anomalías generadas por eventos globales y cambios en la política fiscal interna.
Tras analizar el modelo, se observaron patrones interesantes:
- Impacto del Desempleo: Es el indicador con mayor peso predictivo en la región de Latinoamérica.
- Resiliencia Económica: El gasto en educación muestra una correlación negativa con el riesgo de recesión a largo plazo.
- Predicción Actual: Para México, el modelo identifica una probabilidad de riesgo alta debido a la volatilidad en los flujos de capital detectados en los últimos indicadores del Banco Mundial.
Esta sección aborda los fundamentos técnicos y económicos del proyecto, útil para procesos de entrevista técnica.
1. ¿Por qué elegiste Random Forest para este modelo de predicción?
Elegí Random Forest porque es un algoritmo robusto frente a valores atípicos (outliers) y no requiere que los datos sigan una distribución normal. En economía, las relaciones entre variables suelen ser no lineales y complejas; los árboles de decisión capturan estas interacciones mejor que una regresión lineal simple. Además, ofrece elfeature_importance, que permite explicar qué indicadores pesan más en la predicción. 2. ¿Cómo manejaste el sesgo de datos en indicadores con diferentes escalas?
Aunque Random Forest no es sensible a la escala de las variables, para la preparación del dataset se consideró la normalización de indicadores como el PIB per cápita (valores en miles) frente a la tasa de desempleo (valores en porcentajes). Esto asegura que si en el futuro se desea probar modelos como SVM o Redes Neuronales, los datos ya estén pre-procesados correctamente.3. ¿Qué significa el "efecto meseta" observado en las gráficas de 2023-2024?
Este fenómeno ocurre debido al desfase en la publicación de datos oficiales por parte de organismos internacionales (Banco Mundial). En el script, se implementó una técnica de Forward Fill (ffill) para evitar que la aplicación falle por falta de datos recientes, proyectando la última observación conocida. En un entorno de producción, esto se complementaría con indicadores de "alta frecuencia" como precios de commodities o índices bursátiles.4. ¿Cómo validaste la precisión del modelo si las recesiones son eventos poco comunes?
Las recesiones son eventos de "clase minoritaria", lo que genera un dataset desbalanceado. Para validar el modelo, no solo usamos el Accuracy (que puede ser engañoso), sino que nos enfocamos en el Recall y la curva ROC-AUC. Esto garantiza que el modelo sea capaz de detectar una crisis real incluso si ocurren con poca frecuencia histórica.5. ¿De qué manera este proyecto ayuda a la "Optimización del Gasto Público"?
Al predecir con antelación un aumento en el riesgo de recesión, los tomadores de decisiones pueden ajustar la política fiscal. Por ejemplo, redireccionar recursos hacia programas de protección social o estímulos económicos antes de que la contracción se profundice, permitiendo una asignación de presupuesto más eficiente y preventiva en lugar de reactiva.Este proyecto se distribuye bajo la licencia MIT. Su propósito es estrictamente educativo y de investigación, desarrollado como una solución de Data Science Aplicada para el sector público y financiero.
Nota para reclutadores: Este proyecto demuestra habilidades avanzadas en el ciclo completo de Data Science: desde el procesamiento de señales con Pandas/NumPy, el desarrollo de aplicaciones financieras con Python, hasta la creación de un motor de decisión logística que integra lógica de Machine Learning con gestión de riesgos financiera. Todo desplegado en una aplicación web interactiva con Streamlit que prioriza la experiencia de usuario y la visualización de datos crítica.
Autor: JUAN S. Contacto: https://github.com/johnyse99