IMMUNE Technology Institute

AQI personalizado para Madrid

Data Science · innovación aplicada · modelado predictivo · machine learning

Proyecto ganador del Premio al Mejor Proyecto de Data Science, centrado en construir un AQI más útil y contextualizado para Madrid integrando contaminación, meteorología, tráfico y eventos, más allá del enfoque habitual de los índices públicos europeos.

Ver proyecto en GitHub

Premio

Mejor Proyecto de Data Science de la promoción.

Innovación

Efecto frontera entre ZBE, eventos y AQI contextualizado.

Resultado

XGBoost global con R² de 0.89 y hallazgo del efecto frontera entre ZBE.

El reto

El AQI tradicional, tal como lo define la EPA, mide concentración de contaminantes: PM2.5, PM10, NO₂, O₃. Es útil, pero insuficiente. No captura qué pasa en la ciudad: ni los efectos del tráfico por zonas, ni los eventos que generan picos atípicos, ni cómo las restricciones de las Zonas de Bajas Emisiones desplazan el tráfico a los barrios adyacentes.

El reto era construir un índice más contextualizado para Madrid, integrando señales que los modelos estándar o ignoran o analizan por separado: tráfico por zonas, meteorología, eventos especiales y el efecto frontera entre ZBE.

Proceso

01 Recopilación y limpieza de datos

02 Feature engineering: ZBE y eventos

03 Análisis no supervisado

04 Modelado predictivo y comparación

05 Validación y hallazgos

Qué hicimos

Construimos un pipeline end-to-end que integra datos de contaminación, tráfico por zonas, meteorología y eventos especiales de Madrid.
Desarrollé una variable propia para analizar el efecto frontera entre ZBE: cómo la restricción del tráfico en una zona genera un desplazamiento hacia las zonas adyacentes que los índices estándar no detectan.
Creamos una variable de eventos especiales (conciertos, partidos, manifestaciones) para explicar los picos atípicos de tráfico y contaminación que los modelos convencionales tratan como ruido.
Entrenamos y comparamos múltiples modelos de Machine Learning hasta alcanzar el mejor rendimiento predictivo global y por zonas geográficas.

Ver repositorio en GitHub Análisis efecto frontera ZBE Variable eventos especiales

Impacto

Premio al Mejor Proyecto de Data Science de la promoción. El modelo XGBoost global alcanzó un R² de 0.89 y permitió detectar patrones que los índices estándar no capturan: el desplazamiento de tráfico entre ZBE y outliers asociados a eventos puntuales.

El proyecto demostró que redefinir qué variables importan, y no solo ajustar el modelo, es lo que genera una mejora en la capacidad de análisis.

Aprendizaje

Esta forma de trabajar, incorporar señales que otros modelos ignoran y construir variables propias a partir de la comprensión del contexto, es lo mismo que aplico en producto: los datos estandarizados rara vez capturan lo que importa de verdad. Hay que saber qué buscar antes de ponerse a buscar.

Contacto | "Let's work together"

GitHub

Escríbeme

Teléfono

Descargar CV