AQI personalizado para Madrid
Proyecto ganador del Premio al Mejor Proyecto de Data Science, centrado en construir un AQI más útil y contextualizado para Madrid integrando contaminación, meteorología, tráfico y eventos, más allá del enfoque habitual de los índices públicos europeos.
Premio
Mejor Proyecto de Data Science de la promoción.
Innovación
Efecto frontera entre ZBE, eventos y AQI contextualizado.
Resultado
XGBoost global con R² de 0.89 y hallazgo del efecto frontera entre ZBE.
El reto
El AQI tradicional, tal como lo define la EPA, mide concentración de contaminantes: PM2.5, PM10, NO₂, O₃. Es útil, pero insuficiente. No captura qué pasa en la ciudad: ni los efectos del tráfico por zonas, ni los eventos que generan picos atípicos, ni cómo las restricciones de las Zonas de Bajas Emisiones desplazan el tráfico a los barrios adyacentes.
El reto era construir un índice más contextualizado para Madrid, integrando señales que los modelos estándar o ignoran o analizan por separado: tráfico por zonas, meteorología, eventos especiales y el efecto frontera entre ZBE.
Proceso
Qué hicimos
- Construimos un pipeline end-to-end que integra datos de contaminación, tráfico por zonas, meteorología y eventos especiales de Madrid.
- Desarrollé una variable propia para analizar el efecto frontera entre ZBE: cómo la restricción del tráfico en una zona genera un desplazamiento hacia las zonas adyacentes que los índices estándar no detectan.
- Creamos una variable de eventos especiales (conciertos, partidos, manifestaciones) para explicar los picos atípicos de tráfico y contaminación que los modelos convencionales tratan como ruido.
- Entrenamos y comparamos múltiples modelos de Machine Learning hasta alcanzar el mejor rendimiento predictivo global y por zonas geográficas.
Impacto
Premio al Mejor Proyecto de Data Science de la promoción. El modelo XGBoost global alcanzó un R² de 0.89 y permitió detectar patrones que los índices estándar no capturan: el desplazamiento de tráfico entre ZBE y outliers asociados a eventos puntuales.
El proyecto demostró que redefinir qué variables importan, y no solo ajustar el modelo, es lo que genera una mejora en la capacidad de análisis.
Aprendizaje
Esta forma de trabajar, incorporar señales que otros modelos ignoran y construir variables propias a partir de la comprensión del contexto, es lo mismo que aplico en producto: los datos estandarizados rara vez capturan lo que importa de verdad. Hay que saber qué buscar antes de ponerse a buscar.