Volver al portfolio
IMMUNE Technology Institute

AQI personalizado para Madrid

Data Science · innovación aplicada · modelado predictivo · machine learning

Proyecto ganador del Premio al Mejor Proyecto de Data Science, centrado en construir un AQI más útil y contextualizado para Madrid integrando contaminación, meteorología, tráfico y eventos, más allá del enfoque habitual de los índices públicos europeos.

Premio

Mejor Proyecto de Data Science de la promoción.

Innovación

Efecto frontera entre ZBE, eventos y AQI contextualizado.

Resultado

XGBoost global con R² de 0.89 y hallazgo del efecto frontera entre ZBE.

El reto

El AQI tradicional, tal como lo define la EPA, mide concentración de contaminantes: PM2.5, PM10, NO₂, O₃. Es útil, pero insuficiente. No captura qué pasa en la ciudad: ni los efectos del tráfico por zonas, ni los eventos que generan picos atípicos, ni cómo las restricciones de las Zonas de Bajas Emisiones desplazan el tráfico a los barrios adyacentes.

El reto era construir un índice más contextualizado para Madrid, integrando señales que los modelos estándar o ignoran o analizan por separado: tráfico por zonas, meteorología, eventos especiales y el efecto frontera entre ZBE.

Proceso

01 Recopilación y limpieza de datos
02 Feature engineering: ZBE y eventos
03 Análisis no supervisado
04 Modelado predictivo y comparación
05 Validación y hallazgos

Qué hicimos

  • Construimos un pipeline end-to-end que integra datos de contaminación, tráfico por zonas, meteorología y eventos especiales de Madrid.
  • Desarrollé una variable propia para analizar el efecto frontera entre ZBE: cómo la restricción del tráfico en una zona genera un desplazamiento hacia las zonas adyacentes que los índices estándar no detectan.
  • Creamos una variable de eventos especiales (conciertos, partidos, manifestaciones) para explicar los picos atípicos de tráfico y contaminación que los modelos convencionales tratan como ruido.
  • Entrenamos y comparamos múltiples modelos de Machine Learning hasta alcanzar el mejor rendimiento predictivo global y por zonas geográficas.

Impacto

Premio al Mejor Proyecto de Data Science de la promoción. El modelo XGBoost global alcanzó un R² de 0.89 y permitió detectar patrones que los índices estándar no capturan: el desplazamiento de tráfico entre ZBE y outliers asociados a eventos puntuales.

El proyecto demostró que redefinir qué variables importan, y no solo ajustar el modelo, es lo que genera una mejora en la capacidad de análisis.

Aprendizaje

Esta forma de trabajar, incorporar señales que otros modelos ignoran y construir variables propias a partir de la comprensión del contexto, es lo mismo que aplico en producto: los datos estandarizados rara vez capturan lo que importa de verdad. Hay que saber qué buscar antes de ponerse a buscar.

Contacto | "Let's work together"