Aller au contenu

2) Drift des données

Objectif — Détecter la dérive des distributions entre une fenêtre courante et une fenêtre de référence, afin d’anticiper un risque de dégradation du modèle.

Fenêtres analysées (UTC)
- Référence : 2025-08-13 22:45 → 2025-09-10 22:45
- Courante : 2025-09-10 22:45 → 2025-09-17 22:45


Questions auxquelles la page répond

  • Quelles features ont le plus dérivé ? La cible (y_true) a-t-elle changé de régime ?
  • La dérive est-elle globale ou concentrée sur certains segments (clusters, zones, heures) ?
  • Les dérives détectées sont-elles persistantes (structurelles) ou ponctuelles (événement) ?

Indicateurs & tests

  • PSI/CSI par variable (binning robuste).
    Interprétation usuelle PSI : < 0,10 faible · 0,10–0,25 modérée · > 0,25 forte.
  • K–S (variables continues), χ² (catégorielles).
  • Δ moyenne/variance normalisés (z-scores).
  • Drift de cible (prior shift) : évolution de la distribution de y_true.
  • Drift conditionnel : par cluster de stations, par heure du jour, par arrondissement/zone (si disponibles).

Résumé courant
PSI global (occ_ratio) : 0.017 · Feature la plus dérivée : occ_ratio (PSI=0.017)


Visualisations

Top dérives (PSI)

Top PSI

Tendance du drift (EMA, occ_ratio)

PSI global EMA

Carte — drift agrégé par zone

Carte statique

Ouvrir la carte interactive


Tables d’appui

  • PSI par variable : ../../assets/tables/monitoring/drift/psi_by_feature.csv
  • K–S par variable : ../../assets/tables/monitoring/drift/ks_by_feature.csv
  • Δ moyenne/variance : ../../assets/tables/monitoring/drift/deltas_by_feature.csv
  • PSI global journalier (EMA) : ../../assets/tables/monitoring/drift/psi_global_daily_ema.csv
  • Résumé & alertes : ../../assets/tables/monitoring/drift/drift_summary.csv, ../../assets/tables/monitoring/drift/alerts.json
  • Drift de cible : ../../assets/tables/monitoring/drift/target_drift.csv (si généré avec --perf)

Seuils / Alertes (par défaut, ajustables)

  • PSI global (médiane des features clés) > 0,10 sur 3 jours consécutifsAlerte.
  • PSI d’une feature critique > 0,25 sur 2 joursAlerte majeure.
  • Drift de cible notable (Δ moyenne > 1 σ) → Alerte.

⚠️ Un drift n’implique pas nécessairement une dégradation du modèle. Consulter la page Santé du modèle pour corroborer (perf vs temps).


Méthodes

  • Fenêtrage : référence glissante (28 j) vs courant (7 j), sans chevauchement.
  • Stratification : métriques par segment (clusters réseau, zones).
  • Stabilité : lissage EMA pour éviter les sur-réactions au bruit.

Artefacts & source
- Source : docs/exports/events.parquet (pas de 15 min, timestamps UTC naïfs).
- Figures : ../../assets/figs/monitoring/drift · Tables : ../../assets/tables/monitoring/drift · Carte : ../../assets/maps/drift_by_zone.html