Nei contesti reali, i dataset raramente falliscono in modo evidente.
Molto più spesso falliscono **in silenzio**.
File CSV o Excel provenienti da e-commerce o CRM possono sembrare “utilizzabili”,
ma nascondono problemi che alterano i KPI senza generare errori tecnici.
I problemi più comuni:
- schema drift (colonne rinominate o mancanti)
- date in formati misti (YYYY-MM-DD / DD-MM-YYYY)
- numeri trattati come stringhe (prezzi con virgola)
- duplicati che gonfiano i totali
- missing distribuiti in modo non uniforme
Il rischio non è il crash della pipeline,
ma **decisioni sbagliate basate su KPI apparentemente corrette**.