Quality Report
Pipeline'y audytu semantycznegoQuality Report to raport generowany po każdym kluczowym kroku pipeline'u, walidujący wyniki i identyfikujący anomalie zanim dane przejdą do następnego kroku.
W pipeline'u audytu semantycznego quality report sprawdza: po klasteryzacji (Silhouette Score, rozmiary klastrów, outliery), po embeddingach (rozkład wartości, wektory zerowe, anomalie), po content gaps (kompletność analizy, pokrycie grafu). Quality report to mechanizm kontroli jakości 'between steps' – łapie problemy ZANIM zepsują następne kroki.
Na przykład quality report po klasteryzacji pokazuje Silhouette Score 0.35 (niski) i 2 klastry z 100+ elementami (za duże) → rekomendacja: zwiększ k i przeklasteryzuj. Bez quality report te problemy ujawniłyby się dopiero w raporcie końcowym, wymuszając przerobienie całego pipeline'u. Związany z zasadą 'fail fast at the right level' – wykrywaj problemy jak najwcześniej. W praktyce dodaj automatyczny quality check po każdym kroku pipeline'u – 5 linijek kodu (sprawdź min/max/mean, policz nulls, waliduj rozmiary) oszczędza godziny debugowania.