Silhouette Score (dobor k)
Klasteryzacja semantycznaSilhouette Score to metryka oceniająca jakość klasteryzacji na skali od -1 do 1, pomagająca dobrać optymalną liczbę klastrów k. Mierzy, jak dobrze punkt pasuje do swojego klastra vs najbliższy sąsiedni klaster. Wartość 1.0 oznacza idealnie rozdzielone klastry, 0 to granica między klastrami, a -1 to złe przypisanie.
W pipeline klasteryzacji skrypt testuje k od 2 do 20 i automatycznie wybiera k z najwyższym Silhouette Score – eliminuje zgadywanie 'ile klastrów powinienem mieć'. Typowe wartości w SEO: 0.4-0.6 to dobra klasteryzacja, powyżej 0.6 to bardzo dobra, poniżej 0.3 sugeruje potrzebę zmiany modelu embeddingowego lub poszerzenia puli keywords. W praktyce, jeśli Silhouette Score jest niski, nie próbuj wymuszać klasteryzacji – często oznacza to, że tematy w puli keywords nakładają się na siebie.