CLUSTERING

Embeddingi

CLUSTERING to typ zadania embeddingowego optymalizujący wektor pod grupowanie tematyczne – używany w klasteryzacji słów kluczowych.

CLUSTERING to typ zadania embeddingowego optymalizujący wektory pod grupowanie tematyczne, używany w pipeline klasteryzacji słów kluczowych. Gemini API z task_type=CLUSTERING generuje wektory inaczej niż z SEMANTIC_SIMILARITY – wektory zoptymalizowane pod grupowanie lepiej się rozdzielają w przestrzeni wektorowej, co daje czystsze klastry z wyższym Silhouette Score. W SEO stosowany, gdy chcemy podzielić 500+ keywords na tematyczne grupy, z których każda stanie się potencjalną jednostką treści (artykuł lub strona).

W pipeline klasteryzacji skill klasteryzacja fraz używa tego task type do wygenerowania embeddingów, a następnie algorytm K-means dzieli je na klastry. Kluczową zasadą jest to, że jeśli robisz klasteryzację, użyj task_type=CLUSTERING – użycie SEMANTIC_SIMILARITY da gorsze wyniki. Różnica między CLUSTERING a innymi task type to nie kwestia preferencji, lecz matematyki: model generuje inną geometrię wektorów w zależności od task type.

Źródło: AI Semantic SEO Expert, Robert Niechciał (sensai.io)