Podobieństwo kosinusowe (0-1)
EmbeddingiPodobieństwo kosinusowe to główna metryka porównywania embeddingów w SEO, mierząca kąt między dwoma wektorami w skali od 0 do 1. Wartość 1.0 oznacza identyczne znaczenie (potencjalny duplikat), 0.9-0.99 sygnalizuje kanibalizację, a 0.75-0.9 wskazuje na silne powiązanie tematyczne idealne do linkowania wewnętrznego.
Jest preferowana nad odległością euklidesową, bo mierzy kierunek wektora (znaczenie), nie jego długość – dwa artykuły mogą mieć różną objętość, ale identyczny temat. Praktyczne zastosowania w SEO obejmują: porównywanie tytułów stron, detekcję duplikatów (similarity 1.0), wykrywanie kanibalizacji (0.9-0.99) i wyszukiwanie nearest neighbors do linkowania wewnętrznego. W Supabase obliczasz ją operatorem SQL <=> (odległość kosinusowa), a w Pythonie funkcją cosine_similarity z biblioteki scikit-learn.
Analogicznie, cosine similarity to porównywanie kierunku jazdy dwóch samochodów – nawet jeśli jeden jedzie szybciej (dłuższy wektor), oba jadą w tym samym kierunku (ten sam temat).