Podobieństwo kosinusowe (0-1)

Embeddingi
Podobieństwo kosinusowe
Podobieństwo kosinusowe (0-1) to miara podobieństwa między dwoma wektorami (0-1) oparta na kącie między nimi – standard w porównywaniu embeddingów; 1.

Podobieństwo kosinusowe to główna metryka porównywania embeddingów w SEO, mierząca kąt między dwoma wektorami w skali od 0 do 1. Wartość 1.0 oznacza identyczne znaczenie (potencjalny duplikat), 0.9-0.99 sygnalizuje kanibalizację, a 0.75-0.9 wskazuje na silne powiązanie tematyczne idealne do linkowania wewnętrznego.

Jest preferowana nad odległością euklidesową, bo mierzy kierunek wektora (znaczenie), nie jego długość – dwa artykuły mogą mieć różną objętość, ale identyczny temat. Praktyczne zastosowania w SEO obejmują: porównywanie tytułów stron, detekcję duplikatów (similarity 1.0), wykrywanie kanibalizacji (0.9-0.99) i wyszukiwanie nearest neighbors do linkowania wewnętrznego. W Supabase obliczasz ją operatorem SQL <=> (odległość kosinusowa), a w Pythonie funkcją cosine_similarity z biblioteki scikit-learn.

Analogicznie, cosine similarity to porównywanie kierunku jazdy dwóch samochodów – nawet jeśli jeden jedzie szybciej (dłuższy wektor), oba jadą w tym samym kierunku (ten sam temat).

Źródło: AI Semantic SEO Expert, Robert Niechciał (sensai.io)