Centroid embeddingowy
Makrosemantyka (poziom witryny)Środek ciężkości wektorów embeddingowych wszystkich stron witryny – punkt definiujący 'o czym jest strona' w przestrzeni semantycznej. Oblicza się jako średni wektor WSZYSTKICH treści. Site Focus to średnia odległość od centroidu, Site Radius to wariancja. Treści peryferyjne (artykuły sponsorowane, offtopicowe posty) oddalają się od centroidu i obniżają Site Focus.
Analogicznie, centroid to środek tarczy – celność strzelca to jak blisko artykuły trafiają w ten środek. W przypadku sklepu z meblami ogrodowymi centroid dryfował w kierunku 'ogród' zamiast 'meble ogrodowe', bo treści o trawie i kwiatach ciągnęły go w złą stronę.
W praktyce centroid można obliczyć samodzielnie w Google Colab – wystarczy wygenerować embeddingi wszystkich stron i policzyć średni wektor. Porównaj centroid swojej domeny z centroidem top 3 konkurentów, aby zobaczyć, czy Twoja witryna jest postrzegana tak, jak chcesz.