t-SNE i PCA

Embeddingi

t-SNE i PCA – Metody redukcji wymiarowości wektorów do 2D/3D umożliwiające wizualizację klastrów tematycznych – t-SNE zachowuje lokalne relacje.

T-SNE i PCA to metody redukcji wymiarowości wektorów z setek lub tysięcy wymiarów do 2D lub 3D, umożliwiające wizualizację klastrów tematycznych na ekranie. PCA (Principal Component Analysis) zachowuje globalne relacje między punktami – dobre do ogólnego przeglądu struktury danych. t-SNE zachowuje lokalne relacje – lepsze do wizualizacji klastrów, bo grupuje blisko siebie punkty semantycznie podobne. W SEO używane z TensorFlow Projector lub Jina Visualizer do 'zobaczenia', jak AI rozumie serwis klienta: które artykuły się grupują, gdzie są duplikaty, które tematy są odosobnione.

Na przykład po wizualizacji 500 tytułów bloga kancelarii prawniczej w t-SNE natychmiast zobaczysz, czy artykuły o prawie spadkowym tworzą zwarty klaster, czy są rozrzucone. W praktyce używaj t-SNE do prezentacji klientowi – wizualna mapa serwisu jest znacznie bardziej przekonująca niż tabela z liczbami.

Źródło: AI Semantic SEO Expert, Robert Niechciał (sensai.io)