t-SNE i PCA
EmbeddingiT-SNE i PCA to metody redukcji wymiarowości wektorów z setek lub tysięcy wymiarów do 2D lub 3D, umożliwiające wizualizację klastrów tematycznych na ekranie. PCA (Principal Component Analysis) zachowuje globalne relacje między punktami – dobre do ogólnego przeglądu struktury danych. t-SNE zachowuje lokalne relacje – lepsze do wizualizacji klastrów, bo grupuje blisko siebie punkty semantycznie podobne. W SEO używane z TensorFlow Projector lub Jina Visualizer do 'zobaczenia', jak AI rozumie serwis klienta: które artykuły się grupują, gdzie są duplikaty, które tematy są odosobnione.
Na przykład po wizualizacji 500 tytułów bloga kancelarii prawniczej w t-SNE natychmiast zobaczysz, czy artykuły o prawie spadkowym tworzą zwarty klaster, czy są rozrzucone. W praktyce używaj t-SNE do prezentacji klientowi – wizualna mapa serwisu jest znacznie bardziej przekonująca niż tabela z liczbami.