Linkowanie wewnetrzne (nearest neighbors)
EmbeddingiLinkowanie wewnętrzne oparte na nearest neighbors to strategia budowania linków wewnętrznych z wykorzystaniem embeddingów. Dla każdego URL-a szukamy 10 najbliższych sąsiadów w przestrzeni wektorowej (cosine similarity > 0.8), co daje listę par URL-ów do podlinkowania. Linkowanie wewnętrzne oparte na nearest neighbors to fundamentalna zmiana w porównaniu z linkowaniem leksykalnym – nie szukamy dopasowania słów, ale podobieństwa ZNACZENIA. Następnym krokiem po identyfikacji par jest analiza anchor textów i kontekstu linkowania, a przy większej precyzji można dodać reranking (z top 100 wybrać top 10 najbardziej trafnych).
Ta metoda jest rozszerzana grafami wiedzy, gdzie SHARES_ATTRIBUTE daje nie tylko CO linkować, ale DLACZEGO i z jaką siłą. Na przykład dla e-commerce z 10 000 produktów embeddingi wyłapują 100 potencjalnie powiązanych produktów, a reranker z tej setki wybiera 5-10 naprawdę wartych podlinkowania.