Dystrybucja terminow w artykule
Semantyka leksykalnaDystrybucja terminów to równomierne rozmieszczenie kluczowych pojęć w całym artykule, nie tylko w pierwszym akapicie. RAG dzieli artykuł na chunki (fragmenty ~200-500 słów) i każdy chunk jest osobno wektoryzowany – jeśli wszystkie ważne terminy są skupione w pierwszych 500 słowach, tylko pierwszy chunk ma dobre embeddingi, a reszta artykułu jest 'semantycznie pusta' i AI jej nie zacytuje. Prawidłowa dystrybucja oznacza, że każdy H2 (chunk) zawiera odpowiednie terminy branżowe, synonimy i meronimy, zapewniając wysoki similarity score w każdym fragmencie.
Na przykład artykuł o leasingu ma 6 sekcji H2 – w każdej powinny pojawić się kluczowe terminy jak 'leasing', 'rata', 'VAT', a nie tylko w pierwszej sekcji. W praktyce po napisaniu artykułu sprawdź każdy H2 osobno – czy wycięty z kontekstu nadal zawiera wystarczającą liczbę terminów branżowych, by AI mógł go prawidłowo skategoryzować. Dystrybucja terminów bezpośrednio wpływa na Passage Ranking – algorytm Google'a oceniający poszczególne fragmenty strony, nie całą stronę naraz.