Chunking (dzielenie na fragmenty)
RAG (Retrieval Augmented Generation)Chunking to proces dzielenia dokumentu na mniejsze fragmenty (chunki) przed wektoryzacją w systemie RAG. Jest kluczowym krokiem wpływającym na jakość wyników: za długie fragmenty powodują rozmycie semantyczne (wektor uśrednia zbyt wiele tematów), za krótkie tracą kontekst. Optymalna strategia to dzielenie po nagłówkach H2, gdzie każdy chunk jest autonomiczny – zrozumiały sam w sobie, bez kontekstu reszty artykułu. Wielkość chunka powinna być dostosowana do zastosowania: chatbot wymaga krótszych chunków (200-300 słów), analiza treści dłuższych (400-600 słów).
W kontekście SEO chunking wpływa bezpośrednio na to, czy AI Search zacytuje Twój artykuł – Google wycina fragment pod H2 i ocenia go osobno. Dlatego podkreśla się zasadę self-contained chunk: każda sekcja H2 musi mieć BLUF na początku, pełne nazwy encji (nie zaimki) i równomierną dystrybucję terminów kluczowych.