Chunking (dzielenie na fragmenty)

RAG (Retrieval Augmented Generation)
Chunking
Chunking (dzielenie na fragmenty) to proces dzielenia dokumentu na mniejsze fragmenty (chunki) przed wektoryzacją w systemie RAG.

Chunking to proces dzielenia dokumentu na mniejsze fragmenty (chunki) przed wektoryzacją w systemie RAG. Jest kluczowym krokiem wpływającym na jakość wyników: za długie fragmenty powodują rozmycie semantyczne (wektor uśrednia zbyt wiele tematów), za krótkie tracą kontekst. Optymalna strategia to dzielenie po nagłówkach H2, gdzie każdy chunk jest autonomiczny – zrozumiały sam w sobie, bez kontekstu reszty artykułu. Wielkość chunka powinna być dostosowana do zastosowania: chatbot wymaga krótszych chunków (200-300 słów), analiza treści dłuższych (400-600 słów).

W kontekście SEO chunking wpływa bezpośrednio na to, czy AI Search zacytuje Twój artykuł – Google wycina fragment pod H2 i ocenia go osobno. Dlatego podkreśla się zasadę self-contained chunk: każda sekcja H2 musi mieć BLUF na początku, pełne nazwy encji (nie zaimki) i równomierną dystrybucję terminów kluczowych.

Źródło: AI Semantic SEO Expert, Robert Niechciał (sensai.io)