RETRIEVAL_DOCUMENT

Embeddingi

RETRIEVAL_DOCUMENT to typ zadania embeddingowego optymalizujący wektor pod reprezentowanie dokumentów – używany po stronie dokumentu w systemach RAG.

RETRIEVAL_DOCUMENT to typ zadania embeddingowego optymalizujący wektor pod reprezentowanie dokumentów w systemach RAG – długich, informacyjnych treści. Używany przy indeksowaniu treści: każdy artykuł lub chunk jest wektoryzowany z tym typem, aby model lepiej uchwycił jego zawartość informacyjną. Działa w parze z RETRIEVAL_QUERY (po stronie zapytań).

Kluczową zasadą jest to, że ten sam model embeddingowy musi być używany zarówno do indeksowania, jak i wyszukiwania – jeśli zaindeksowałeś treści Gemini z task type RETRIEVAL_DOCUMENT, to zapytania musisz wektoryzować Gemini z RETRIEVAL_QUERY. Mieszanie modeli (np. indeksowanie Jina, wyszukiwanie OpenAI) da bezwartościowe wyniki, ponieważ wektory z różnych modeli żyją w różnych przestrzeniach. W praktyce przy indeksowaniu dużego serwisu (np. 1000 stron) generuj embeddingi partiami po 50-100 i zapisuj do CSV/bazy po każdej partii, aby nie stracić postępu przy błędzie API.

Źródło: AI Semantic SEO Expert, Robert Niechciał (sensai.io)