RETRIEVAL_DOCUMENT
EmbeddingiRETRIEVAL_DOCUMENT to typ zadania embeddingowego optymalizujący wektor pod reprezentowanie dokumentów w systemach RAG – długich, informacyjnych treści. Używany przy indeksowaniu treści: każdy artykuł lub chunk jest wektoryzowany z tym typem, aby model lepiej uchwycił jego zawartość informacyjną. Działa w parze z RETRIEVAL_QUERY (po stronie zapytań).
Kluczową zasadą jest to, że ten sam model embeddingowy musi być używany zarówno do indeksowania, jak i wyszukiwania – jeśli zaindeksowałeś treści Gemini z task type RETRIEVAL_DOCUMENT, to zapytania musisz wektoryzować Gemini z RETRIEVAL_QUERY. Mieszanie modeli (np. indeksowanie Jina, wyszukiwanie OpenAI) da bezwartościowe wyniki, ponieważ wektory z różnych modeli żyją w różnych przestrzeniach. W praktyce przy indeksowaniu dużego serwisu (np. 1000 stron) generuj embeddingi partiami po 50-100 i zapisuj do CSV/bazy po każdej partii, aby nie stracić postępu przy błędzie API.