Reranking
RAG (Retrieval Augmented Generation)Reranking to drugi etap wyszukiwania w systemach RAG, gdzie model cross-encoder precyzyjnie sortuje wyniki wstępnie pobrane przez embeddingi. Embeddingi są szybkie, ale 'płytkie' – dają zbliżone wyniki (np. 0.84-0.88), co utrudnia rozróżnienie 'bardzo dobrego' od 'idealnego' dopasowania.
Reranker daje większą dyskryminację (np. 0.36-0.71), wyraźnie wskazując najlepsze wyniki. Jest WOLNY i DROGI, więc używasz go TYLKO na top 10-100 wynikach z embeddingów, nigdy na całej bazie. Wśród dostawców są JinaAI (multilanguage, dobry dla polskiego), Cohere (pionier rerankingu), ColBERT i FlashRank (lokalny, bez API). W SEO reranking jest kluczowy do precyzyjnego linkowania wewnętrznego: embeddingi wyłapują 100 kandydatów, a reranker wybiera 5-10, które NAPRAWDĘ warto podlinkować.
Analogicznie, embeddingi to wstępna selekcja CV (z 1000 kandydatów wybierasz 20), reranking to rozmowa kwalifikacyjna (z 20 wybierasz 3 najlepszych).