pgvector

Narzędzia i środowisko

PG Vector

pgvector – Rozszerzenie PostgreSQL dodające obsługę wektorów i wyszukiwanie nearest neighbors – używane w Supabase jako baza embeddingów do RAG i analiz.

Pgvector to rozszerzenie bazy danych PostgreSQL dodające natywną obsługę wektorów i operacji wektorowych, w tym wyszukiwanie nearest neighbors i obliczanie cosine similarity. W Supabase pgvector jest domyślnie zainstalowany, co oznacza, że jedna baza danych obsługuje zarówno dane relacyjne (URL-e, metadane, tytuły), jak i embeddingi wektorowe – nie potrzebujesz osobnej bazy wektorowej.

W pipeline'u audytu semantycznego pgvector przechowuje embeddingi tytułów stron, chunków treści i keywords, umożliwiając szybkie wyszukiwanie podobnych dokumentów zapytaniem SQL z operatorem <=> (cosine distance). Operator <=> zwraca odległość kosinusową (0 = identyczne, 2 = przeciwne), więc ORDER BY ... <=> ... ASC daje najbliższe sąsiedztwa.

Na przykład SELECT title, embedding <=> query_embedding AS distance FROM pages ORDER BY distance LIMIT 10 – zwraca 10 najbardziej podobnych stron.

W praktyce przy mniej niż 100k wektorów pgvector w Supabase jest wystarczający – Qdrant potrzebujesz dopiero przy milionach wektorów lub wymaganiach ultra-niskiej latencji.

Źródło: AI Semantic SEO Expert, Robert Niechciał (sensai.io)