Tutorials › Generative AI Engineering › Vector Databases

Vector Databases

6 min read Quiz at the end

Store embeddings in Chroma (dev) or Pinecone/Qdrant (prod) and query by semantic similarity.

Vector Databases

Vector databases store embeddings and enable fast approximate nearest-neighbour search to find similar documents.

# Chroma (local dev — no API key needed)
import chromadb

client = chromadb.Client()
coll = client.create_collection('docs')

coll.add(
    documents=['Docker containers are isolated environments',
               'Kubernetes orchestrates container workloads'],
    embeddings=[[0.1,0.2,...],[0.15,0.25,...]],
    ids=['doc1','doc2'],
    metadatas=[{'source':'docker.md'},{'source':'k8s.md'}]
)

results = coll.query(
    query_embeddings=[[0.12,0.22,...]],
    n_results=2
)

# Pinecone (production managed)
from pinecone import Pinecone
pc = Pinecone(api_key='your-key')
index = pc.Index('my-index')
index.upsert(vectors=[{
    'id':'doc1',
    'values':embedding,
    'metadata':{'text':'...','source':'docker.md'}
}])
results = index.query(vector=q_embed, top_k=5, include_metadata=True)

# Options: Chroma (dev) | Pinecone | Qdrant | Weaviate | pgvector

← Embeddings Next: Building a RAG Pipeline →

Topic Quiz · 1 questions

Test your understanding before moving on

1. What is the primary purpose of a vector database?

💡 Vector databases store embedding vectors and enable fast approximate nearest-neighbour (ANN) search.

Quick Access

Vector Databases

Vector Databases

Test your understanding before moving on