Qdrant Vector Database: Semantik Search & AI

📋 Daftar Isi

Pengenalan Vector Database
Instalasi Qdrant
Collections & Vectors
Filtering & Payloads
HNSW Index
RAG Implementation
Clustering & Production
Integrasi dengan AI Framework
Quiz Pemahaman

1. Pengenalan Vector Database

Vector database adalah database yang dirancang khusus untuk menyimpan, mengindeks, dan mencari vector embeddings — representasi numerik dari data seperti teks, gambar, audio, dan video dalam bentuk array floating-point berdimensi tinggi. Qdrant adalah salah satu vector database open-source terbaik saat ini.

Dalam era AI modern, hampir semua model machine learning (GPT, BERT, CLIP, Stable Diffusion) menghasilkan embedding vectors. Vector database memungkinkan similarity search — mencari data yang paling mirip secara semantik, bukan berdasarkan keyword match.

Bagaimana Vector Database Bekerja

📝
Data Asli
Teks, gambar,
audio, video

→

🧠

Embedding Model

OpenAI, Sentence
Transformers, CLIP

→

📊

Vector (384-1536 dim)

[0.12, -0.45, 0.78, ...]
floating-point array

→

🔍

Similarity Search

Cari vector paling
mendekati query

1.1 Keunggulan Qdrant

High Performance: HNSW index untuk ANN search yang sangat cepat
Filtering Kaya: Filter berdasarkan payload sambil tetap melakukan vector search
Multi-tenancy: Payload-based atau collection-based isolation
Multiple Vectors: Satu point bisa memiliki beberapa vectors (named vectors)
Quantization: Scalar, product, dan binary quantization untuk mengurangi memory
Clustering: Built-in distributed mode untuk high availability
REST & gRPC API: Fleksibel untuk integrasi dari bahasa apapun

2. Instalasi Qdrant

Terminal — Instalasi Qdrant

# Docker (recommended)
docker run -d --name qdrant \
    -p 6333:6333 \
    -p 6334:6334 \
    -v ~/qdrant-data:/qdrant/storage \
    qdrant/qdrant:v1.9.0

# REST API: port 6333
# gRPC API: port 6334
# Dashboard: http://localhost:6333/dashboard

# Atau install binary
wget https://github.com/qdrant/qdrant/releases/download/v1.9.0/qdrant-x86_64-unknown-linux-gnu.tar.gz
tar xzf qdrant-x86_64-unknown-linux-gnu.tar.gz
./qdrant

# Python client
pip install qdrant-client openai

# JavaScript/TypeScript client
npm install @qdrant/js-client-rest

# Verifikasi
curl http://localhost:6333/health
# Output: {"title":"qdrant - vector search engine","version":"1.9.0"}

2.1 Qdrant Cloud (Managed)

Qdrant juga tersedia sebagai managed service di cloud.qdrant.io dengan free tier 1GB cluster — cocok untuk prototyping dan development.

3. Collections & Vectors

Collection adalah unit penyimpanan utama di Qdrant — analog dengan "table" di database relasional. Setiap collection memiliki konfigurasi vector (dimensi, distance metric) dan menyimpan points yang terdiri dari ID, vector, dan payload.

3.1 Membuat Collection

Python — Qdrant Client

from qdrant_client import QdrantClient
from qdrant_client.models import (
    Distance, VectorParams, PointStruct,
    Filter, FieldCondition, MatchValue,
    PayloadSchemaType, CreateAliasOperation
)

# Koneksi ke Qdrant
client = QdrantClient(url="http://localhost:6333")

# Membuat collection
client.create_collection(
    collection_name="documents",
    vectors_config=VectorParams(
        size=384,          # Dimensi embedding
        distance=Distance.COSINE  # COSINE, EUCLID, DOT, MANHATTAN
    ),
)

# Collection dengan multiple named vectors
client.create_collection(
    collection_name="products",
    vectors_config={
        "text": VectorParams(size=384, distance=Distance.COSINE),
        "image": VectorParams(size=512, distance=Distance.COSINE),
    }
)

# Cek collection info
collection_info = client.get_collection("documents")
print(f"Vectors: {collection_info.vectors_count}")
print(f"Status: {collection_info.status}")

3.2 Insert & Query Vectors

Python — CRUD & Search Operations

import uuid
from qdrant_client.models import PointStruct

# Insert points dengan payload
points = [
    PointStruct(
        id=str(uuid.uuid4()),
        vector=[0.12, 0.45, 0.78, ...],  # 384-dim vector
        payload={
            "title": "Tutorial Python untuk Pemula",
            "category": "programming",
            "language": "id",
            "difficulty": "beginner",
            "tags": ["python", "tutorial", "pemula"],
            "views": 1500,
            "rating": 4.8
        }
    ),
    PointStruct(
        id=str(uuid.uuid4()),
        vector=[0.34, 0.67, 0.23, ...],
        payload={
            "title": "Machine Learning dengan TensorFlow",
            "category": "ai",
            "language": "id",
            "difficulty": "intermediate",
            "tags": ["ml", "tensorflow", "deep-learning"],
            "views": 2300,
            "rating": 4.9
        }
    ),
]

client.upsert(
    collection_name="documents",
    points=points
)

# Search — cari vector paling mirip
results = client.search(
    collection_name="documents",
    query_vector=[0.15, 0.42, 0.80, ...],  # Query vector
    limit=5,
)

for result in results:
    print(f"ID: {result.id}")
    print(f"Score: {result.score:.4f}")
    print(f"Title: {result.payload['title']}")
    print(f"Category: {result.payload['category']}")
    print("---")

# Search dengan filter
results = client.search(
    collection_name="documents",
    query_vector=[0.15, 0.42, 0.80, ...],
    query_filter=Filter(
        must=[
            FieldCondition(
                key="category",
                match=MatchValue(value="programming")
            ),
            FieldCondition(
                key="difficulty",
                match=MatchValue(value="beginner")
            )
        ]
    ),
    limit=5,
)

# Batch insert (untuk data besar)
import random
batch_points = [
    PointStruct(
        id=i,
        vector=[random.random() for _ in range(384)],
        payload={"index": i, "batch": True}
    )
    for i in range(10000)
]

client.upsert(
    collection_name="documents",
    points=batch_points,
    batch_size=100  # Insert per batch
)

4. Filtering & Payloads

Payload adalah metadata yang disimpan bersama vector di setiap point. Qdrant memungkinkan filtering berdasarkan payload secara simultan dengan vector search — ini memastikan hasil yang relevan secara semantik sekaligus memenuhi kriteria bisnis.

Python — Advanced Filtering

from qdrant_client.models import (
    Filter, FieldCondition, MatchValue,
    MatchAny, Range, IsNullCondition,
    NestedCondition
)

# Filter equality
Filter(must=[
    FieldCondition(key="language", match=MatchValue(value="id"))
])

# Filter IN (match any)
Filter(must=[
    FieldCondition(key="category", match=MatchAny(value=["programming", "ai"]))
])

# Filter range
Filter(must=[
    FieldCondition(
        key="rating",
        range=Range(gte=4.5, lte=5.0)
    ),
    FieldCondition(
        key="views",
        range=Range(gte=1000)
    )
])

# Filter array contains
Filter(must=[
    FieldCondition(key="tags", match=MatchValue(value="python"))
])

# Filter negation (must_not)
Filter(
    must=[
        FieldCondition(key="language", match=MatchValue(value="id"))
    ],
    must_not=[
        FieldCondition(key="difficulty", match=MatchValue(value="beginner"))
    ]
)

# OR logic (should)
Filter(
    should=[
        FieldCondition(key="category", match=MatchValue(value="programming")),
        FieldCondition(key="category", match=MatchValue(value="ai")),
    ]
)

# Complex filter: (programming OR ai) AND rating >= 4.5 AND NOT beginner
client.search(
    collection_name="documents",
    query_vector=[0.15, 0.42, 0.80, ...],
    query_filter=Filter(
        should=[
            FieldCondition(key="category", match=MatchValue(value="programming")),
            FieldCondition(key="category", match=MatchValue(value="ai")),
        ],
        must=[
            FieldCondition(key="rating", range=Range(gte=4.5)),
        ],
        must_not=[
            FieldCondition(key="difficulty", match=MatchValue(value="beginner")),
        ]
    ),
    limit=10
)

4.1 Payload Index

Python — Membuat Payload Index

from qdrant_client.models import PayloadSchemaType

# Index kolom yang sering di-filter untuk performa lebih baik
client.create_payload_index(
    collection_name="documents",
    field_name="category",
    field_schema=PayloadSchemaType.KEYWORD
)

client.create_payload_index(
    collection_name="documents",
    field_name="rating",
    field_schema=PayloadSchemaType.FLOAT
)

client.create_payload_index(
    collection_name="documents",
    field_name="views",
    field_schema=PayloadSchemaType.INTEGER
)

client.create_payload_index(
    collection_name="documents",
    field_name="title",
    field_schema=PayloadSchemaType.TEXT  # Full-text index
)

💡 Payload Index vs Payload Storage

Payload index mempercepat filtering tetapi menambah storage. Buat index hanya untuk kolom yang sering digunakan dalam filter. Kolom yang jarang di-filter cukup disimpan sebagai payload tanpa index.

5. HNSW Index

HNSW (Hierarchical Navigable Small World) adalah algoritma indexing yang digunakan Qdrant untuk Approximate Nearest Neighbor (ANN) search. HNSW membangun graf berlapis yang memungkinkan pencarian vector yang sangat cepat — bahkan pada dataset dengan miliaran vectors.

5.1 Mengkonfigurasi HNSW

Python — HNSW Configuration

from qdrant_client.models import HnswConfig, OptimizersConfig

# Membuat collection dengan HNSW config
client.create_collection(
    collection_name="high_perf_docs",
    vectors_config=VectorParams(
        size=384,
        distance=Distance.COSINE
    ),
    hnsw_config=HnswConfig(
        m=16,                # Jumlah koneksi per node (default: 16)
        ef_construct=100,    # Ukuran ef saat membangun index (default: 100)
        full_scan_threshold=20000,  # Jika dataset kecil, gunakan brute force
        max_indexing_threads=0,     # 0 = auto (gunakan semua core)
    ),
    optimizers_config=OptimizersConfig(
        deleted_threshold=0.2,
        vacuum_min_vector_number=1000,
        default_segment_number=0,
        max_segment_size=None,
        memmap_threshold=20000,
        indexing_threshold=20000,
        flush_interval_sec=5,
        max_optimization_threads=1
    )
)

# Mengubah ef saat search (trade-off akurasi vs speed)
results = client.search(
    collection_name="high_perf_docs",
    query_vector=[0.15, 0.42, ...],
    limit=10,
    search_params={
        "hnsw_ef": 128,  # Lebih tinggi = lebih akurat, lebih lambat
        "exact": False     # True = brute force (lebih akurat untuk small dataset)
    }
)

5.2 Parameter HNSW Penting

Parameter	Default	Pengaruh
`m`	16	Koneksi per node. Tinggi = lebih akurat, lebih banyak memory
`ef_construct`	100	Kualitas indexing. Tinggi = index lebih baik, build lebih lambat
`hnsw_ef` (search)	128	Kualitas search. Tinggi = lebih akurat, search lebih lambat
`full_scan_threshold`	20000	Jika point kurang dari ini, gunakan brute force

Python — Quantization (hemat memory)

from qdrant_client.models import ScalarQuantization, ScalarType

# Scalar quantization: mengurangi float32 ke uint8 (4x hemat memory)
client.create_collection(
    collection_name="quantized_docs",
    vectors_config=VectorParams(
        size=384,
        distance=Distance.COSINE
    ),
    quantization_config=ScalarQuantization(
        scalar=ScalarType.INT8,
        quantile=0.99,      # Menggunakan 99th percentile untuk range
        always_ram=True      # Simpan quantized vectors di RAM
    )
)

# Search dengan rescoring (akurasi tetap tinggi)
results = client.search(
    collection_name="quantized_docs",
    query_vector=[0.15, 0.42, ...],
    limit=10,
    search_params={
        "quantization": {
            "ignore": False,
            "rescore": True,      # Rescore dengan original vectors
            "oversampling": 2.0   # Ambil 2x lebih banyak candidate
        }
    }
)

6. RAG Implementation

Retrieval Augmented Generation (RAG) adalah pola arsitektur AI yang menggabungkan vector search dengan LLM. Data relevan diambil dari vector database berdasarkan query, lalu dikirimkan sebagai konteks ke LLM untuk menghasilkan jawaban yang lebih akurat dan grounded.

Python — RAG Pipeline dengan Qdrant + OpenAI

import openai
from qdrant_client import QdrantClient
from qdrant_client.models import PointStruct

openai_client = openai.OpenAI()
qdrant_client = QdrantClient(url="http://localhost:6333")

# Step 1: Index dokumen
def index_document(text, metadata):
    """Generate embedding dan simpan ke Qdrant."""
    response = openai_client.embeddings.create(
        input=text,
        model="text-embedding-3-small"
    )
    vector = response.data[0].embedding

    qdrant_client.upsert(
        collection_name="knowledge_base",
        points=[PointStruct(
            id=metadata["id"],
            vector=vector,
            payload={
                "text": text,
                "source": metadata.get("source", ""),
                "page": metadata.get("page", 0)
            }
        )]
    )

# Step 2: Retrieval
def retrieve_context(query, top_k=5):
    """Cari dokumen relevan berdasarkan query."""
    response = openai_client.embeddings.create(
        input=query,
        model="text-embedding-3-small"
    )
    query_vector = response.data[0].embedding

    results = qdrant_client.search(
        collection_name="knowledge_base",
        query_vector=query_vector,
        limit=top_k,
        score_threshold=0.7
    )

    return [hit.payload["text"] for hit in results]

# Step 3: Generate answer dengan konteks
def ask_question(question):
    """RAG: retrieve + generate."""
    context_docs = retrieve_context(question)
    context = "\n\n---\n\n".join(context_docs)

    prompt = f"""Berdasarkan konteks berikut, jawab pertanyaan user.
Jika jawaban tidak ada di konteks, katakan "Saya tidak tahu."

Konteks:
{context}

Pertanyaan: {question}

Jawaban:"""

    response = openai_client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[
            {"role": "system", "content": "Anda adalah asisten yang akurat dan helpful."},
            {"role": "user", "content": prompt}
        ],
        temperature=0.3
    )

    return {
        "answer": response.choices[0].message.content,
        "sources": context_docs
    }

# Contoh penggunaan
# index_document("CockroachDB adalah distributed SQL database...", {"id": 1, "source": "tutorial"})
result = ask_question("Apa itu CockroachDB?")
print(result["answer"])

7. Clustering & Production

7.1 Qdrant Cluster

Terminal — Qdrant Cluster Deployment

# Docker Compose: 3-node Qdrant cluster
# docker-compose.yml
version: '3.8'
services:
  qdrant-1:
    image: qdrant/qdrant:v1.9.0
    ports:
      - "6333:6333"
      - "6334:6334"
    volumes:
      - ./node1:/qdrant/storage
    environment:
      - QDRANT__CLUSTER__ENABLED=true
      - QDRANT__CLUSTER__P2P__PORT=6335
      - QDRANT__CLUSTER__P2P__HOSTS=qdrant-1:6335,qdrant-2:6335,qdrant-3:6335

  qdrant-2:
    image: qdrant/qdrant:v1.9.0
    volumes:
      - ./node2:/qdrant/storage
    environment:
      - QDRANT__CLUSTER__ENABLED=true
      - QDRANT__CLUSTER__P2P__PORT=6335
      - QDRANT__CLUSTER__P2P__HOSTS=qdrant-1:6335,qdrant-2:6335,qdrant-3:6335

  qdrant-3:
    image: qdrant/qdrant:v1.9.0
    volumes:
      - ./node3:/qdrant/storage
    environment:
      - QDRANT__CLUSTER__ENABLED=true
      - QDRANT__CLUSTER__P2P__PORT=6335
      - QDRANT__CLUSTER__P2P__HOSTS=qdrant-1:6335,qdrant-2:6335,qdrant-3:6335

# docker-compose up -d

# Collection dengan replication
client.create_collection(
    collection_name="production_docs",
    vectors_config=VectorParams(size=384, distance=Distance.COSINE),
    replication_factor=2,           # 2 replika per shard
    write_consistency_factor=2,     # Minimal 2 acknowledgement untuk write
    shard_number=3                  # 3 shards
)

8. Integrasi dengan AI Framework

8.1 LangChain + Qdrant

Python — LangChain + Qdrant Integration

from langchain_qdrant import QdrantVectorStore
from langchain_openai import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import TextLoader

# Load dan split dokumen
loader = TextLoader("tutorial.txt")
documents = loader.load()
splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
docs = splitter.split_documents(documents)

# Buat vector store
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
vector_store = QdrantVectorStore.from_documents(
    docs,
    embeddings,
    url="http://localhost:6333",
    collection_name="langchain_docs",
)

# Retrieval
retriever = vector_store.as_retriever(search_kwargs={"k": 5})
results = retriever.invoke("Bagaimana cara setup CockroachDB?")

# Atau langsung search
results = vector_store.similarity_search_with_score(
    "distributed database",
    k=5
)

8.2 Monitor & Maintain

Python — Monitoring Qdrant

# Collection statistics
info = client.get_collection("documents")
print(f"Points: {info.points_count}")
print(f"Vectors: {info.vectors_count}")
print(f"Segments: {info.segments_count}")
print(f"Status: {info.status}")
print(f"Indexed vectors: {info.indexed_vectors_count}")

# Cluster info
cluster_info = client.get_cluster_info()
print(f"Peer ID: {cluster_info.peer_id}")
print(f"Peers: {cluster_info.peers}")

# Optimasi (force segment merge)
client.update_collection(
    collection_name="documents",
    optimizer_config=OptimizersConfig(
        deleted_threshold=0.2,
        vacuum_min_vector_number=1000
    )
)

# Snapshot untuk backup
client.create_snapshot(collection_name="documents")

9. Quiz: Uji Pemahamanmu!

Setelah membaca tutorial di atas, jawablah 5 pertanyaan berikut:

Pertanyaan 1: Apa itu vector embedding?

a) Representasi numerik dari data (teks, gambar) dalam bentuk array floating-point

b) Algoritma untuk mengenkripsi data

c) Format penyimpanan untuk database SQL

d) Protokol jaringan untuk transfer data

Pertanyaan 2: Apa fungsi HNSW di Qdrant?

a) Mengkompresi data untuk menghemat storage

b) Mengenkripsi vectors untuk keamanan

c) Index untuk Approximate Nearest Neighbor search yang cepat

d) Menyalin data ke semua node dalam cluster

Pertanyaan 3: Apa itu RAG?

a) Teknik untuk menghapus data duplikat dari vector database

b) Pola arsitektur yang menggabungkan vector search dengan LLM untuk jawaban yang lebih akurat

c) Algoritma untuk mengurutkan vectors berdasarkan magnitude

d) Metode backup untuk vector database

Pertanyaan 4: Apa fungsi payload di Qdrant?

a) Menyimpan metadata yang bisa di-filter bersama vector search

b) Mengenkripsi vector sebelum disimpan

c) Menghitung distance antara vectors

d) Membagi collection ke beberapa shard

Pertanyaan 5: Apa keuntungan quantization di Qdrant?

a) Mengurangi penggunaan memory hingga 4x tanpa kehilangan banyak akurasi

b) Menghapus vectors yang tidak dipakai

c) Menambah dimensi vectors untuk akurasi lebih tinggi

d) Menggandakan jumlah vectors untuk redundancy

Qdrant Vector Database: Semantic Search & AI

1. Pengenalan Vector Database

1.1 Keunggulan Qdrant

2. Instalasi Qdrant

2.1 Qdrant Cloud (Managed)

3. Collections & Vectors

3.1 Membuat Collection

3.2 Insert & Query Vectors

4. Filtering & Payloads

4.1 Payload Index

5. HNSW Index

5.1 Mengkonfigurasi HNSW

5.2 Parameter HNSW Penting

6. RAG Implementation

7. Clustering & Production

7.1 Qdrant Cluster

8. Integrasi dengan AI Framework

8.1 LangChain + Qdrant

8.2 Monitor & Maintain

9. Quiz: Uji Pemahamanmu!

Pertanyaan 1: Apa itu vector embedding?

Pertanyaan 2: Apa fungsi HNSW di Qdrant?

Pertanyaan 3: Apa itu RAG?

Pertanyaan 4: Apa fungsi payload di Qdrant?

Pertanyaan 5: Apa keuntungan quantization di Qdrant?

📬 Dapatkan Tutorial Terbaru