makr-code · makr-code · Feb 2, 2026 · Feb 1, 2026 · Feb 1, 2026 · Feb 1, 2026
@@ -0,0 +1,376 @@
+#include "index/gpu_vector_index.h"
+#include <benchmark/benchmark.h>
+#include <random>
+#include <vector>
+
+using namespace themis::index;
+
+// Helper function to generate random vectors
+std::vector<std::vector<float>> generateRandomVectors(size_t count, int dimension, int seed = 42) {
+    std::mt19937 gen(seed);
+    std::uniform_real_distribution<float> dist(-1.0f, 1.0f);
+
+    std::vector<std::vector<float>> vectors;
+    vectors.reserve(count);
+
+    for (size_t i = 0; i < count; ++i) {
+        std::vector<float> vec(dimension);
+        for (int j = 0; j < dimension; ++j) {
+            vec[j] = dist(gen);
+        }
+        vectors.push_back(vec);
+    }
+
+    return vectors;
+}
+
+// =============================================================================
+// Index Building Benchmarks
+// =============================================================================
+
+static void BM_IndexBuild_CPU(benchmark::State& state) {
+    int dimension = state.range(0);
+    size_t numVectors = state.range(1);
+
+    auto vectors = generateRandomVectors(numVectors, dimension);
+    std::vector<std::string> ids;
+    for (size_t i = 0; i < numVectors; ++i) {
+        ids.push_back("vec_" + std::to_string(i));
+    }
+
+    for (auto _ : state) {
+        GPUVectorIndex::Config config;
+        config.backend = GPUVectorIndex::Backend::CPU;
+        config.metric = GPUVectorIndex::DistanceMetric::L2;
+
+        GPUVectorIndex index(config);
+        index.initialize(dimension);
+
+        benchmark::DoNotOptimize(index.addVectorBatch(ids, vectors));
+
+        index.shutdown();
+    }
+
+    state.SetItemsProcessed(state.iterations() * numVectors);
+    state.SetLabel(std::to_string(dimension) + "D, " + std::to_string(numVectors) + " vectors");
+}
+
+#ifdef THEMIS_ENABLE_CUDA
+static void BM_IndexBuild_CUDA(benchmark::State& state) {
+    int dimension = state.range(0);
+    size_t numVectors = state.range(1);
+
+    auto vectors = generateRandomVectors(numVectors, dimension);
+    std::vector<std::string> ids;
+    for (size_t i = 0; i < numVectors; ++i) {
+        ids.push_back("vec_" + std::to_string(i));
+    }
+
+    for (auto _ : state) {
+        GPUVectorIndex::Config config;
+        config.backend = GPUVectorIndex::Backend::CUDA;
+        config.metric = GPUVectorIndex::DistanceMetric::L2;
+
+        GPUVectorIndex index(config);
+        if (!index.initialize(dimension)) {
+            state.SkipWithError("CUDA not available");
+            return;
+        }
+
+        benchmark::DoNotOptimize(index.addVectorBatch(ids, vectors));
+
+        index.shutdown();
+    }
+
+    state.SetItemsProcessed(state.iterations() * numVectors);
+    state.SetLabel(std::to_string(dimension) + "D, " + std::to_string(numVectors) + " vectors");
+}
+#endif
+
+// =============================================================================
+// Search Benchmarks
+// =============================================================================
+
+static void BM_Search_CPU(benchmark::State& state) {
+    int dimension = state.range(0);
+    size_t numVectors = state.range(1);
+    int k = state.range(2);
+
+    // Setup
+    auto vectors = generateRandomVectors(numVectors, dimension);
+    std::vector<std::string> ids;
+    for (size_t i = 0; i < numVectors; ++i) {
+        ids.push_back("vec_" + std::to_string(i));
+    }
+
+    GPUVectorIndex::Config config;
+    config.backend = GPUVectorIndex::Backend::CPU;
+    config.metric = GPUVectorIndex::DistanceMetric::L2;
+
+    GPUVectorIndex index(config);
+    index.initialize(dimension);
+    index.addVectorBatch(ids, vectors);
+
+    auto query = vectors[0];
+
+    // Benchmark
+    for (auto _ : state) {
+        auto results = index.search(query, k);
+        benchmark::DoNotOptimize(results);
+    }
+
+    index.shutdown();
+
+    state.SetItemsProcessed(state.iterations());
+    state.SetLabel(std::to_string(dimension) + "D, " + 
+                  std::to_string(numVectors) + " vectors, k=" + std::to_string(k));
+}
+
+#ifdef THEMIS_ENABLE_CUDA
+static void BM_Search_CUDA(benchmark::State& state) {
+    int dimension = state.range(0);
+    size_t numVectors = state.range(1);
+    int k = state.range(2);
+
+    // Setup
+    auto vectors = generateRandomVectors(numVectors, dimension);
+    std::vector<std::string> ids;
+    for (size_t i = 0; i < numVectors; ++i) {
+        ids.push_back("vec_" + std::to_string(i));
+    }
+
+    GPUVectorIndex::Config config;
+    config.backend = GPUVectorIndex::Backend::CUDA;
+    config.metric = GPUVectorIndex::DistanceMetric::L2;
+
+    GPUVectorIndex index(config);
+    if (!index.initialize(dimension)) {
+        state.SkipWithError("CUDA not available");
+        return;
+    }
+    index.addVectorBatch(ids, vectors);
+
+    auto query = vectors[0];
+
+    // Benchmark
+    for (auto _ : state) {
+        auto results = index.search(query, k);
+        benchmark::DoNotOptimize(results);
+    }
+
+    index.shutdown();
+
+    state.SetItemsProcessed(state.iterations());
+    state.SetLabel(std::to_string(dimension) + "D, " + 
+                  std::to_string(numVectors) + " vectors, k=" + std::to_string(k));
+}
+#endif
+
+// =============================================================================
+// Batch Search Benchmarks
+// =============================================================================
+
+static void BM_BatchSearch_CPU(benchmark::State& state) {
+    int dimension = state.range(0);
+    size_t numVectors = state.range(1);
+    size_t batchSize = state.range(2);
+    int k = 10;
+
+    // Setup
+    auto vectors = generateRandomVectors(numVectors, dimension);
+    std::vector<std::string> ids;
+    for (size_t i = 0; i < numVectors; ++i) {
+        ids.push_back("vec_" + std::to_string(i));
+    }
+
+    GPUVectorIndex::Config config;
+    config.backend = GPUVectorIndex::Backend::CPU;
+    config.metric = GPUVectorIndex::DistanceMetric::L2;
+
+    GPUVectorIndex index(config);
+    index.initialize(dimension);
+    index.addVectorBatch(ids, vectors);
+
+    auto queries = generateRandomVectors(batchSize, dimension, 100);
+
+    // Benchmark
+    for (auto _ : state) {
+        auto results = index.searchBatch(queries, k);
+        benchmark::DoNotOptimize(results);
+    }
+
+    index.shutdown();
+
+    state.SetItemsProcessed(state.iterations() * batchSize);
+    state.SetLabel(std::to_string(dimension) + "D, " + 
+                  std::to_string(numVectors) + " vectors, batch=" + std::to_string(batchSize));
+}
+
+#ifdef THEMIS_ENABLE_CUDA
+static void BM_BatchSearch_CUDA(benchmark::State& state) {
+    int dimension = state.range(0);
+    size_t numVectors = state.range(1);
+    size_t batchSize = state.range(2);
+    int k = 10;
+
+    // Setup
+    auto vectors = generateRandomVectors(numVectors, dimension);
+    std::vector<std::string> ids;
+    for (size_t i = 0; i < numVectors; ++i) {
+        ids.push_back("vec_" + std::to_string(i));
+    }
+
+    GPUVectorIndex::Config config;
+    config.backend = GPUVectorIndex::Backend::CUDA;
+    config.metric = GPUVectorIndex::DistanceMetric::L2;
+
+    GPUVectorIndex index(config);
+    if (!index.initialize(dimension)) {
+        state.SkipWithError("CUDA not available");
+        return;
+    }
+    index.addVectorBatch(ids, vectors);
+
+    auto queries = generateRandomVectors(batchSize, dimension, 100);
+
+    // Benchmark
+    for (auto _ : state) {
+        auto results = index.searchBatch(queries, k);
+        benchmark::DoNotOptimize(results);
+    }
+
+    index.shutdown();
+
+    state.SetItemsProcessed(state.iterations() * batchSize);
+    state.SetLabel(std::to_string(dimension) + "D, " + 
+                  std::to_string(numVectors) + " vectors, batch=" + std::to_string(batchSize));
+}
+#endif
+
+// =============================================================================
+// Distance Metric Benchmarks
+// =============================================================================
+
+static void BM_DistanceMetric_L2(benchmark::State& state) {
+    int dimension = state.range(0);
+    size_t numVectors = state.range(1);
+
+    auto vectors = generateRandomVectors(numVectors, dimension);
+    std::vector<std::string> ids;
+    for (size_t i = 0; i < numVectors; ++i) {
+        ids.push_back("vec_" + std::to_string(i));
+    }
+
+    GPUVectorIndex::Config config;
+    config.backend = GPUVectorIndex::Backend::CPU;
+    config.metric = GPUVectorIndex::DistanceMetric::L2;
+
+    GPUVectorIndex index(config);
+    index.initialize(dimension);
+    index.addVectorBatch(ids, vectors);
+
+    auto query = vectors[0];
+
+    for (auto _ : state) {
+        auto results = index.search(query, 10);
+        benchmark::DoNotOptimize(results);
+    }
+
+    index.shutdown();
+}
+
+static void BM_DistanceMetric_Cosine(benchmark::State& state) {
+    int dimension = state.range(0);
+    size_t numVectors = state.range(1);
+
+    auto vectors = generateRandomVectors(numVectors, dimension);
+    std::vector<std::string> ids;
+    for (size_t i = 0; i < numVectors; ++i) {
+        ids.push_back("vec_" + std::to_string(i));
+    }
+
+    GPUVectorIndex::Config config;
+    config.backend = GPUVectorIndex::Backend::CPU;
+    config.metric = GPUVectorIndex::DistanceMetric::COSINE;
+
+    GPUVectorIndex index(config);
+    index.initialize(dimension);
+    index.addVectorBatch(ids, vectors);
+
+    auto query = vectors[0];
+
+    for (auto _ : state) {
+        auto results = index.search(query, 10);
+        benchmark::DoNotOptimize(results);
+    }
+
+    index.shutdown();
+}
+
+// =============================================================================
+// Register Benchmarks
+// =============================================================================
+
+// Index building
+BENCHMARK(BM_IndexBuild_CPU)
+    ->Args({128, 1000})
+    ->Args({128, 10000})
+    ->Args({384, 1000})
+    ->Args({768, 1000})
+    ->Unit(benchmark::kMillisecond);
+
+#ifdef THEMIS_ENABLE_CUDA
+BENCHMARK(BM_IndexBuild_CUDA)
+    ->Args({128, 1000})
+    ->Args({128, 10000})
+    ->Args({384, 1000})
+    ->Args({768, 1000})
+    ->Unit(benchmark::kMillisecond);
+#endif
+
+// Single query search
+BENCHMARK(BM_Search_CPU)
+    ->Args({128, 1000, 10})
+    ->Args({128, 10000, 10})
+    ->Args({384, 1000, 10})
+    ->Args({768, 1000, 10})
+    ->Unit(benchmark::kMicrosecond);
+
+#ifdef THEMIS_ENABLE_CUDA
+BENCHMARK(BM_Search_CUDA)
+    ->Args({128, 1000, 10})
+    ->Args({128, 10000, 10})
+    ->Args({384, 1000, 10})
+    ->Args({768, 1000, 10})
+    ->Unit(benchmark::kMicrosecond);
+#endif
+
+// Batch search
+BENCHMARK(BM_BatchSearch_CPU)
+    ->Args({128, 10000, 10})
+    ->Args({128, 10000, 100})
+    ->Args({128, 10000, 500})
+    ->Args({384, 10000, 100})
+    ->Unit(benchmark::kMillisecond);
+
+#ifdef THEMIS_ENABLE_CUDA
+BENCHMARK(BM_BatchSearch_CUDA)
+    ->Args({128, 10000, 10})
+    ->Args({128, 10000, 100})
+    ->Args({128, 10000, 500})
+    ->Args({384, 10000, 100})
+    ->Unit(benchmark::kMillisecond);
+#endif
+
+// Distance metrics
+BENCHMARK(BM_DistanceMetric_L2)
+    ->Args({128, 10000})
+    ->Args({384, 10000})
+    ->Unit(benchmark::kMicrosecond);
+
+BENCHMARK(BM_DistanceMetric_Cosine)
+    ->Args({128, 10000})
+    ->Args({384, 10000})
+    ->Unit(benchmark::kMicrosecond);
+
+BENCHMARK_MAIN();