From eae9d9f78f991d78f3a7ee54ad780b03310d6150 Mon Sep 17 00:00:00 2001
From: Yihao Fang <yihao.fang@gmail.com>
Date: Tue, 24 Feb 2026 16:04:55 -0500
Subject: [PATCH] Introduce the "threshold-elites" and "dominated novelty
 search" variants alongside MAP-elites

---
 openevolve/config.py                    |   3 +
 openevolve/controller.py                |   7 +-
 openevolve/database.py                  | 260 +++++++++++++++++++++++-
 tests/test_dns_database.py              | 220 ++++++++++++++++++++
 tests/test_threshold_elites_database.py | 220 ++++++++++++++++++++
 5 files changed, 706 insertions(+), 4 deletions(-)
 create mode 100644 tests/test_dns_database.py
 create mode 100644 tests/test_threshold_elites_database.py

diff --git a/openevolve/config.py b/openevolve/config.py
index bef193da21..b6da6e9afb 100644
--- a/openevolve/config.py
+++ b/openevolve/config.py
@@ -352,6 +352,9 @@ class DatabaseConfig:
     embedding_model: Optional[str] = None
     similarity_threshold: float = 0.99
 
+    # Bahlous-Boldi, R., Faldor, M., Grillotti, L., Janmohamed, H., Coiffard, L., Spector, L., & Cully, A. (2025, July). Dominated novelty search: Rethinking local competition in quality-diversity. In Proceedings of the Genetic and Evolutionary Computation Conference (pp. 104-112).
+    variant: str = "DNSProgramDatabase"
+    distance_threshold: float = 1.5
 
 @dataclass
 class EvaluatorConfig:
diff --git a/openevolve/controller.py b/openevolve/controller.py
index 01ffec73c3..53fba72fc0 100644
--- a/openevolve/controller.py
+++ b/openevolve/controller.py
@@ -11,7 +11,7 @@
 import uuid
 from pathlib import Path
 from typing import Any, Dict, List, Optional, Union
-
+import importlib
 from openevolve.config import Config, load_config
 from openevolve.database import Program, ProgramDatabase
 from openevolve.evaluator import Evaluator
@@ -149,7 +149,10 @@ def __init__(
             self.config.database.random_seed = self.config.random_seed
 
         self.config.database.novelty_llm = self.llm_ensemble
-        self.database = ProgramDatabase(self.config.database)
+        database_cls_name = getattr(self.config.database, "variant", "ProgramDatabase")
+        database_mod = importlib.import_module("openevolve.database")
+        database_cls = getattr(database_mod, database_cls_name, None)
+        self.database = database_cls(self.config.database)
 
         self.evaluator = Evaluator(
             self.config.evaluator,
diff --git a/openevolve/database.py b/openevolve/database.py
index eca5eab0bb..c4d16b5cd4 100644
--- a/openevolve/database.py
+++ b/openevolve/database.py
@@ -20,6 +20,8 @@
 from openevolve.config import DatabaseConfig
 from openevolve.utils.code_utils import calculate_edit_distance
 from openevolve.utils.metrics_utils import safe_numeric_average, get_fitness_score
+import copy
+import math
 
 logger = logging.getLogger(__name__)
 
@@ -1205,7 +1207,8 @@ def _update_best_program(self, program: Program) -> None:
             self.best_program_id = program.id
 
             # Log the change
-            if "combined_score" in program.metrics and "combined_score" in current_best.metrics:
+            if "combined_score" in program.metrics and "combined_score" in current_best.metrics \
+                and not math.isinf(program.metrics["combined_score"]) and not math.isinf(current_best.metrics["combined_score"]):
                 old_score = current_best.metrics["combined_score"]
                 new_score = program.metrics["combined_score"]
                 score_diff = new_score - old_score
@@ -1313,6 +1316,7 @@ def _sample_exploration_parent(self) -> Program:
                     metadata={"island": self.current_island},
                     artifacts_json=best_program.artifacts_json,
                     artifact_dir=best_program.artifact_dir,
+                    embedding=copy.deepcopy(best_program.embedding),
                 )
                 self.programs[copy_program.id] = copy_program
                 self.islands[self.current_island].add(copy_program.id)
@@ -1359,6 +1363,7 @@ def _sample_exploration_parent(self) -> Program:
                     metadata={"island": self.current_island},
                     artifacts_json=best_program.artifacts_json,
                     artifact_dir=best_program.artifact_dir,
+                    embedding=copy.deepcopy(best_program.embedding),
                 )
                 self.programs[copy_program.id] = copy_program
                 self.islands[self.current_island].add(copy_program.id)
@@ -1983,7 +1988,7 @@ def get_island_stats(self) -> List[dict]:
                     get_fitness_score(p.metrics, self.config.feature_dimensions)
                     for p in island_programs
                 ]
-
+                scores = [score for score in scores if not math.isinf(score)]
                 best_score = max(scores) if scores else 0.0
                 avg_score = sum(scores) / len(scores) if scores else 0.0
                 diversity = self._calculate_island_diversity(island_programs)
@@ -2561,3 +2566,254 @@ def log_prompt(
         if program_id not in self.prompts_by_program:
             self.prompts_by_program[program_id] = {}
         self.prompts_by_program[program_id][template_key] = prompt
+
+
+class ThresholdElitesProgramDatabase(ProgramDatabase):
+    def add(
+        self, program: Program, iteration: int = None, target_island: Optional[int] = None
+    ) -> str:
+        """
+        Add a program to the database
+
+        Args:
+            program: Program to add
+            iteration: Current iteration (defaults to last_iteration)
+            target_island: Specific island to add to (auto-detects parent's island if None)
+
+        Returns:
+            Program ID
+        """
+        # Store the program
+        # If iteration is provided, update the program's iteration_found
+        # Bahlous-Boldi, R., Faldor, M., Grillotti, L., Janmohamed, H., Coiffard, L., Spector, L., & Cully, A. (2025, July). Dominated novelty search: Rethinking local competition in quality-diversity. In Proceedings of the Genetic and Evolutionary Computation Conference (pp. 104-112).
+        if iteration is not None:
+            program.iteration_found = iteration
+            # Update last_iteration if needed
+            self.last_iteration = max(self.last_iteration, iteration)
+
+        self.programs[program.id] = program
+
+        # Calculate feature coordinates for Threshold-Elites
+        embd = self._calculate_feature_coords(program)
+        score = get_fitness_score(program.metrics, self.config.feature_dimensions)
+        program.embedding = embd
+        if "combined_score" not in program.metrics:
+            program.metrics["combined_score"] = score
+
+        # Determine target island
+        # If target_island is not specified and program has a parent, inherit parent's island
+        if target_island is None and program.parent_id:
+            parent = self.programs.get(program.parent_id)
+            if parent and "island" in parent.metadata:
+                # Child inherits parent's island to maintain island isolation
+                island_idx = parent.metadata["island"]
+                logger.debug(
+                    f"Program {program.id} inheriting island {island_idx} from parent {program.parent_id}"
+                )
+            else:
+                # Parent not found or has no island, use current_island
+                island_idx = self.current_island
+                if parent:
+                    logger.warning(
+                        f"Parent {program.parent_id} has no island metadata, using current_island {island_idx}"
+                    )
+                else:
+                    logger.warning(
+                        f"Parent {program.parent_id} not found, using current_island {island_idx}"
+                    )
+        elif target_island is not None:
+            # Explicit target island specified (e.g., for migrants)
+            island_idx = target_island
+        else:
+            # No parent and no target specified, use current island
+            island_idx = self.current_island
+
+        island_idx = island_idx % len(self.islands)  # Ensure valid island
+
+        # Novelty check before adding
+        if not self._is_novel(program.id, island_idx):
+            logger.debug(
+                f"Program {program.id} failed in novelty check and won't be added in the island {island_idx}"
+            )
+            return program.id  # Do not add non-novel program
+
+
+        distance_threshold = getattr(self.config, "distance_threshold", 1)
+        for pid in self.islands[island_idx]:
+            other = self.programs[pid]
+
+            if other.embedding is None:
+                logger.warning(
+                    f"Warning: Program {other.id} has no embedding, skipping similarity check"
+                )
+                continue
+
+            distance = math.sqrt(sum((a - b) ** 2 for a, b in zip(embd, other.embedding)))
+
+            if distance < distance_threshold: 
+                if score > other.metrics["combined_score"]:
+                    other.metrics["combined_score"] = float("-inf")
+                else:
+                    program.metrics["combined_score"] = float("-inf")
+
+
+        # Add to island
+        self.islands[island_idx].add(program.id)
+
+        # Track which island this program belongs to
+        program.metadata["island"] = island_idx
+
+        # Update archive
+        self._update_archive(program)
+
+        # Enforce population size limit BEFORE updating best program tracking
+        # This ensures newly added programs aren't immediately removed
+        self._enforce_population_limit(exclude_program_id=program.id)
+
+        # Update the absolute best program tracking (after population enforcement)
+        self._update_best_program(program)
+
+        # Update island-specific best program tracking
+        self._update_island_best_program(program, island_idx)
+
+        # Save to disk if configured
+        if self.config.db_path:
+            self._save_program(program)
+
+        logger.debug(f"Added program {program.id} to island {island_idx}")
+
+        return program.id
+    
+
+class DNSProgramDatabase(ProgramDatabase):
+    def add(
+        self, program: Program, iteration: int = None, target_island: Optional[int] = None
+    ) -> str:
+        """
+        Add a program to the database
+
+        Args:
+            program: Program to add
+            iteration: Current iteration (defaults to last_iteration)
+            target_island: Specific island to add to (auto-detects parent's island if None)
+
+        Returns:
+            Program ID
+        """
+        # Store the program
+        # If iteration is provided, update the program's iteration_found
+        # Bahlous-Boldi, R., Faldor, M., Grillotti, L., Janmohamed, H., Coiffard, L., Spector, L., & Cully, A. (2025, July). Dominated novelty search: Rethinking local competition in quality-diversity. In Proceedings of the Genetic and Evolutionary Computation Conference (pp. 104-112).
+        if iteration is not None:
+            program.iteration_found = iteration
+            # Update last_iteration if needed
+            self.last_iteration = max(self.last_iteration, iteration)
+
+        self.programs[program.id] = program
+
+        # Calculate feature coordinates for Threshold-Elites
+        embd = self._calculate_feature_coords(program)
+        score = get_fitness_score(program.metrics, self.config.feature_dimensions)
+        program.embedding = embd
+        if "combined_score" not in program.metrics:
+            program.metrics["combined_score"] = score
+
+        # Determine target island
+        # If target_island is not specified and program has a parent, inherit parent's island
+        if target_island is None and program.parent_id:
+            parent = self.programs.get(program.parent_id)
+            if parent and "island" in parent.metadata:
+                # Child inherits parent's island to maintain island isolation
+                island_idx = parent.metadata["island"]
+                logger.debug(
+                    f"Program {program.id} inheriting island {island_idx} from parent {program.parent_id}"
+                )
+            else:
+                # Parent not found or has no island, use current_island
+                island_idx = self.current_island
+                if parent:
+                    logger.warning(
+                        f"Parent {program.parent_id} has no island metadata, using current_island {island_idx}"
+                    )
+                else:
+                    logger.warning(
+                        f"Parent {program.parent_id} not found, using current_island {island_idx}"
+                    )
+        elif target_island is not None:
+            # Explicit target island specified (e.g., for migrants)
+            island_idx = target_island
+        else:
+            # No parent and no target specified, use current island
+            island_idx = self.current_island
+
+        island_idx = island_idx % len(self.islands)  # Ensure valid island
+
+        # Novelty check before adding
+        if not self._is_novel(program.id, island_idx):
+            logger.debug(
+                f"Program {program.id} failed in novelty check and won't be added in the island {island_idx}"
+            )
+            return program.id  # Do not add non-novel program
+
+        def _is_negative_infinity(value):
+            return math.isinf(value) and value < 0
+        
+        p2dns = dict()
+        pids = list(self.islands[island_idx]) + [program.id]
+
+        for pid_i in pids:
+            program_i = self.programs[pid_i]
+
+            if _is_negative_infinity(program_i.metrics["combined_score"]):
+                p2dns[pid_i] = float("-inf")
+                continue
+            
+            D_i = []
+            for pid_j in pids:
+                if pid_j != pid_i:
+                    program_j = self.programs[pid_j]
+                    if program_j.metrics["combined_score"] > program_i.metrics["combined_score"]:
+                        D_i.append(pid_j)
+
+            if len(D_i) > 0:
+                distances = []
+                for pid_j in D_i:
+                    program_j = self.programs[pid_j]
+                    distances.append(math.sqrt(sum((a - b) ** 2 for a, b in zip(program_i.embedding, program_j.embedding))))
+                dominated_novelty_score = np.mean(distances)
+            else:
+                dominated_novelty_score = float("+inf")    
+            p2dns[pid_i] = dominated_novelty_score
+
+        dns_median = np.median(list(p2dns.values()))
+        for pid_i in pids:
+            program_i = self.programs[pid_i] 
+            dominated_novelty_score = p2dns[pid_i]
+            if dominated_novelty_score < dns_median:
+                program_i.metrics["combined_score"] = float("-inf")
+
+        # Add to island
+        self.islands[island_idx].add(program.id)
+
+        # Track which island this program belongs to
+        program.metadata["island"] = island_idx
+
+        # Update archive
+        self._update_archive(program)
+
+        # Enforce population size limit BEFORE updating best program tracking
+        # This ensures newly added programs aren't immediately removed
+        self._enforce_population_limit(exclude_program_id=program.id)
+
+        # Update the absolute best program tracking (after population enforcement)
+        self._update_best_program(program)
+
+        # Update island-specific best program tracking
+        self._update_island_best_program(program, island_idx)
+
+        # Save to disk if configured
+        if self.config.db_path:
+            self._save_program(program)
+
+        logger.debug(f"Added program {program.id} to island {island_idx}")
+
+        return program.id
diff --git a/tests/test_dns_database.py b/tests/test_dns_database.py
new file mode 100644
index 0000000000..38a9537aaf
--- /dev/null
+++ b/tests/test_dns_database.py
@@ -0,0 +1,220 @@
+"""
+Tests for DNSProgramDatabase in openevolve.database
+"""
+
+import unittest
+import uuid
+from openevolve.config import Config
+from openevolve.database import Program, DNSProgramDatabase
+from tests.test_database import TestProgramDatabase
+
+
+class TestDNSProgramDatabase(TestProgramDatabase):
+    """Tests for program database"""
+
+    def setUp(self):
+        """Set up test database"""
+        config = Config()
+        config.database.in_memory = True
+        self.db = DNSProgramDatabase(config.database)
+
+    def test_multi_island_setup(self):
+        """Test database with multiple islands"""
+        # Create new database with multiple islands
+        config = Config()
+        config.database.in_memory = True
+        config.database.num_islands = 3
+        multi_db = DNSProgramDatabase(config.database)
+
+        self.assertEqual(len(multi_db.islands), 3)
+        self.assertEqual(len(multi_db.island_best_programs), 3)
+
+        # Add programs to specific islands
+        for i in range(3):
+            program = Program(
+                id=f"test_island_{i}",
+                code=f"def test_{i}(): pass",
+                language="python",
+                metrics={"score": 0.5 + i * 0.1},
+            )
+            multi_db.add(program, target_island=i)
+
+            # Verify assignment
+            self.assertIn(f"test_island_{i}", multi_db.islands[i])
+            self.assertEqual(program.metadata.get("island"), i)
+
+    def test_feature_map_operations(self):
+        pass
+
+    def test_migration_prevents_re_migration(self):
+        """Test that programs marked as migrants don't migrate again"""
+        # Create database with multiple islands
+        config = Config()
+        config.database.in_memory = True
+        config.database.num_islands = 3
+        config.database.migration_interval = 1  # Migrate every generation
+        multi_db = DNSProgramDatabase(config.database)
+
+        # Add programs to each island (avoid "migrant" in original IDs)
+        for i in range(3):
+            program = Program(
+                id=f"test_prog_{i}",
+                code=f"def test_{i}(): return {i}",
+                language="python",
+                metrics={"score": 0.5 + i * 0.1},
+            )
+            multi_db.add(program, target_island=i)
+
+        # Manually mark one as a migrant
+        migrant_program = multi_db.get("test_prog_0")
+        migrant_program.metadata["migrant"] = True
+
+        # Store original ID
+        original_id = migrant_program.id
+
+        # Count initial programs (no _migrant suffixes should exist)
+        initial_programs = set(multi_db.programs.keys())
+        initial_migrant_count = sum(1 for pid in initial_programs if "_migrant_" in pid)
+        self.assertEqual(initial_migrant_count, 0)  # Should be none with new implementation
+
+        # Run migration
+        multi_db.island_generations[0] = config.database.migration_interval
+        multi_db.island_generations[1] = config.database.migration_interval
+        multi_db.island_generations[2] = config.database.migration_interval
+        multi_db.migrate_programs()
+
+        # Check that the migrant program wasn't re-migrated
+        # It should still exist with the same ID
+        still_exists = multi_db.get(original_id)
+        self.assertIsNotNone(still_exists)
+
+        # With new implementation, no programs should have _migrant_ suffixes
+        new_programs = set(multi_db.programs.keys())
+        new_migrant_ids = [pid for pid in new_programs if "_migrant_" in pid]
+        self.assertEqual(len(new_migrant_ids), 0, "New implementation should not create _migrant suffix programs")
+
+    def test_empty_island_initialization_creates_copies(self):
+        """Test that empty islands are initialized with copies, not shared references"""
+        # Create database with multiple islands
+        config = Config()
+        config.database.in_memory = True
+        config.database.num_islands = 3
+        # Force exploration mode to test empty island handling
+        config.database.exploration_ratio = 1.0
+        config.database.exploitation_ratio = 0.0
+        multi_db = DNSProgramDatabase(config.database)
+
+        # Add a single program to island 1
+        program = Program(
+            id="original_program",
+            code="def original(): return 42",
+            language="python",
+            metrics={"score": 0.9, "combined_score": 0.9},
+        )
+        multi_db.add(program, target_island=1)
+
+        # Make it the best program
+        multi_db.best_program_id = "original_program"
+
+        # Switch to empty island 0 and sample
+        multi_db.set_current_island(0)
+        sampled_parent, _ = multi_db.sample()
+
+        # The sampled program should be a copy, not the original
+        self.assertNotEqual(sampled_parent.id, "original_program")
+        self.assertEqual(sampled_parent.code, program.code)  # Same code
+        self.assertEqual(sampled_parent.parent_id, "original_program")  # Parent is the original
+
+        # Check island membership
+        self.assertIn("original_program", multi_db.islands[1])
+        self.assertNotIn("original_program", multi_db.islands[0])
+        self.assertIn(sampled_parent.id, multi_db.islands[0])
+
+        # Run validation - should not raise any errors
+        multi_db._validate_migration_results()
+
+    def test_no_program_assigned_to_multiple_islands(self):
+        """Test that programs are never assigned to multiple islands"""
+        # Create database with multiple islands
+        config = Config()
+        config.database.in_memory = True
+        config.database.num_islands = 4
+        multi_db = DNSProgramDatabase(config.database)
+
+        # Add programs to different islands
+        program_ids = []
+        for i in range(4):
+            program = Program(
+                id=f"island_test_{i}",
+                code=f"def test_{i}(): return {i}",
+                language="python",
+                metrics={"score": 0.5 + i * 0.1, "combined_score": 0.5 + i * 0.1},
+            )
+            multi_db.add(program, target_island=i)
+            program_ids.append(program.id)
+
+        # Make the best program from island 3
+        multi_db.best_program_id = "island_test_3"
+
+        # Sample from empty islands - this should create copies
+        for empty_island in range(4):
+            if len(multi_db.islands[empty_island]) == 0:
+                multi_db.set_current_island(empty_island)
+                parent, _ = multi_db.sample()
+
+        # Check that no program ID appears in multiple islands
+        all_island_programs = {}
+        for island_idx, island_programs in enumerate(multi_db.islands):
+            for program_id in island_programs:
+                if program_id in all_island_programs:
+                    self.fail(
+                        f"Program {program_id} found in both island {all_island_programs[program_id]} "
+                        f"and island {island_idx}"
+                    )
+                all_island_programs[program_id] = island_idx
+
+        # Run validation - should not raise any errors
+        multi_db._validate_migration_results()
+
+    def test_migration_validation_passes(self):
+        """Test that migration validation passes after our fixes"""
+        # Create database with multiple islands
+        config = Config()
+        config.database.in_memory = True
+        config.database.num_islands = 3
+        config.database.migration_interval = 1
+        multi_db = DNSProgramDatabase(config.database)
+
+        # Add programs and run several migration cycles
+        for i in range(6):
+            program = Program(
+                id=f"test_program_{i}",
+                code=f"def test_{i}(): return {i * 2}",
+                language="python",
+                metrics={"score": 0.4 + i * 0.1, "combined_score": 0.4 + i * 0.1},
+            )
+            multi_db.add(program, target_island=i % 3)
+
+        # Run multiple migration cycles
+        for cycle in range(3):
+            # Increment generations to trigger migration
+            for island in range(3):
+                multi_db.island_generations[island] += 1
+
+            # Migrate programs
+            multi_db.migrate_programs()
+
+            # Validation should pass without warnings
+            multi_db._validate_migration_results()
+
+            # Verify no program has exponential ID growth
+            for program_id in multi_db.programs:
+                # Count occurrences of "migrant" in ID
+                migrant_count = program_id.count("migrant")
+                self.assertLessEqual(
+                    migrant_count, 1, f"Program ID {program_id} has been migrated multiple times"
+                )
+
+
+if __name__ == "__main__":
+    unittest.main()
diff --git a/tests/test_threshold_elites_database.py b/tests/test_threshold_elites_database.py
new file mode 100644
index 0000000000..32955c1d7a
--- /dev/null
+++ b/tests/test_threshold_elites_database.py
@@ -0,0 +1,220 @@
+"""
+Tests for ThresholdElitesProgramDatabase in openevolve.database
+"""
+
+import unittest
+import uuid
+from openevolve.config import Config
+from openevolve.database import Program, ThresholdElitesProgramDatabase
+from tests.test_database import TestProgramDatabase
+
+
+class TestThresholdElitesProgramDatabase(TestProgramDatabase):
+    """Tests for program database"""
+
+    def setUp(self):
+        """Set up test database"""
+        config = Config()
+        config.database.in_memory = True
+        self.db = ThresholdElitesProgramDatabase(config.database)
+
+    def test_multi_island_setup(self):
+        """Test database with multiple islands"""
+        # Create new database with multiple islands
+        config = Config()
+        config.database.in_memory = True
+        config.database.num_islands = 3
+        multi_db = ThresholdElitesProgramDatabase(config.database)
+
+        self.assertEqual(len(multi_db.islands), 3)
+        self.assertEqual(len(multi_db.island_best_programs), 3)
+
+        # Add programs to specific islands
+        for i in range(3):
+            program = Program(
+                id=f"test_island_{i}",
+                code=f"def test_{i}(): pass",
+                language="python",
+                metrics={"score": 0.5 + i * 0.1},
+            )
+            multi_db.add(program, target_island=i)
+
+            # Verify assignment
+            self.assertIn(f"test_island_{i}", multi_db.islands[i])
+            self.assertEqual(program.metadata.get("island"), i)
+
+    def test_feature_map_operations(self):
+        pass
+
+    def test_migration_prevents_re_migration(self):
+        """Test that programs marked as migrants don't migrate again"""
+        # Create database with multiple islands
+        config = Config()
+        config.database.in_memory = True
+        config.database.num_islands = 3
+        config.database.migration_interval = 1  # Migrate every generation
+        multi_db = ThresholdElitesProgramDatabase(config.database)
+
+        # Add programs to each island (avoid "migrant" in original IDs)
+        for i in range(3):
+            program = Program(
+                id=f"test_prog_{i}",
+                code=f"def test_{i}(): return {i}",
+                language="python",
+                metrics={"score": 0.5 + i * 0.1},
+            )
+            multi_db.add(program, target_island=i)
+
+        # Manually mark one as a migrant
+        migrant_program = multi_db.get("test_prog_0")
+        migrant_program.metadata["migrant"] = True
+
+        # Store original ID
+        original_id = migrant_program.id
+
+        # Count initial programs (no _migrant suffixes should exist)
+        initial_programs = set(multi_db.programs.keys())
+        initial_migrant_count = sum(1 for pid in initial_programs if "_migrant_" in pid)
+        self.assertEqual(initial_migrant_count, 0)  # Should be none with new implementation
+
+        # Run migration
+        multi_db.island_generations[0] = config.database.migration_interval
+        multi_db.island_generations[1] = config.database.migration_interval
+        multi_db.island_generations[2] = config.database.migration_interval
+        multi_db.migrate_programs()
+
+        # Check that the migrant program wasn't re-migrated
+        # It should still exist with the same ID
+        still_exists = multi_db.get(original_id)
+        self.assertIsNotNone(still_exists)
+
+        # With new implementation, no programs should have _migrant_ suffixes
+        new_programs = set(multi_db.programs.keys())
+        new_migrant_ids = [pid for pid in new_programs if "_migrant_" in pid]
+        self.assertEqual(len(new_migrant_ids), 0, "New implementation should not create _migrant suffix programs")
+
+    def test_empty_island_initialization_creates_copies(self):
+        """Test that empty islands are initialized with copies, not shared references"""
+        # Create database with multiple islands
+        config = Config()
+        config.database.in_memory = True
+        config.database.num_islands = 3
+        # Force exploration mode to test empty island handling
+        config.database.exploration_ratio = 1.0
+        config.database.exploitation_ratio = 0.0
+        multi_db = ThresholdElitesProgramDatabase(config.database)
+
+        # Add a single program to island 1
+        program = Program(
+            id="original_program",
+            code="def original(): return 42",
+            language="python",
+            metrics={"score": 0.9, "combined_score": 0.9},
+        )
+        multi_db.add(program, target_island=1)
+
+        # Make it the best program
+        multi_db.best_program_id = "original_program"
+
+        # Switch to empty island 0 and sample
+        multi_db.set_current_island(0)
+        sampled_parent, _ = multi_db.sample()
+
+        # The sampled program should be a copy, not the original
+        self.assertNotEqual(sampled_parent.id, "original_program")
+        self.assertEqual(sampled_parent.code, program.code)  # Same code
+        self.assertEqual(sampled_parent.parent_id, "original_program")  # Parent is the original
+
+        # Check island membership
+        self.assertIn("original_program", multi_db.islands[1])
+        self.assertNotIn("original_program", multi_db.islands[0])
+        self.assertIn(sampled_parent.id, multi_db.islands[0])
+
+        # Run validation - should not raise any errors
+        multi_db._validate_migration_results()
+
+    def test_no_program_assigned_to_multiple_islands(self):
+        """Test that programs are never assigned to multiple islands"""
+        # Create database with multiple islands
+        config = Config()
+        config.database.in_memory = True
+        config.database.num_islands = 4
+        multi_db = ThresholdElitesProgramDatabase(config.database)
+
+        # Add programs to different islands
+        program_ids = []
+        for i in range(4):
+            program = Program(
+                id=f"island_test_{i}",
+                code=f"def test_{i}(): return {i}",
+                language="python",
+                metrics={"score": 0.5 + i * 0.1, "combined_score": 0.5 + i * 0.1},
+            )
+            multi_db.add(program, target_island=i)
+            program_ids.append(program.id)
+
+        # Make the best program from island 3
+        multi_db.best_program_id = "island_test_3"
+
+        # Sample from empty islands - this should create copies
+        for empty_island in range(4):
+            if len(multi_db.islands[empty_island]) == 0:
+                multi_db.set_current_island(empty_island)
+                parent, _ = multi_db.sample()
+
+        # Check that no program ID appears in multiple islands
+        all_island_programs = {}
+        for island_idx, island_programs in enumerate(multi_db.islands):
+            for program_id in island_programs:
+                if program_id in all_island_programs:
+                    self.fail(
+                        f"Program {program_id} found in both island {all_island_programs[program_id]} "
+                        f"and island {island_idx}"
+                    )
+                all_island_programs[program_id] = island_idx
+
+        # Run validation - should not raise any errors
+        multi_db._validate_migration_results()
+
+    def test_migration_validation_passes(self):
+        """Test that migration validation passes after our fixes"""
+        # Create database with multiple islands
+        config = Config()
+        config.database.in_memory = True
+        config.database.num_islands = 3
+        config.database.migration_interval = 1
+        multi_db = ThresholdElitesProgramDatabase(config.database)
+
+        # Add programs and run several migration cycles
+        for i in range(6):
+            program = Program(
+                id=f"test_program_{i}",
+                code=f"def test_{i}(): return {i * 2}",
+                language="python",
+                metrics={"score": 0.4 + i * 0.1, "combined_score": 0.4 + i * 0.1},
+            )
+            multi_db.add(program, target_island=i % 3)
+
+        # Run multiple migration cycles
+        for cycle in range(3):
+            # Increment generations to trigger migration
+            for island in range(3):
+                multi_db.island_generations[island] += 1
+
+            # Migrate programs
+            multi_db.migrate_programs()
+
+            # Validation should pass without warnings
+            multi_db._validate_migration_results()
+
+            # Verify no program has exponential ID growth
+            for program_id in multi_db.programs:
+                # Count occurrences of "migrant" in ID
+                migrant_count = program_id.count("migrant")
+                self.assertLessEqual(
+                    migrant_count, 1, f"Program ID {program_id} has been migrated multiple times"
+                )
+
+
+if __name__ == "__main__":
+    unittest.main()