run_discovery - SkyDiscover

Function Signature

def run_discovery(
    evaluator: Union[str, Path, Callable],
    initial_program: Optional[Union[str, Path, List[str]]] = None,
    model: Optional[str] = None,
    iterations: Optional[int] = None,
    search: Optional[str] = None,
    config: Union[str, Path, Config, None] = None,
    agentic: bool = False,
    output_dir: Optional[str] = None,
    system_prompt: Optional[str] = None,
    api_base: Optional[str] = None,
    cleanup: bool = True,
) -> DiscoveryResult

Description

The main entry point for running a discovery process. This function accepts file paths or inline strings for the initial program and evaluator, wires up configuration, and returns a DiscoveryResult containing the best solution found.

Parameters

evaluator

Union[str, Path, Callable]

required

File path or callable function (program_path) -> metrics_dict that evaluates program performance.

File path: Path to a Python script that defines an evaluate() function
Callable: Python function that accepts a program path and returns a metrics dictionary

initial_program

Optional[Union[str, Path, List[str]]]

Starting solution for the discovery process. Can be:

File path: Path to a file containing the initial program
Inline string: Source code as a string
List of strings: Source code split into lines
None: LLM generates a solution from scratch

Default: None

model

Optional[str]

Model name(s), comma-separated. Overrides config file settings.Examples:

"gpt-5"
"gpt-5,gemini/gemini-3-pro"

Default: None (uses config file)

iterations

Optional[int]

Maximum number of iterations to run. Overrides config.max_iterations.Default: None (uses config file)

Optional[str]

Search algorithm name. Overrides config file settings.Native algorithms:

"adaevolve" - Adaptive multi-island evolutionary search
"evox" - Self-evolving optimization
"topk" - Top-K selection
"beam_search" - Beam search with diversity
"best_of_n" - Generate N variants per iteration
"openevolve_native" - MAP-Elites + island-based search
"gepa_native" - Pareto-efficient search with reflective prompting

External backends (require --extra external):

"openevolve" - OpenEvolve backend
"gepa" - GEPA backend
"shinkaevolve" - ShinkaEvolve backend

Default: None (uses config file)

config

Union[str, Path, Config, None]

Configuration for the discovery process.

YAML path: Path to a YAML configuration file
Config object: Pre-built Config instance
None: Use default configuration

Default: None

agentic

bool

Enable agentic mode. The codebase root is automatically derived from initial_program.Default: False

output_dir

Optional[str]

Directory where results, logs, and checkpoints are written. If None, a temporary directory is created.Default: None

system_prompt

Optional[str]

Domain-specific context provided to the LLM for better solution generation.Default: None

api_base

Optional[str]

Base URL for an OpenAI-compatible API endpoint.Default: None

cleanup

bool

Remove temporary files after the run completes.Default: True

Returns

DiscoveryResult

Result object containing:

Show DiscoveryResult fields

best_program

Optional[Program]

The best program found during discovery

best_score

float

Score of the best program

best_solution

str

Source code of the best solution

metrics

Dict[str, Any]

Detailed metrics from the evaluator

output_dir

Optional[str]

Directory containing results (None if cleanup=True)

initial_score

Optional[float]

Score of the initial program (if provided)

Examples

Basic Usage with File Paths

from skydiscover import run_discovery

result = run_discovery(
    evaluator="examples/my_problem/eval.py",
    initial_program="examples/my_problem/init.py",
    model="gpt-5",
    iterations=50,
)

print(f"Best score: {result.best_score}")
print(f"Best solution:\n{result.best_solution}")

Using a Callable Evaluator

from skydiscover import run_discovery

def my_evaluator(program_path: str) -> dict:
    """Custom evaluator function."""
    import subprocess
    import json
    
    # Run the program
    output = subprocess.run(
        ["python", program_path],
        capture_output=True,
        text=True,
        timeout=10
    )
    
    # Parse results
    metrics = json.loads(output.stdout)
    return metrics

result = run_discovery(
    evaluator=my_evaluator,
    model="gpt-5",
    iterations=100,
)

Inline String Program

from skydiscover import run_discovery

initial_code = '''
def solve(n: int) -> int:
    """Initial solution."""
    return n * 2
'''

result = run_discovery(
    evaluator="eval.py",
    initial_program=initial_code,
    model="gpt-5",
    iterations=50,
)

Starting from Scratch (No Initial Program)

from skydiscover import run_discovery

result = run_discovery(
    evaluator="eval.py",
    initial_program=None,  # LLM generates from scratch
    model="gpt-5",
    iterations=100,
    system_prompt="Create a sorting algorithm optimized for small arrays",
)

Using Custom Configuration

from skydiscover import run_discovery
from skydiscover.config import Config

# Load and customize config
config = Config.from_yaml("config.yaml")
config.max_iterations = 200
config.llm.temperature = 0.8

result = run_discovery(
    evaluator="eval.py",
    initial_program="init.py",
    config=config,
    output_dir="./results",
    cleanup=False,  # Keep results
)

print(f"Results saved to: {result.output_dir}")

Multiple Models

from skydiscover import run_discovery

result = run_discovery(
    evaluator="eval.py",
    initial_program="init.py",
    model="gpt-5,gemini/gemini-3-pro,claude-4-sonnet",
    iterations=50,
)

Agentic Mode

from skydiscover import run_discovery

result = run_discovery(
    evaluator="examples/app/eval.py",
    initial_program="examples/app/main.py",
    model="gpt-5",
    iterations=50,
    agentic=True,  # Enables codebase awareness
)

Error Handling

Missing Model Configuration

from skydiscover import run_discovery

try:
    result = run_discovery(
        evaluator="eval.py",
        # No model specified and no config file
    )
except ValueError as e:
    print(f"Error: {e}")
    # Error: No LLM models configured. Provide a config with models or
    # pass model= directly:
    #
    #   result = run_discovery(evaluator, model='gpt-5')

Missing External Package

from skydiscover import run_discovery

try:
    result = run_discovery(
        evaluator="eval.py",
        model="gpt-5",
        search="openevolve_native",
    )
except ImportError as e:
    print(f"Error: {e}")
    # Error: Search type 'openevolve_native' requires the 'openevolve' package.
    # Install with: pip install openevolve

Invalid Evaluator

from skydiscover import run_discovery

try:
    result = run_discovery(
        evaluator="nonexistent.py",
        model="gpt-5",
    )
except FileNotFoundError as e:
    print(f"Error: {e}")
    # Error: Evaluator file not found: nonexistent.py

Notes

The function runs asynchronously internally but presents a synchronous interface
Results are automatically checkpointed during the run
Use cleanup=False to preserve temporary files and intermediate results
The output_dir will contain:
- best/ - Best program found
- checkpoints/ - Periodic checkpoints
- logs/ - Execution logs
Initial program is optional; the LLM can generate solutions from scratch with a good system_prompt

​Function Signature

​Description

​Parameters

​Returns

​Examples

​Basic Usage with File Paths

​Using a Callable Evaluator

​Inline String Program

​Starting from Scratch (No Initial Program)

​Using Custom Configuration

​Multiple Models

​Agentic Mode

​Error Handling

​Missing Model Configuration

​Missing External Package

​Invalid Evaluator

​Notes

​See Also

Function Signature

Description

Parameters

Returns

Examples

Basic Usage with File Paths

Using a Callable Evaluator

Inline String Program

Starting from Scratch (No Initial Program)

Using Custom Configuration

Multiple Models

Agentic Mode

Error Handling

Missing Model Configuration

Missing External Package

Invalid Evaluator

Notes

See Also