DOCE

This repo is for code in our arxived paper:

DOCE: Finding the Sweet Spot for Execution-Based Code Generation
Haau-Sing Li, Patrick Fernandes, Iryna Gurevych, André F. T. Martins

Contact person: Haau-Sing Li

Usage

Installing packages from requirements*.txt.
Inference on HumanEval/MBPP task

python3 codegen/generate.py \
    --model ${model} \
    --bs ${batch_size} \
    --temperature ${temperature} \
    --n_samples ${num_of_samples_for_reranking} \
    --dataset ${humaneval/mbpp} \
    --resume \
    --root ${path_to_store_output}

Evaluation

evalplus.evaluate \
    --dataset {humaneval/mbpp} \
    --samples ${path to generated samples} \
    --parallel 30 \
    --test-details

Get execution outputs of generated samples (for MBR-Exec)

python3 evalplus/gen_outputs.py \
    --gen_dir {model_name_plus_temperature} \
    --dataset {humaneval/mbpp} \
    --gen_fast

Self-Debugging You should get execution feedback first:

python3 evalplus/error_feedback.py \
    --gen_dir {model_name_plus_temperature} \
    --dataset {humaneval/mbpp}

Then we can do self-debugging:

python3 codegen/ape_sd_ut.py \
    --model ${model} \
    --bs ${batch_size} \
    --temperature ${temperature} \
    --n_samples ${num_of_samples_for_reranking} \
    --dataset ${humaneval/mbpp} \
    --resume \
    --root ${path_to_store_output}
    --debugging_turn ${ith_debugging_turn}

For MBR and N-Best-Reranking, please refer to our notebooks for now.

We will release our generated candidates soon if you want to save compute.

Our code is built upon EvalPlus.

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
codegen		codegen
evalplus		evalplus
figs		figs
gallary		gallary
notebooks		notebooks
other_data		other_data
tests		tests
tools		tools
CITATION.cff		CITATION.cff
Dockerfile		Dockerfile
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
README.md		README.md
evo.sh		evo.sh
pyproject.toml		pyproject.toml
requirements-llm.txt		requirements-llm.txt
requirements-tools.txt		requirements-tools.txt
requirements-tsr.txt		requirements-tsr.txt
requirements.txt		requirements.txt
setup.cfg		setup.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DOCE

Usage

About

Releases

Packages

Languages

License

deep-spin/doce

Folders and files

Latest commit

History

Repository files navigation

DOCE

Usage

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages