Magentless没有公开regression_test和reproduction_test的实现。
regression_test对应的是未实现的run_instance_in_remote,reproduction_test则是没有对multi-lang进行兼容。
这是否意味着,基于Magentless的论文指标是不考虑regression_test和reproduction_test的情况下进行评测的?
如果是的话,这种情况下生成多个编辑位置和多个补丁似乎没有任何提升效果,使用的还是pass@1指标吗?
Magentless没有公开regression_test和reproduction_test的实现。
regression_test对应的是未实现的run_instance_in_remote,reproduction_test则是没有对multi-lang进行兼容。
这是否意味着,基于Magentless的论文指标是不考虑regression_test和reproduction_test的情况下进行评测的?
如果是的话,这种情况下生成多个编辑位置和多个补丁似乎没有任何提升效果,使用的还是pass@1指标吗?