用蒙特卡罗评价分支限界算法

用蒙特卡罗评估分支限界算法
我们常用蒙特卡罗方法评估一个回溯算法,但用来评估分支限界算法的时候我遇到一个问题;

分支限界算法的剪枝需要用到当前的最优值;而蒙特卡罗方法测试时模拟算法的选择过程,随机选择一条路,因此就没有所谓的“当前最优值”,也就无法用剪枝,从而就无法评估这个算法的优劣~

不知我的理解是否正确?谢谢指点~

------解决方案--------------------
所谓当前最优,一定得递归到最后一级才能求出一个结果,因此蒙特卡罗只要递归到最后一级,同样也存在一个当前最优。
------解决方案--------------------
蒙特卡罗只是一个随机算法, 不一定能求到最优解的.

在当前节点, 假设有n个选择, 那么对每个选择, 都随机尝试m条达到终点的路径, 求这m条路径的平均评价.
最后选择平均评价最后的那个选择作为当前选择.