Consider the 4-queen problem with the initial configuration below. The features and evaluation function is defined similarly as in Exercise3. Perform probabilistic iterative improvement for one iteration. Calculate the expected loss value of the successor. Consider the following cases: 𝛽 = 𝑙𝑛2, 𝛽 = 𝑙𝑛4。每个皇后坐在的位置分别是(1,1),(2,2),(3,3),(4,4)。用中文详细的回答这道题
时间: 2024-04-21 22:28:51 浏览: 142
这道题考虑了一个初始状态为四皇后问题的情况,其中四个皇后分别位于第一行的第一列、第二行的第二列、第三行的第三列、第四行的第四列。我们需要对这个初始状态进行概率性迭代改进一次,并计算得到后继状态的期望损失值。在这个问题中,损失函数的计算方式和Exercise3相同,即用负皇后数表示状态的优劣。
首先,我们对初始状态进行评估,得到评估值为-3。接下来,我们随机选择一个皇后,并将其移动至能够使得评估值最小的位置。这里我们以第一行的皇后为例,分别计算将皇后移动至第二、三、四列时,状态的评估值分别为-2、-1、-2。根据模拟退火的策略,我们以一定概率选择评估值更小的位置进行移动。假设我们以以下概率选择位置:
- 移动至第二列的概率为0.1
- 移动至第三列的概率为0.6
- 移动至第四列的概率为0.3
则我们随机选择移动的位置,并得到一个后继状态,其评估值为-1。
接下来,我们需要计算后继状态的期望损失值,考虑两种情况:$\beta=\ln2$ 和 $\beta=\ln4$。设当前状态为 $s$,后继状态为 $s'$,则期望损失值为:
$$
\begin{aligned}
\Delta E(s,s') &= E(s') - E(s) \\
&= \frac{1}{1+e^{\beta(E(s')-E(s))}} - 1 \\
&= \frac{1}{1+e^{\beta(-2)}} \times 0.1 + \frac{1}{1+e^{\beta(-1)}} \times 0.6 + \frac{1}{1+e^{\beta(-2)}} \times 0.3 - 1 \\
\end{aligned}
$$
当 $\beta=\ln2$ 时,$\Delta E(s,s')=0.063$;当 $\beta=\ln4$ 时,$\Delta E(s,s')=0.032$。因此,期望损失值较小的移动较为可能被接受。
阅读全文