Consider the 4-queen problem with the initial configuration below. The features and evaluation function is defined similarly as in Exercise3. Perform probabilistic iterative improvement for one iteration. Calculate the expected loss value of the successor. Consider the following cases: 𝛽 = 𝑙𝑛2, 𝛽 = 𝑙𝑛4。每个皇后坐在的位置分别是(1,1),(2,2),(3,3),(4,4)。
时间: 2024-03-14 22:44:14 浏览: 341
tomcat异常解决(Invalid character found in the request target. The valid characters are defined in RFC 7230 and RFC 3986)
5星 · 资源好评率100%
根据题意,我们需要对初始状态进行概率性迭代改进一次,并计算后继状态的期望损失值。我们先来看一下初始状态和它的评估值:
```
Q 0 0 0
0 0 0 Q
0 Q 0 0
0 0 Q 0
评估值:-3
```
接下来,我们随机选择一个皇后,并将其移动至能够使得评估值最小的位置。此处我们以第一行的皇后为例:
```
Q 0 0 0
0 0 0 Q
0 Q 0 0
0 0 Q 0
评估值:-3
在第一行中,将皇后移动至第二列会使得评估值变为-2,移动至第三列会使得评估值变为-1,移动至第四列会使得评估值变为-2。因此,我们根据模拟退火的策略,以一定概率移动至评估值更小的位置。假设我们以以下概率选择位置:
- 移动至第二列:0.1
- 移动至第三列:0.6
- 移动至第四列:0.3
那么,我们以这些概率来随机选择移动的位置,得到了一个后继状态:
```
0 Q 0 0
0 0 0 Q
0 Q 0 0
0 0 Q 0
评估值:-1
```
接下来,我们计算后继状态的期望损失值,分别考虑 $\beta=\ln2$ 和 $\beta=\ln4$ 的情况。设当前状态为 $s$,后继状态为 $s'$,则期望损失值为:
$$
\begin{aligned}
\Delta E(s,s') &= E(s') - E(s) \\
&= \frac{1}{1+e^{\beta(E(s')-E(s))}} - 1 \\
&= \frac{1}{1+e^{\beta(-2)}} \times 0.1 + \frac{1}{1+e^{\beta(-1)}} \times 0.6 + \frac{1}{1+e^{\beta(-2)}} \times 0.3 - 1 \\
\end{aligned}
$$
当 $\beta=\ln2$ 时,$\Delta E(s,s')=0.063$;当 $\beta=\ln4$ 时,$\Delta E(s,s')=0.032$。因此,期望损失值较小的移动较为可能被接受。
阅读全文