分别用Bigram和Trigram模型计算句子“我们一起去看电影”的概率,写出计算过程,其中语料库如下:S1:小红和小明今天去看电影了。S2:我们一起去图书馆吧。S3:他看了一本很有趣的书。S4:你要去看电影吗?
时间: 2023-05-31 20:02:10 浏览: 117
使用Bigram模型计算句子“我们一起去看电影”的概率:
P(我们一起去看电影) = P(我们) * P(一起|我们) * P(去|一起) * P(看|去) * P(电影|看)
从语料库中可知:
- P(我们) = 0,在语料库中不存在
- P(一起|我们) = 0,在语料库中不存在
- P(去|一起) = 0,在语料库中不存在
- P(看|去) = 1/3,在S1中,有3个bigram包含"去看",其中包含"看"的有1个
- P(电影|看) = 1/4,在S1中,有4个bigram包含"看电影",其中包含"电影"的有1个
因此,P(我们一起去看电影) = 0。
使用Trigram模型计算句子“我们一起去看电影”的概率:
P(我们一起去看电影) = P(我们|<s>,<s>) * P(一起|<s>,我们) * P(去|我们,一起) * P(看|一起,去) * P(电影|去,看) * P(</s>|看,电影)
从语料库中可知:
- P(我们|<s>,<s>) = 1/4,在S2中,有4个trigram以"我们"开头,其中1个以"<s>,<s>"开头
- P(一起|<s>,我们) = 0,在语料库中不存在
- P(去|我们,一起) = 0,在语料库中不存在
- P(看|一起,去) = 1,在S1中,有1个trigram为"一起去看"
- P(电影|去,看) = 1,在S1中,有1个trigram为"去看电影"
- P(</s>|看,电影) = 1,在语料库中不存在以"看电影"结尾的trigram
因此,P(我们一起去看电影) = 0。
由于语料库中没有“我们一起去看电影”这一序列,因此使用Bigram和Trigram模型计算均为0。