22/3/9 3
文本挖掘的背景
文本挖掘的背景
传统的自然语言理解是对文本进行较低层次的理解,主
传统的自然语言理解是对文本进行较低层次的理解,主
要进行基于词、语法和语义信息的分析,并通过词在句
要进行基于词、语法和语义信息的分析,并通过词在句
子中出现的次序发现有意义的信息。
子中出现的次序发现有意义的信息。
文本高层次理解的对象可以是仅包含简单句子的单个文
文本高层次理解的对象可以是仅包含简单句子的单个文
本也可以是多个文本组成的文本集,但是现有的技术手
本也可以是多个文本组成的文本集,但是现有的技术手
段虽然基本上解决了单个句子的分析问题,但是还很难
段虽然基本上解决了单个句子的分析问题,但是还很难
覆盖所有的语言现象,特别是对整个段落或篇章的理解
覆盖所有的语言现象,特别是对整个段落或篇章的理解
还无从下手。
还无从下手。
将数据挖掘的成果用于分析以自然语言描述的文本,这
将数据挖掘的成果用于分析以自然语言描述的文本,这
种方法被称为文本挖掘
种方法被称为文本挖掘
(Text Mining)
(Text Mining)
或文本知识发现
或文本知识发现
(Kn
(Kn
owledge Discovery in Text).
owledge Discovery in Text).
评论1