Web文本褒贬倾向性分类技术探析

2星需积分: 4 160 浏览量更新于2024-11-02 收藏 120KB DOC 举报

“Web文本褒贬倾向性分类研究探讨了网页内容情感分析的复杂性，以及如何运用技术手段进行褒贬分类。文章结合特征选择和情感特征提取，利用多种分类算法在名人网页上进行了实践，取得了良好的分类效果。” 在这篇文章中，作者主要关注的是Web文本的褒贬倾向性分类，这是一个在信息处理和自然语言处理领域中的重要课题。随着互联网的快速发展，大量信息以文本形式存在于Web上，如何快速准确地理解这些文本的情感倾向，对于信息管理和决策支持具有重大意义。首先，文章讨论了网页内容的褒贬色彩具有一定的客观性，这意味着文本的情感倾向并非完全主观，可以通过一定的方式进行量化和分析。这为Web文本的倾向性分类提供了理论基础。接着，作者介绍了Web文本褒贬倾向性分类的基本原理，包括如何从文本中识别出具有情感倾向的关键词和短语，以及如何构建一个有效的分类模型。文章特别强调了特征选择和褒贬特征提取在分类过程中的作用。特征选择是挑选出对分类最有贡献的特征，有助于减少噪声数据和提高分类效率。而褒贬特征提取则是从文本中抽取出能反映情感倾向的特征，如情感词、否定词、程度副词等。这两种技术的结合能够更精准地捕捉文本的情感色彩。在实践中，作者采用了几种不同的分类算法，如朴素贝叶斯、支持向量机（VSM，可能是指Vector Space Model）、决策树等，对一些知名人物的网页进行了分类实验。通过这些算法的应用，他们能够在大量网页数据中有效地辨别出文本的正面或负面倾向，从而验证了所提出方法的有效性。此外，文章还提到了英文文本自动分类的发展，例如 Reuters 数据集的建立和标准分类语料库的使用，这些都为文本分类研究提供了基准和评估标准。尽管英文文本分类已经取得了显著成果，但中文文本的分类仍然面临诸多挑战，如词汇多义性、情感词资源的缺乏等，这也是未来研究的一个重要方向。 “Web文本褒贬倾向性分类研究”这篇文章为理解和实施Web文本情感分析提供了一种系统的方法，对于提升信息检索效率和改善用户交互体验具有实际应用价值。同时，它也为后续研究者在这个领域的深入探索奠定了基础。

Web 文本褒贬倾向性分类研究

柴玉梅熊德兰昝红英

（郑州大学信息工程学院，郑州 450052）

摘要：本文分析了网页内容褒贬色彩的客观性和褒贬倾向性分类的可行性，

介绍了 Web 文本褒贬倾向性分类的原理和实现方法，并将已有的特征选择方法

与褒贬特征提取技术结合起来，使用几种分类算法实现了名人网页的褒贬倾向

性分类，达到了较好的分类效果。

关键字：褒贬倾向性分类；VSM；褒贬特征提取；分类方法

中图分类号：TP391

Research on Web Text Appraisive Classification

Chai YuMei Xiong DeLan Zan HongYing

The College of Information Engineering, Zhengzhou University,Zhengzhou,

Henan,450052

Abstract: This paper analyzed the objectivity of appraisal of content in Webpages and

feasibility of appraisive classification, and introduced theory and implement method

of Web text appraisive classification. Combined existing technique of feature

selecting with the method of appraisive feature extracting, the thesis implemented

appraisive classification in some celebrities’ Webpages by several classification

algorithm, and achieved preferable effects.

Keyword: Appraisive Classification; VSM; Appraisive Feature Extraceting;

Classification Algorithms

一、引言

Web 文本自动分类是 Web 数据挖掘的研究热点之一它能有效地组织和管理

Web 资源、提高信息检索效率。网页自动分类可以使用文本分类的相关方法。

目前，英文文本自动分类已经取得了很好的成绩，提出了多种分类算法，还建

立的 Reuters 等标准的分类语料和统计的评价方法

[1]

。文献[2][3]分别介绍了使用

基金项目:国家 973 资助项目(2004CB 318102); 河南省自然科学基金项目(0211020110)

作者简介:柴玉梅（），女，副教授，研究方向；熊德兰（1980-），女，研究生；昝红英（），女

下载后可阅读完整内容，剩余9页未读，立即下载

Speed_Z

粉丝: 11
资源: 2

Web文本褒贬倾向性分类技术探析

中文文本倾向性分析方法及其应用

情感描述项与互信息计算在文本倾向性识别中的应用

神经网络在文本情感分析中确定褒贬分界点的新方法

论文研究-文本褒贬倾向判别研究.pdf

基于HowNet的句子褒贬倾向性研究

论文研究-基于HowNet的句子褒贬倾向性研究.pdf

论文研究-改进的基于知网词汇语义褒贬倾向性计算.pdf

中文网络评论观点词汇语义褒贬倾向性判断 (2012年)

情感倾11向性 情感词置信度 TSVM 文本分类 多层次分 类 褒贬分类.docx

基于汉语情感词表的句子情感倾向分类研究1

最新资源

情感倾11向性情感词置信度 TSVM 文本分类多层次分类褒贬分类.docx