2010年Web数据挖掘研究综述:内容、结构与使用

需积分: 10 3 下载量 197 浏览量 更新于2024-09-17 收藏 176KB PDF 举报
"2010年发表的《Web Data Mining Research: A Survey》是一篇深度探讨Web数据挖掘领域的研究综述论文。作者Brijendra Singh和Hemant Kumar Singh来自印度的卢克诺大学计算机科学系以及Azad IET的计算机应用系,他们的电子邮件地址分别为drbri_singh@hotmail.com和hemantbib@gmail.com。 该论文指出,Web数据挖掘是数据挖掘的重要分支,主要关注从万维网中提取有价值的知识。它被划分为三个核心类型:Web内容挖掘、Web结构挖掘和Web使用模式挖掘。论文的目标是回顾过去的研究成果,评估当前状态,并展望这三个方面的未来发展趋势。 首先,内容部分介绍了Web内容挖掘,即从网页文本、图像、音频等多媒体数据中发现隐藏的信息;Web结构挖掘则聚焦于分析网页链接结构,揭示网络的组织和关联;而Web使用模式挖掘则涉及用户行为和交互模式的挖掘,帮助理解用户需求和行为趋势。 论文还对比和总结了各种Web数据挖掘方法的应用实例,为读者提供了研究进展的概览,同时指出了一些重要的研究议题。这些议题可能包括提高数据处理效率,处理大规模、异构的Web数据,开发更为智能的搜索引擎,以及在语义Web背景下实现更深层次的知识发现。 随着计算机存储和数据库中的数据量以惊人的速度增长,Web数据挖掘的重要性与日俱增。它不仅应用于商业决策、个性化推荐、广告定向等领域,还在学术研究中扮演着关键角色,推动了大数据分析和人工智能技术的发展。 《Web Data Mining Research: A Survey》为读者提供了一个全面的框架,帮助他们理解和把握Web数据挖掘领域的前沿动态,以及如何在这个快速变化的领域中寻找新的研究机遇。"