物联网海量非结构化数据深度挖掘算法优化研究

0 下载量 72 浏览量 更新于2024-08-29 收藏 1.51MB PDF 举报
"本文主要探讨了海量非结构化物联网数据深度挖掘算法的研究,针对传统数据挖掘算法在处理大规模物联网数据时的不足,提出了新的解决策略。通过对物联网数据进行CR运算来构建模糊系统,并利用T-S神经网络进行数据的输入与输出描述。接着,通过模糊系统逻辑构建物联网数据的粗糙集,进一步进行属性约减,以提高数据挖掘的效率和准确性。实验结果显示,采用本文提出的算法,物联网数据XML文档的簇密度值显著增大,表明数据之间的边界更加清晰,数据挖掘效果得到显著提升。" 文章指出,物联网时代,各种功能不同的数据采集设备生成了大量的非结构化数据,这些数据的不确定性与异质性增加了数据协同交互的复杂性,导致数据孤岛现象。现有的数据挖掘方法,如神经网络和遗传算法,虽然在某些方面有应用,但在处理海量非结构化物联网数据时仍存在局限。 文献[3]提出了一种基于物联网数据采集模型和海量数据挖掘最优控制算法的方法,尽管能够挖掘物联网数据的关联度,但对非结构化数据的处理并不充分。而文献[4]构建的大数据系统模型则通过数据特征提取和关联因子排序来挖掘数据,然而对挖掘深度的研究不够深入。 针对这些问题,本文的研究重点在于深度挖掘海量非结构化物联网数据。首先,利用CR运算构建模糊系统,这有助于处理数据的不确定性和复杂性。然后,通过T-S神经网络样本建立神经网络模型,为物联网数据的输入和输出提供有效的描述。接下来,借助模糊系统逻辑,构建了物联网数据的粗糙集,这有助于识别和减少冗余信息。最后,通过对粗糙集进行属性约减,可以更高效地挖掘数据的关键特征。 实验结果显示,使用本文提出的算法进行数据挖掘,生成的物联网数据XML文档的簇密度值增加,这意味着数据的聚类效果更佳,数据间的边界定义更明确,从而提升了数据挖掘的性能和价值。这种方法对于应对物联网数据的挑战,提高数据利用率,以及满足复杂场景下的深度挖掘需求具有重要的实践意义。 本文提出的深度挖掘算法为处理物联网中的海量非结构化数据提供了一种新思路,不仅提高了数据挖掘的效率,还增强了数据的可解释性和实用性,为后续的研究和应用提供了理论基础和技术支持。