云计算环境下的大数据均匀分布不确定关联规则变粒度查询
188 浏览量
更新于2024-08-27
收藏 2.95MB PDF 举报
"均匀分布下不确定数据的关联规则变粒度查询"
在大数据时代,云计算作为基础设施,为数据的存储、处理和分析提供了强大的支持。关联规则挖掘是数据分析中的一个重要环节,它能揭示数据间的隐藏模式,帮助用户理解数据集中的关联性。然而,由于隐私保护的需要,大数据中常常包含人为引入的不确定因素。这些不确定数据可能是通过精确数据的泛化处理形成的,具有均匀分布的特性。虽然这种特性降低了精确查询的效率,但它为关联规则挖掘结果的变粒度查询提供了可能。
均匀分布不确定数据关联规则的挖掘过程中,作者提出了UFI-DM算法。这个算法能够处理具有均匀分布不确定性的数据,生成关联规则库。为了提升查询效率,研究者进一步利用Hilbert packed R树索引来加速对泛化标识符和敏感属性的查询。R树是一种多维空间数据的索引结构,而Hilbert packing则优化了R树的空间利用率,使得在大数据环境下的查询更加高效。
在构建了关联规则库和索引后,文章提出了泛化值粒度转换方法。这种方法允许用户根据需求调整查询的粒度,从而获取不同级别的详细程度的挖掘结果。同时,配合提出的U-ARS查询算法,用户能够方便地进行变粒度查询,即在保持查询结果相关性的前提下,改变查询的精度,以满足不同场景下的信息需求。
理论分析和实验对比验证了该方法的有效性和可行性。通过这种方式,用户可以对不确定数据的关联规则挖掘结果进行透明化的查询,解决了大数据挖掘结果查询中的隐私问题,同时保证了查询效率和结果的灵活性。
这篇研究工作主要贡献在于提供了一种在均匀分布不确定数据上的关联规则变粒度查询方案,包括UFI-DM算法、泛化值粒度转换方法和U-ARS查询算法,这些方法对于处理大数据环境中的隐私保护和查询效率问题具有重要的实践意义。
2022-06-17 上传
2022-07-13 上传
2022-07-13 上传
2021-10-24 上传
2021-11-13 上传
2022-11-07 上传
2022-11-07 上传
2024-05-28 上传
点击了解资源详情
weixin_38736721
- 粉丝: 3
- 资源: 930
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍