数据挖掘词汇解析:从1R到贝叶斯定理
版权申诉
141 浏览量
更新于2024-06-28
收藏 400KB PDF 举报
"这份PDF文件提供了Data Mining领域中常见的中英文词汇表,涵盖了从基础概念到高级技术的各种术语。"
在Data Mining(数据挖掘)领域,这些词汇是理解和实践的关键:
1. **1R算法**:这是一种简单的机器学习算法,通过创建单一规则来预测目标变量。
2. **激活函数(Activation Function)**:在神经网络中,激活函数用于引入非线性,使得网络能够学习更复杂的模式。
3. **自适应分类器组合(ACC)**:一种策略,它结合多个分类器的预测以提高整体性能。
4. **自适应(Adaptive)**:指系统能够根据环境或数据变化自我调整的能力。
5. **可累加的(Additive)**:指模型由多个独立的部分组成,它们的预测结果可以相加。
6. **亲和力分析(Affinity Analysis)**:一种数据分析方法,用于发现个体之间的相似性和偏好。
7. **凝聚聚类(Agglomerative Clustering)**:自底向上的聚类方法,将相似的个体逐步合并成较大的簇。
8. **整体接近关系(Aggregate Proximity Relationship)**:在聚类分析中,用于度量数据对象的整体相似性。
9. **聚合层次(Aggregation Hierarchy)**:在数据组织中,将不同层次的数据组合在一起的结构。
10. **AGNES算法**:凝聚聚类算法的一种,基于凝聚层次聚类。
11. **自回归移动平均(ARMA)**:时间序列分析中的模型,结合了自回归和移动平均模型。
12. **算法(Algorithm)**:解决问题或执行任务的明确步骤集合。
13. **等位基因(Alleles)**:在遗传学中,一个基因的不同形式。
14. **备择假设(Alternative Hypothesis)**:统计检验中,与零假设相对的假设,通常是我们希望证明的假设。
15. **近似(Approximation)**:对真实值的不精确表示。
16. **Apriori算法**:用于发现频繁项集的关联规则挖掘算法。
17. **Artificial Intelligence (AI)**:研究、开发和应用模仿人类智能的计算机系统的学科。
18. **人工神经网络(Artificial Neural Networks, ANN)**:模拟人脑神经元网络的计算模型,用于学习和预测。
19. **关联规则问题(Association Rule Problem)**:寻找数据中项集之间的有趣关系。
20. **关联规则(Association Rules)/关联**:描述两个或更多项集之间关系的规则。
21. **面向属性的归纳(Attribute-Oriented Induction)**:一种概念学习方法,通过对实例进行分组和概括来构建概念描述。
22. **权威(Authoritative)/权威(Authority)**:在特定领域内具有可信度和影响力的信息来源。
23. **自相关系数(Autocorrelation Coefficient)**:衡量时间序列数据中相邻观测值之间的相关性。
24. **自相关(Autocorrelation)**:一个时间序列中一个值与其自身滞后值的相关性。
25. **自回归(Autoregression)**:基于过去值预测未来值的时间序列模型。
26. **集成的自回归移动平均(Auto-regressive Integrated Moving Average, ARIMA)**:广泛用于时间序列预测的模型,结合了自回归、差分和移动平均成分。
27. **平均连接(Average Link)**:在聚类中,计算两个簇所有成员之间距离的平均值作为簇间距离的方法。
28. **平均(Average)**:数值的算术平均。
29. **后向链接(Backlink)**:在网页之间,指向一个页面的链接。
30. **回滤(back-percolation)**:在网络科学中,从目标节点返回的过程。
31. **反向传播(Backpropagation)**:在神经网络中,计算损失函数对权重的梯度以进行训练的方法。
32. **后向爬行(Backward Crawling)**:从给定的种子页面开始,沿着链接向后遍历网页的网络爬虫策略。
33. **后向访问(Backward Traversal)**:遍历图或树时,从叶子节点向根节点的方向。
34. **BANG算法**:可能是某种特定的优化或学习算法,具体细节未提供。
35. **批量梯度下降(Batch Gradient Descent)**:优化算法,一次处理整个数据集的梯度更新。
36. **批量(Batch)**:在机器学习中,一批数据样本的集合。
37. **贝叶斯规则(Bayes Rule)**:计算条件概率的公式,是贝叶斯定理的一部分。
38. **贝叶斯定理(Bayes Theorem)**:在概率论中,描述如何根据先验信息更新概率的公式。
39. **贝叶斯(Bayesian)**:使用贝叶斯统计方法的,通常涉及概率和不确定性估计。
40. **贝叶斯分类(Bayesian Classification)**:基于贝叶斯定理的统计分类方法。
这个词汇表为Data Mining的学习者提供了重要的参考,帮助他们理解这个领域的核心概念和技术。每个术语都代表了一个深度学习、机器学习、统计分析或数据处理的重要方面。熟悉并掌握这些术语,对于在实际项目中应用Data Mining技术至关重要。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2022-11-25 上传
2019-09-15 上传
2009-08-12 上传
2020-04-20 上传
2008-12-15 上传
2007-08-23 上传
xxpr_ybgg
- 粉丝: 6753
- 资源: 3万+
最新资源
- 全国江河水系图层shp文件包下载
- 点云二值化测试数据集的详细解读
- JDiskCat:跨平台开源磁盘目录工具
- 加密FS模块:实现动态文件加密的Node.js包
- 宠物小精灵记忆配对游戏:强化你的命名记忆
- React入门教程:创建React应用与脚本使用指南
- Linux和Unix文件标记解决方案:贝岭的matlab代码
- Unity射击游戏UI套件:支持C#与多种屏幕布局
- MapboxGL Draw自定义模式:高效切割多边形方法
- C语言课程设计:计算机程序编辑语言的应用与优势
- 吴恩达课程手写实现Python优化器和网络模型
- PFT_2019项目:ft_printf测试器的新版测试规范
- MySQL数据库备份Shell脚本使用指南
- Ohbug扩展实现屏幕录像功能
- Ember CLI 插件:ember-cli-i18n-lazy-lookup 实现高效国际化
- Wireshark网络调试工具:中文支持的网口发包与分析