利用编程挖掘集体智慧
"《编程集体智能》是一本深入探讨如何利用网络上大量用户生成的数据来构建Web 2.0应用程序的书籍。书中介绍了一系列复杂的算法,帮助开发者掌握搜索引擎排名、产品推荐、社会书签和在线匹配等领域的技术。通过这些算法,你可以从其他网站获取有趣的数据集,收集自己应用的用户数据,并进行分析和理解。这本书详细讲解了以下知识点: 1. **协同过滤技术**:这是在线零售商用于推荐商品或媒体的技术,通过分析用户行为来预测个体可能的兴趣。 2. **聚类方法**:在大数据集中检测相似项的群体,有助于理解数据模式。 3. **搜索引擎构建**:包括爬虫、索引器、查询引擎和PageRank算法,这些都是搜索引擎核心功能的实现。 4. **优化算法**:在大量解决方案中寻找最优解,适用于复杂问题的求解。 5. **贝叶斯过滤**:常用于垃圾邮件分类,根据文档中的词性和其他特征对文档进行分类。 6. **决策树**:不仅用于预测,还能模型化决策过程。 7. **数值预测**:建立价格模型,预测未知数值而非分类。 8. **支持向量机(SVM)**:在在线约会网站中匹配人物,通过算法找到最佳匹配。 9. **非负矩阵分解(NMF)**:找出数据集中的独立特征,适用于数据降维和特征提取。 10. **进化智能**:通过不断改进自身代码,使计算机在解决特定问题时逐渐提高技能,例如在游戏中的自我学习。 每个章节都包含练习,旨在帮助读者扩展算法,提升其应用能力。本书提供了一种将互联网数据转化为实用工具的方法,对于想要深入理解和应用机器学习算法的开发者来说,是一本宝贵的资源。Google的Dan Russell和Collective Intellect的CTO Tim Wolters都给予了高度评价,认为它能有效帮助开发者快速理解和应用机器学习算法,节省时间和精力。 《编程集体智能》是一本涵盖了机器学习、统计学和互联网数据分析的综合指南,适合开发人员、数据分析师和对网络数据挖掘感兴趣的读者。"
剩余359页未读,继续阅读
- 粉丝: 0
- 资源: 34
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 多模态联合稀疏表示在视频目标跟踪中的应用
- Kubernetes资源管控与Gardener开源软件实践解析
- MPI集群监控与负载平衡策略
- 自动化PHP安全漏洞检测:静态代码分析与数据流方法
- 青苔数据CEO程永:技术生态与阿里云开放创新
- 制造业转型: HyperX引领企业上云策略
- 赵维五分享:航空工业电子采购上云实战与运维策略
- 单片机控制的LED点阵显示屏设计及其实现
- 驻云科技李俊涛:AI驱动的云上服务新趋势与挑战
- 6LoWPAN物联网边界路由器:设计与实现
- 猩便利工程师仲小玉:Terraform云资源管理最佳实践与团队协作
- 类差分度改进的互信息特征选择提升文本分类性能
- VERITAS与阿里云合作的混合云转型与数据保护方案
- 云制造中的生产线仿真模型设计与虚拟化研究
- 汪洋在PostgresChina2018分享:高可用 PostgreSQL 工具与架构设计
- 2018 PostgresChina大会:阿里云时空引擎Ganos在PostgreSQL中的创新应用与多模型存储