大数据分类的机器学习模型与算法
需积分: 16 83 浏览量
更新于2024-07-20
收藏 9.31MB PDF 举报
"本书《Machine Learning Models and Algorithms for Big Data Classification》由Shan Suthaharan撰写,旨在介绍处理大数据分类问题的机器学习模型和算法。全书采用简化、硬编码、重复或间隔的方式,以Matlab和R语言的程序示例帮助读者理解并测试复杂的概念,适合学生和初入大数据及机器学习领域的人士阅读。书中的内容分为四个部分,共14章,涵盖了信息科学、大数据基础、大数据分析、分布式文件系统、MapReduce编程平台、建模与算法、监督学习模型、支持向量机、决策树学习、随机森林学习、深度学习模型以及降维等主题。"
这本书首先介绍了信息科学的基础,然后进入第一部分“理解大数据”,包含“大数据基础”和“大数据分析”两章,帮助读者建立对数据和大数据的分析理解。第二部分“理解大数据系统”涵盖分布式文件系统和MapReduce编程平台,解释处理大数据所需的技术和平台。第三部分“理解机器学习”中,通过“建模和算法”、“监督学习模型”、“监督学习算法”、“支持向量机”和“决策树学习”等章节,深入浅出地讲解了各种机器学习技术及其应用。最后一部分“理解规模化机器学习”关注如何将机器学习扩展到大数据环境,包括“随机森林学习”、“深度学习模型”以及用于降低复杂性的“降维”方法。
书中通过简化数学公式,强调可读性和实用性,旨在吸引并帮助各种层次的读者,如本科生、研究生、新研究人员、开发者和实践者,有效地学习和掌握大数据和机器学习的概念。书中的每个章节都提供了丰富的实例和代码,鼓励读者通过实验来加深理解,并进行修改或编写自己的程序,以便解决更复杂的问题。
通过本书,读者不仅能够了解和运用现有的机器学习技术,如决策树、随机森林和深度学习,还能掌握在大数据背景下如何选择和应用这些算法,以及如何通过扩展机器学习来应对现代大数据挑战。这是一本理论与实践相结合的教材,对于想要在大数据和机器学习领域深化学习的人来说,是一份宝贵的资源。
124 浏览量
2016-10-31 上传
2016-09-25 上传
2017-08-16 上传
2018-04-03 上传
2017-07-13 上传
2018-06-19 上传
2017-05-09 上传
195 浏览量
ramissue
- 粉丝: 354
- 资源: 1487
最新资源
- 构建基于Django和Stripe的SaaS应用教程
- Symfony2框架打造的RESTful问答系统icare-server
- 蓝桥杯Python试题解析与答案题库
- Go语言实现NWA到WAV文件格式转换工具
- 基于Django的医患管理系统应用
- Jenkins工作流插件开发指南:支持Workflow Python模块
- Java红酒网站项目源码解析与系统开源介绍
- Underworld Exporter资产定义文件详解
- Java版Crash Bandicoot资源库:逆向工程与源码分享
- Spring Boot Starter 自动IP计数功能实现指南
- 我的世界牛顿物理学模组深入解析
- STM32单片机工程创建详解与模板应用
- GDG堪萨斯城代码实验室:离子与火力基地示例应用
- Android Capstone项目:实现Potlatch服务器与OAuth2.0认证
- Cbit类:简化计算封装与异步任务处理
- Java8兼容的FullContact API Java客户端库介绍