利用R掌握数据可视化与预测分析实战

4星 · 超过85%的资源 需积分: 9 149 下载量 84 浏览量 更新于2024-07-21 收藏 3.36MB PDF 举报
"《Learning Predictive Analytics with R》是一本面向统计学家、首席信息官、数据科学家、机器学习工程师、实践者、定量分析师以及机器学习学生的实用指南。该书由Eric Mayor撰写,由BIRMINGHAM-MUMBAI出版社出版,版权日期为2015年。本书的核心目标是帮助读者掌握使用R这一强大的统计软件进行关键数据可视化和预测分析技能。 本书结构清晰,适合初级和有一定基础的R用户,对于没有编程经验的读者,书中也提供了易于理解的工具说明。通过阅读,读者将学会如何: 1. 安装和加载新包以定制R环境。 2. 使用聚类算法探索数据结构。 3. 将非结构化文本转化为有序数据,从数据中获取知识。 4. 应用Naive Bayes、k-NN和决策树进行分类。 5. 通过主成分分析降低数据维度。 6. 利用Apriori算法发现关联规则。 7. 理解统计分布如何通过相关性、线性回归和多水平回归从数据中提取信息。 8. 使用PMML部署在R中创建的模型,实现模型的实用化应用。 书中涵盖了R中最常见的数据挖掘工具,如K-means、层次回归、线性回归、关联规则、主成分分析、多元水平建模、k-NN、朴素贝叶斯、决策树以及文本挖掘。此外,作者还介绍了基本可视化工具和lattice用于展示分组数据模式的数据可视化方法。 《Learning Predictive Analytics with R》以实践为导向,通过生动的数据实例探讨生命、健康和死亡等领域的数据,提供了一种适用于特定场景且可推广到其他数据集的数据解读方式。章节内容包括设置R环境、数据可视化、聚类分析、主成分分析、关联规则分析、概率分布、线性回归、分类方法(k-NN和朴素贝叶斯)、决策树、多水平分析以及文本分析。最后,书中还介绍了交叉验证、Bootstrap技术以及如何使用Caret进行模型评估,并通过PMML导出模型,确保了理论与实践的紧密结合。 《Learning Predictive Analytics with R》是一本帮助读者深入理解和掌握R在预测分析中的核心工具和技术的实用教材,无论你是数据挖掘新手还是经验丰富的专业人士,都能从中获益匪浅。"