大数据分析练习与基础知识

需积分: 11 150 浏览量更新于2024-07-15 收藏 296KB DOC 举报

"大数据练习题.doc" 涵盖了大数据分析技术、数据分析基础以及机器学习中的监督学习和非监督学习的相关练习题目。文件主要涉及Python编程环境的准备，如第三方库的使用、集成开发环境Anaconda的选择和配置，以及数据分析的基础概念和操作，如数据获取、数据解析、数据呈现等。此外，还涉及到数据处理库Pandas的基本操作。在环境准备部分，提到了绘图库Matplotlib，它是Python中用于数据可视化的常用库。Python集成开发环境推荐使用Anaconda，它自带Python解释器3.x版本，并且课程中使用Jupyter Notebook进行代码编写。关于Anaconda的安装与配置，题目指出可以使用`conda --version`来检查conda的版本，但这个命令的使用方法是错误的。在数据分析基础部分，介绍了数据分析的基本流程，正确的顺序是先明确目的，然后获取数据、解析数据，再进行数据分析，最后呈现结果。数据获取途径包括内部和外部来源，CSV文件是常见的数据格式，其默认分隔符是逗号。CSV文件是纯文本文件，可以用Excel打开。Pandas库在处理CSV数据时，若某字段为空，会显示为NaN。read_csv()函数是Pandas用于读取CSV文件的，delimiter参数用于设置列间分隔符，而设置列名的参数未在题目中完整给出，通常用header参数指定列名。在数据清洗过程中，Pandas提供了一些功能强大的函数，如dropna()用于删除含有空值的行，fillna()则用于填充缺失值。这些函数在实际数据预处理中非常关键，因为确保数据质量是数据分析的第一步。练习题还涉及了监督学习和非监督学习，虽然具体题目内容没有给出，但可以推断这部分可能涵盖了分类算法、聚类算法等基础知识，这些都是大数据分析中常用的机器学习技术。在实际应用中，监督学习常用于分类问题，如决策树、随机森林、支持向量机等；非监督学习则常用于无标签数据的探索性分析，如K-means聚类、主成分分析等。总结起来，这份练习题文档旨在帮助学习者巩固大数据分析中的Python编程技能、数据分析基础以及监督学习和非监督学习的基本概念。通过这些练习，学习者可以更好地掌握数据分析的全过程，从数据的获取、处理到模型的构建和结果的解释。

正确答案：、'

7.针对下面的代码，（）说法是不正确的。

importnumpyasnp

a=np.array([0,1,2,3,4])

importpandasaspd

b=pd.Series([0,1,2,3,4])

正确答案：, 参与运算的执行速度明显比  快

项目二第 1 次随堂测

多选题

机器学习算法可分为（）。

监督学习

无监督学习

)半监督学习

,强化学习

正确答案：),

填空题

本章中使用的机器学习第三方库全名是（）。1 时，使用（）。小写

正确答案：第  空'"% 第  空'" 

填空题

回归的英文翻译为（）；分类的英文翻译为（）。全部小写

正确答案：第  空 4 ''第  空''5

填空题

'"  对常用的机器学习方法进行了封装，支持包括（）、（）、（）和（）等方法的应用。（中文）

正确答案：分类8回归8聚类8降维

#单选题

9 :4 '' 是在 '"  的模块。

正确答案： 01

$判断题

2 1 中的两列分别为 1 类型，相减后得到的值为数值型。

正确答案：错

(填空题

'"  中机器学习方法在训练模型时，常调用（）函数，预测时调用（）函数。

正确答案：第  空5第  空 

项目二第 2 次随堂测

多选题

剩余17页未读，继续阅读

Delusion_luck

粉丝: 12
资源: 1

大数据分析练习与基础知识

大数据练习题.docx

大数据题库-选择题.pdf

大数据试题及答案.doc

云计算与大数据技术课后习题.doc

大数据可视化期末考试练习题.doc

广西河池市宜州区大数据发展局招考聘用强化练习题.doc

十问大数据.doc

资本运营练习题.doc

数据结构综合练习题.doc

计算机应用 （教案）互联网之大数据.doc

最新资源

计算机应用（教案）互联网之大数据.doc