武工大邮电院Python大数据与挖掘技术考试重点

5星 · 超过95%的资源 需积分: 3 23 下载量 10 浏览量 更新于2024-08-04 5 收藏 82KB DOCX 举报
"这是一份关于Python在大数据与挖掘技术中的应用的期末考试习题,主要涵盖数据挖掘的目的、Python科学计算及数据可视化相关的库、数据类型操作、NumPy数组属性和操作、Pandas数据结构及其操作以及Matplotlib的图形元素等知识。" 1. 数据挖掘的目的在于从丰富的数据中提取出有价值的信息,因为现实世界中数据通常是丰富的,但信息贫瘠(A.datarichinformationpoor)。 2. Numpy是Python进行科学计算的基础包,提供了高效的多维数组操作(A.Numpy)。 3. Matplotlib是Python进行绘制数据图表的主要包,支持各种图形和绘图功能(C.Matplotlib)。 4. 元组是不可变数据类型,一旦创建就不能修改(B.元组)。 5. L2[1:3]会截取列表L2的第二个到第三个元素,结果为[2, 'HE'](B)。 6. NumPy的ndarray数组中,dtype属性描述了数组元素的类型(B.dtype)。 7. arr=np.arange(10)创建了一个从0到9的数组,arr[-1]表示获取最后一个元素,即9(C.9)。 8. arr[0,3:5]选取了二维数组arr第一行的第3到第4个元素,结果为[3, 4](C.[34])。 9. arr[1:-1:2]在步长为2的情况下,选取了从第二个元素到倒数第二个元素的奇数索引值,即[1, 3, 5](B.[135])。 10. 题目缺失arr1和arr2的具体内容,无法给出具体答案(A/B/C/D)。 11. 序列和数据框是Pandas包下的数据结构,用于高效的数据操作和分析(B.Pandas)。 12. 可以通过列表、元组、数组等多种类型创建Pandas的序列(D.以上类型都可以)。 13. Pandas能够读取包括Excel、txt、csv等多种格式的外部文件(D.以上文件都可以)。 14. Pandas中创建序列的函数是Series(A.Series)。 15. Pandas中创建数据框的函数是DataFrame(B.DataFrame)。 16. Matplotlib的plt.legend()函数用于指定当前图形的图例(D.legend)。 这些题目涵盖了Python在大数据处理中的基础知识,包括数据挖掘的理论、Numpy和Pandas的数据操作以及Matplotlib的数据可视化。学习者需要理解数据类型、数组操作、数据结构(如序列和数据框)以及基本的绘图概念,这些都是Python在大数据与挖掘技术领域中的核心技能。