Python3.5 Pandas DataFrame 实例解析:二维数组创建

1 下载量 21 浏览量 更新于2024-08-28 收藏 1001KB PDF 举报
"Python3.5 Pandas模块中的DataFrame是数据分析中常用的数据结构,它能够方便地组织和处理二维表格数据。本文将通过实例解析DataFrame的创建方法,包括通过二维数组和借助numpy数组进行创建,并展示如何访问和操作DataFrame的行索引、列索引和值。" 在Python的Pandas库中,DataFrame是一种强大的数据结构,它可以存储各种类型的数据,并提供了丰富的数据分析和操作功能。在Python3.5中,DataFrame的创建有多种方式,其中最常见的是通过二维数组。 首先,我们可以直接使用二维列表来创建DataFrame。例如: ```python d1 = DataFrame([["a","b","c","d"],[1,2,3,4]]) ``` 这将创建一个DataFrame,第一行包含字符串"abcd",第二行包含数字1234。每一列默认会被命名为0、1、2、3。 另一种常见的创建方法是利用numpy的array,同时指定行索引和列名: ```python arr = np.array([["jack",78],["lili",86],["amy",97],["tom",100]]) d2 = DataFrame(arr, index=["01","02","03","04"], columns=["姓名","成绩"]) ``` 这里,我们创建了一个DataFrame,其中包含四行数据,每行代表一个人的成绩,行索引是"01"到"04",列名是"姓名"和"成绩"。 创建完成后,我们可以访问DataFrame的不同部分。例如,可以使用`index`属性获取行索引,`columns`属性获取列索引,`values`属性获取DataFrame的二维numpy数组形式的数据: ```python print(d2.index) # 打印行索引 print(d2.columns) # 打印列索引 print(d2.values) # 打印值 ``` DataFrame还支持各种操作,如选择特定行或列、数据过滤、排序、合并、统计计算等。例如,我们可以使用loc或iloc选择特定行或列,使用条件表达式过滤数据,使用sort_values进行排序,使用merge或concat进行数据合并,使用describe进行统计计算。 在实际数据分析工作中,Pandas的DataFrame提供了强大的数据处理能力,是数据预处理、清洗、转换和分析的核心工具。掌握DataFrame的使用,对于提升数据分析效率至关重要。通过不断练习和实践,可以更好地理解和应用这些功能,从而在Python3.5环境中高效地进行数据分析。