Python3.5 Pandas DataFrame 实例解析：二维数组创建

154 浏览量更新于2024-08-28 收藏 1001KB PDF 举报

"Python3.5 Pandas模块中的DataFrame是数据分析中常用的数据结构，它能够方便地组织和处理二维表格数据。本文将通过实例解析DataFrame的创建方法，包括通过二维数组和借助numpy数组进行创建，并展示如何访问和操作DataFrame的行索引、列索引和值。" 在Python的Pandas库中，DataFrame是一种强大的数据结构，它可以存储各种类型的数据，并提供了丰富的数据分析和操作功能。在Python3.5中，DataFrame的创建有多种方式，其中最常见的是通过二维数组。首先，我们可以直接使用二维列表来创建DataFrame。例如： ```python d1 = DataFrame([["a","b","c","d"],[1,2,3,4]]) ``` 这将创建一个DataFrame，第一行包含字符串"abcd"，第二行包含数字1234。每一列默认会被命名为0、1、2、3。另一种常见的创建方法是利用numpy的array，同时指定行索引和列名： ```python arr = np.array([["jack",78],["lili",86],["amy",97],["tom",100]]) d2 = DataFrame(arr, index=["01","02","03","04"], columns=["姓名","成绩"]) ``` 这里，我们创建了一个DataFrame，其中包含四行数据，每行代表一个人的成绩，行索引是"01"到"04"，列名是"姓名"和"成绩"。创建完成后，我们可以访问DataFrame的不同部分。例如，可以使用`index`属性获取行索引，`columns`属性获取列索引，`values`属性获取DataFrame的二维numpy数组形式的数据： ```python print(d2.index) # 打印行索引 print(d2.columns) # 打印列索引 print(d2.values) # 打印值 ``` DataFrame还支持各种操作，如选择特定行或列、数据过滤、排序、合并、统计计算等。例如，我们可以使用loc或iloc选择特定行或列，使用条件表达式过滤数据，使用sort_values进行排序，使用merge或concat进行数据合并，使用describe进行统计计算。在实际数据分析工作中，Pandas的DataFrame提供了强大的数据处理能力，是数据预处理、清洗、转换和分析的核心工具。掌握DataFrame的使用，对于提升数据分析效率至关重要。通过不断练习和实践，可以更好地理解和应用这些功能，从而在Python3.5环境中高效地进行数据分析。

Python3.5 Pandas模块之模块之DataFrame用法实例分析用法实例分析

本文实例讲述了Python3.5 Pandas模块之DataFrame用法。分享给大家供大家参考，具体如下：

1、DataFrame的创建

（1）通过二维数组方式创建

#!/usr/bin/env python

# -*- coding:utf-8 -*-

# Author:ZhengzhengLiu

import numpy as np

import pandas as pd

from pandas import Series,DataFrame

#1.DataFrame通过二维数组创建

print("======DataFrame直接通过二维数组创建======")

d1 = DataFrame([["a","b","c","d"],[1,2,3,4]])

print(d1)

print("======DataFrame借助array二维数组创建======")

arr = np.array([

["jack",78],

["lili",86],

["amy",97],

["tom",100] ])

d2 = DataFrame(arr,index=["01","02","03","04"],columns=["姓名","成绩"])

print(d2)

print("========打印行索引========")

print(d2.index)

print("========打印列索引========")

print(d2.columns)

print("========打印值========")

print(d2.values)

运行结果：

======DataFrame直接通过二维数组创建======

0 1 2 3

0 a b c d

1 1 2 3 4

======DataFrame借助array二维数组创建======

姓名成绩

01 jack 78

02 lili 86

03 amy 97

04 tom 100

========打印行索引========

Index([’01’, ’02’, ’03’, ’04’], dtype=’object’)

========打印列索引========

Index([‘姓名’, ‘成绩’], dtype=’object’)

========打印值========

[[‘jack’ ’78’] [‘lili’ ’86’] [‘amy’ ’97’] [‘tom’ ‘100’]]

（2）通过字典方式创建

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38744207

粉丝: 344
资源: 2万+

Python3.5 Pandas DataFrame 实例解析：二维数组创建

pandas（python3.5)-win7_amd64.whl 压缩包

Python3.5 Pandas模块深入解析：Series操作实例

Python3.5 Pandas DataFrame详解：创建、读取、过滤操作

Python3.5 Pandas Series详解：创建与实例应用

Python3.5 Pandas处理缺失值与层次索引实例深度解析

Python3.5 Pandas：缺失值处理与层次索引实战

Python_Programming:Python_编程

Python中数据处理模块：NumPy和Pandas介绍

【Python数据分析加分项】：掌握Pandas和NumPy，让你在面试中独占鳌头

Pandas库在数据处理与分析中的高级技巧

最新资源