pandas入门：数据类型与Series创建详解

112 浏览量更新于2024-08-30 收藏 135KB PDF 举报

本资源主要介绍Pandas库的基础操作，Pandas是Python中广泛使用的数据分析工具，它提供两种主要的数据结构：Series和DataFrame。以下是详细内容： 1. **Pandas常用数据类型**： - **Series**: 一维带标签的数组，类似于Python的字典，但提供了更丰富的索引功能。Series的数据可以是任何类型，包括数值、字符串等。在示例中，`pd.Series([1,2,3,4])` 创建了一个整数型的Series，其默认索引是0到3。 - **DataFrame**: 二维表格型数据结构，由一系列的列（Series）组成，每一列可以有不同的数据类型。DataFrame支持复杂的数据操作和分析。 2. **创建Series**： - 直接创建：使用`pd.Series`函数，可以传入一个数组，如`np.arange(12)`，并指定索引。例如，`pd.Series(np.arange(12), index=list(string.ascii_uppercase[:12]))` 创建了一个包含字母和对应数字的Series。 - 通过字典创建：将数据映射到对应的键上，如`a = {string.ascii_uppercase[i]: i for i in range(10)}`，然后转化为Series。 3. **处理索引对不上的情况**：如果索引长度与数据长度不匹配，Series会填充缺失值（NaN）。例如，`pd.Series(a, index=list(string.ascii_uppercase[5:15]))` 会产生带有NaN值的Series。 4. **Series的切片和索引**： - 切片操作：使用方括号`[]`进行，可以指定开始、结束和步长。例如，`t[1:4:2]` 返回索引从1到4（不包括4），步长为2的子集。 - 索引：可以使用单个索引获取特定元素，或者使用布尔索引来选择满足条件的元素。这些基础操作是理解和使用Pandas进行数据预处理、清洗和分析的关键步骤。熟练掌握这些操作有助于在实际项目中高效地处理和分析数据。后续章节可能还会介绍DataFrame的创建、数据选择、数据过滤、合并和分组等高级操作，这些都是数据分析过程中不可或缺的技能。

'''

Index(['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L'], dtype='object')

'''

for i in t.index:

print(i)

5、获取、获取values

t.values

'''

array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])

'''

type(t.values)

#numpy.ndarray

6、总结、总结

#Series对象本质由两个数组构成，一个数组构成对象的键（index，索引），一个数组构成值values

#所以，数组的clip等方法是通用的，但是series的where方法结果与ndarray不同

t.where(t >2) # t将小于2的值变为了nan，而并没有去掉

'''

A NaN

B NaN

C NaN

D 3.0

E 4.0

F 5.0

G 6.0

H 7.0

I 8.0

J 9.0

K 10.0

L 11.0

dtype: float64

'''

t.where(t>3,10) # 将小于3的数变为了10，与ndarray的变化相反

'''

A 10

B 10

C 10

D 10

E 4

F 5

G 6

H 7

I 8

J 9

K 10

L 11

dtype: int64

'''

四、四、pandas读外部文件读外部文件

1、、pd.read_csv()

df = pd.read_csv("./dogNames2.csv")

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZTR4L7CB-1584608153878)

(/Users/bobwang/Library/Application Support/typora-user-images/image-20200313113353181.png)]

2、读、读SQLpandas.``read_sql(sql, con**,** index_col=None**,** coerce_float=True**,** params=None**,**

parse_dates=None**,** columns=None**,** chunksize=None)

四、创建四、创建pandas的的DataFrame

1、直接传入字典、直接传入字典

d1 = {"name":["xiaoming","xiaofan"],"age":[12,13],"tel":[10010,10012]}

pd.DataFrame(d1,index=list("ab"))

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VzOruUNr-1584608153881)

(/Users/bobwang/Library/Application Support/typora-user-images/image-20200313151557054.png)]

2、传入数组、传入数组

pd.DataFrame(np.arange(12).reshape(3,4))

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GtKMGK5Q-1584608153887)

(/Users/bobwang/Library/Application Support/typora-user-images/image-20200313152921761.png)]

3、说明、说明

DataFrame对象既有行索引，又有列索引对象既有行索引，又有列索引

剩余12页未读，继续阅读

weixin_38691641

粉丝: 5
资源: 929

pandas入门：数据类型与Series创建详解

提升数据处理效率：探索Pandas-Stubs 1.0.4.2库

Python数据分析库Pandas的1.0.4.7版本发布

Pandas 1.0.4.4版本特性与数据分析工具介绍

pandas基础使用教程.pdf

Pandas基础操作详解：从Series到DataFrame

Pandas基础教程：从入门到精通

Pandas数据结构与基本操作

可变数据类型的修改,索引,切片【Pandas Series操作】索引和切片操作技巧

Python数据分析入门：Pandas库的基本操作与应用

Pandas库详解：数据结构和基本操作

最新资源