Pandas学习学习 – 基础基础
写在前面写在前面
这个系列是跟着 Datawhale 的第二次学习,算是系统的学习一下 pandas 基础,然后会跟着教材梳理一下知识点。
# 导入所需模块
import pandas as pd
import numpy as np
这里说明一下查看模块版本的语句,一般来说大部分模块有这个方法
pandas.__version__
因为群里有同学遇到了 0.xx 版本的遗留问题,所以这里将 pandas 模块进行升级,在 prompt 里的语句如下,然后就顺利升级到了 1.0.3 !
python -m pip install --upgrade pandas
一、文件读取与写入一、文件读取与写入
1. 读取读取
# 读取文件
# 可以设置分隔符如,sep = ','
## csv格式
df_csv = pd.read_csv('C:/Users/wen97/Desktop/joyful-pandas-master/data/table.csv')
## txt格式
df_txt = pd.read_txt('C:/Users/wen97/Desktop/joyful-pandas-master/data/table.txt')
## xls或xlsx格式
df_excel = pd.read_excel('C:/Users/wen97/Desktop/joyful-pandas-master/data/table.txt')
2. 写入写入
# 写入文件
# 设置路径为你想要放置文件的位置即可,并且命名文件
## csv格式
df_csv.to_csv('C:/Users/wen97/Desktop/new/table1.csv')
# df.to_csv('C:/Users/wen97/Desktop/new/table1.csv', index=False) #保存时除去行索引
## xls或xlsx格式
df_excel.to_excel = pd.to_excel('C:/Users/wen97/Desktop/new/table2.xlsx', sheet_name='Sheet1')
trick one: 还有看到过还有看到过pickle格式的文件,可以依葫芦画瓢。格式的文件,可以依葫芦画瓢。
二、基本数据结构二、基本数据结构
1. Series序列序列
对于一个Series,其中最常用的属性为值(values),索引(index),名字(name),类型(dtype)
# 创建一个 Series
s = pd.Series(np.random.randn(5), index=['a','b','c','d','e'], name='这是一个Series', dtype='float64')
s
输出如下,可见包含了上述Series的四个要素
trick two: pandas模块中序列模块中序列Series和列表和列表List的区别的区别
列表:输出结果在中括号中,且各元素之间以逗号分隔
序列:竖着的形式展示数据
print("列表的输出形式:")
a=[1,2,3,4] print(a)
print(type(a))
print("")
print("序列的输出形式:")
b=pd.Series(a)
print(b)
print(type(b))
创建完毕之后我们进入后面的学习,可知序列含有四个属性,首先要知道如何访问序列属性,方法非常简单。
# 访问 Series 属性
## 访问值
s.values
## 访问名字
s.name
## 访问索引
s.index
## 访问类型
s.dtype
trick three: 这里我个人感觉可以把索引看作是这里我个人感觉可以把索引看作是DataFrame里的变量名,只不过转置一下,不知道可不可以这样理解里的变量名,只不过转置一下,不知道可不可以这样理解
# 取出某一个值