Python Pandas基础教程：数据表操作与处理

PDF格式 | 117KB | 更新于2024-08-30 | 14 浏览量 | 举报

"这篇资源主要介绍了Python中pandas库的基础使用和操作，包括如何生成数据表，以及数据表的信息查看方法。" 在Python数据分析领域，pandas库是不可或缺的工具，它提供了高效的数据结构和丰富的数据操作功能。下面将详细阐述资源中提到的知识点：一、生成数据表 1. 导入pandas库：`import pandas as pd` 是最常用的导入方式，通常还会导入numpy库，因为pandas很多操作会依赖numpy进行数值计算。 2. 读取CSV或Excel文件：`pd.read_csv()` 和 `pd.read_excel()` 分别用于读取CSV和Excel文件，`header=1` 表示第一行作为列名。 3. 创建DataFrame：`pd.DataFrame()` 可以通过字典生成DataFrame，如示例中创建了一个包含三列的数据表。二、数据表信息查看 1. 维度查看：`shape` 属性返回一个元组，表示DataFrame的行数和列数。 2. 数据表基本信息：`info()` 函数提供关于DataFrame的简要统计信息，包括非空值数量、数据类型等。 3. 列数据格式：`dtypes` 返回一个Series，显示每列的数据类型。 4. 某一列数据类型：`df['column_name'].dtype` 显示指定列的数据类型。 5. 空值检查：`isnull()` 应用于整个DataFrame，返回布尔DataFrame，指示哪些值为缺失。 6. 检查特定列的空值：`df['column_name'].isnull().sum()` 统计某一列的空值数量。 7. 查看唯一值：`unique()` 函数返回指定列的所有唯一值。 8. 数据表的值：`values` 属性返回DataFrame的NumPy数组形式。 9. 列名称：`columns` 属性返回列的名称列表。 10. 查看数据前几行或后几行：`head(n)` 和 `tail(n)` 分别显示前n行和后n行数据。在示例中还展示了如何使用`np.where()` 函数根据条件设置新列，`fillna()` 方法用于填充缺失值，`loc` 和 `iloc` 分别基于标签和整数位置进行索引。总结，这个资源是pandas基础操作的简单教程，涵盖了生成数据表、读取文件以及查看数据表信息等核心操作，对于初学者来说是非常实用的起点。在实际应用中，pandas的功能远不止这些，还包括数据清洗、合并、分组、排序、时间序列分析等复杂操作，学习pandas能够极大提升数据处理的效率。

python pandas的基本使用及基本操作小例子！的基本使用及基本操作小例子！

一、生成数据表一、生成数据表

1.首先导入首先导入pandas库，一般会用到库，一般会用到numpy库，所以先导入备用！库，所以先导入备用！

import numpy as np

import pandas as pd

2.导入导入CS或者或者xlsx文件：文件：

fandango=pd.read_csv(“自己的路径及文件自己的路径及文件”，，header=1)

fandango=pd.DataFrame(pd.read_exce(“name.xlsx”))

3用用pandas创建数据表：创建数据表：

import numpy as np

import pandas as pd

new_pandas=pd.DataFrame({"col1":range(7),"col2":[11,22,33,44,np.nan,55,66],"col3":[4,6,3,7,8,9,7]})

# print("new_pandas",new_pandas)

# print("new_pandas.values",new_pandas.values)

# print("type(new_pandas.values)",type(new_pandas.values))#ndarray

new_pandas["col4"]=np.where(new_pandas["col1"]>3000,"high","low")

# print("new_pandas",new_pandas)

new_pandas["col2"].fillna(new_pandas["col2"].mean())

print("new_pandas[0:2].loc",new_pandas.loc[0:2])

print("new_pandas.iloc[0:2]",new_pandas.iloc[0:2])

二、数据表信息查看二、数据表信息查看

1.维度查看：维度查看：shape

2.数据表基本信息（维度，列表名称，数据格式，所占空间等）：数据表基本信息（维度，列表名称，数据格式，所占空间等）：info（）（）

3.每一列数据格式：每一列数据格式：dtypes

4.某一列格式：某一列格式：dtype

5.空值：空值：isnull

6.查看某一列空值：查看某一列空值：isnill()

7.查看某一列的唯一值：查看某一列的唯一值：unique

8.查看数据表的值：查看数据表的值：values

9.查看列名称：查看列名称：columns

10.查看前查看前10行数据。后行数据。后10行数据行数据

head() tail()

import pandas

food_info=pandas.read_csv("C:/Total-folder/work/AI/machine/data/food_info.csv")

#打印数据类型

# print("type",type(food_info))#

#获取数据

# print("food_info",food_info)

# print("help(pandas.read_csv)",help(pandas.read_csv))#None

# head函数把读取的数据读出来不会显示完整默认显示前5条数据

# 想显示前3条

# three=food_info.head(3)

# print("three",three)

# four=food_info.tail(4)

# print("four",four)

print("food_info.shape",food_info.shape)#(8618, 36)8618行 36列

# 索引与计算

# 获取某些行的数据

# 第一行

# print("food_info.loc[0]",food_info.loc[0])

# print("type(food_info.loc[0])",type(food_info.loc[0]))#Series

# print("food_info.loc[1]",food_info.loc[1])

# print("food_info.loc[3:6]取出3-6的数据",food_info.loc[3:6])

# arr=[2,5,10] # print("food_info.loc[arr]",food_info.loc[arr])

# firstdata=food_info.loc[0] # print("firstdata",firstdata)

# print("type(firstdata)",type(firstdata))#Series

# 获取某一列，通过列名来得到某列的数据

# print("food_info['NDB_No']",food_info['NDB_No'])

# print("food_info[['NDB_No','Shrt_Desc']]",food_info[["NDB_No","Shrt_Desc"]])

# 查看行标签(index)，列标签(columns)和数据

#RangeIndex(start=0, stop=8618, step=1)索引值0-8618 步长为1

# print("food_info.index",food_info.index)

# print("food_info.index.names",food_info.index.names)#[None] # print("food_info.columns",food_info.columns)#所有特征

# print("food_info.values",food_info.values)#样本

三、数据表清洗三、数据表清洗

1.用数组用数组0填充空值：填充空值：fillna(value=0)

2.使用列使用列prince的平均值对的平均值对NAN进行填充：进行填充：

例：例：df.[‘prince’]fillna(df.[‘prince’].mean())

3.清除清除city字段的空格字符：字段的空格字符：

例：例：df[‘city’]=df[‘city’].map(str.stript)

4.大小写转换：大小写转换：

例：例：df[‘city’]=df[‘city’].str.lower()

5.更改数据格式：更改数据格式：

例：例：df[“price”].astype(‘int’)

6.更改列名称：更改列名称：

例：例：df.rename(colimns={“category”:“category-size”})

7.删除后出现的重复值：删除后出现的重复值：

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38633083

粉丝: 0

Python Pandas基础教程：数据表操作与处理

pandas_alive:使用Pandas和Matplotlib创建令人惊叹的动画可视化效果，就像调用`df.plot_animated（）`一样容易。

数据分析excel python pandas教程及相关例子源码.zip

Python Pandas入门：创建DataFrame与基本操作

python pandas rename函数_Python pandas.DataFrame.rename_axis函数方法的使用

python pandas ewm

python pandas 去重

python pandas 追加

python pandas颜色

python pandas lambda

pythonpandas筛选

最新资源