python数据处理常用代码
时间: 2024-05-21 13:09:50 浏览: 96
处理数据的代码Abnormal-GG-master.zip_meltedpya_python_数据处理_晶粒_晶粒长大
Python是一种非常流行的数据分析和处理语言。以下是一些常用的Python数据处理代码:
1. 加载数据:
```
import pandas as pd
data = pd.read_csv('filename.csv')
```
2. 查看数据:
```
print(data.head()) # 打印前5行数据
print(data.tail()) # 打印后5行数据
print(data.shape) # 打印数据维度
print(data.columns) # 打印数据列名
print(data.describe()) # 打印数据统计信息
```
3. 数据清洗:
```
data.dropna() # 删除缺失值
data.drop_duplicates() # 删除重复值
data.replace(x, y) # 将值x替换为y
data.rename(columns={'old_name':'new_name'}) # 重命名列名
```
4. 数据筛选:
```
data.loc[data['column_name'] == 'value'] # 按列名选取值等于value的行
data.loc[(data['column_name'] > x) & (data['column_name'] < y)] # 按列名选取值在x和y之间的行
data.iloc[row_index, col_index] # 按行和列的位置选取数据
```
5. 数据聚合和统计:
```
data.groupby('column_name').mean() # 按列名分组并计算平均值
data.groupby('column_name').agg(['mean', 'max', 'min']) # 按列名分组并计算多个统计量
data.pivot_table(index='column_1', columns='column_2', values='value', aggfunc='mean') # 数据透视表,计算平均值
```
6. 数据可视化:
```
import matplotlib.pyplot as plt
plt.plot(data['column_name']) # 折线图
plt.scatter(data['column_name_1'], data['column_name_2']) # 散点图
plt.hist(data['column_name'], bins=10) # 直方图
plt.bar(data['column_name'], height=data['value']) # 条形图
plt.show() # 显示图形
```
阅读全文