数据分析python代码
时间: 2023-11-25 19:02:59 浏览: 34
数据分析是一种通过对数据进行收集、清洗、转换和建模等过程,从而提取有用信息和进行决策支持的方法。Python语言在数据分析领域非常流行,因为它具有丰富的数据处理库和易读的语法。下面是一个简单的数据分析Python代码示例:
```python
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 查看数据前几行
print(data.head())
# 数据清洗
data.dropna(inplace=True)
# 数据统计
print(data.describe())
# 数据可视化
import matplotlib.pyplot as plt
data['age'].plot(kind='hist', bins=20)
plt.show()
# 建立模型
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(data[['x']], data['y'])
# 模型评估
print(model.score(data[['x']], data['y']))
# 保存结果
data.to_csv('clean_data.csv')
```
以上代码使用了pandas库来读取、清洗和统计数据,matplotlib库来进行数据可视化,sklearn库来建立和评估模型。这个简单的代码示例展示了数据分析的一般流程,包括数据处理、统计分析、可视化和建模等步骤。在实际应用中,这些步骤可能会更加复杂,但Python语言提供了丰富的库和工具来应对各种数据分析需求。