python数据分析案例代码
时间: 2024-06-13 16:01:15 浏览: 11
Python是一门非常适合数据分析的语言,它有很多强大的库和工具可以帮助人们进行数据处理、可视化和建模等工作。以下是一个简单的数据分析案例,涉及到一些Python的常用库:
```
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_csv("data.csv")
# 数据预处理
data.dropna(inplace=True) # 删除缺失值
data["price"] = np.log(data["price"]) # 对价格进行对数变换
# 数据可视化
plt.scatter(data["area"], data["price"], alpha=0.5) # 绘制散点图
plt.xlabel("Area")
plt.ylabel("Price")
plt.show()
# 建模分析
from sklearn.linear_model import LinearRegression
X = data[["area"]] # 自变量
y = data["price"] # 因变量
model = LinearRegression()
model.fit(X, y)
print("斜率:", model.coef_)
print("截距:", model.intercept_)
print("R平方:", model.score(X, y))
```
这个案例中,我们使用了Pandas库读取和处理数据,使用了Numpy库对价格进行了对数变换,使用了Matplotlib库绘制了散点图,使用了Scikit-learn库中的线性回归模型进行了建模分析。