真实值与预测值对比图 python
时间: 2024-06-08 17:02:19 浏览: 786
当进行数据分析或机器学习任务时,真实值与预测值对比图是一种常见的可视化方式,用于评估模型的性能和准确度。在Python中,可以使用各种数据可视化库来创建这样的图形,例如matplotlib和seaborn。
下面是一个简单的示例代码,展示了如何使用matplotlib库创建真实值与预测值对比图:
```python
import matplotlib.pyplot as plt
# 真实值
true_values = [1, 2, 3, 4, 5]
# 预测值
predicted_values = [1.2, 2.5, 2.8, 3.9, 4.2]
# 创建图形
plt.plot(true_values, label='True Values')
plt.plot(predicted_values, label='Predicted Values')
# 添加图例和标签
plt.legend()
plt.xlabel('Index')
plt.ylabel('Value')
# 显示图形
plt.show()
```
这段代码会生成一个简单的折线图,其中真实值用蓝色线条表示,预测值用橙色线条表示。你可以根据自己的需求进行修改和定制。
相关问题
python数据分析与应用企业所得税预测分析计算绘制真实值与预测值对比图
在Python中进行企业所得税的预测分析,并绘制真实值与预测值的对比图,可以按照以下步骤进行:
1. **数据准备**:首先,需要准备好企业的财务数据,包括历史的企业所得税数据和其他相关财务指标。
2. **数据预处理**:对数据进行清洗和预处理,包括处理缺失值、数据归一化等。
3. **模型选择与训练**:选择合适的预测模型(如线性回归、随机森林等),并将数据分为训练集和测试集,训练模型。
4. **预测**:使用训练好的模型对测试集进行预测。
5. **结果可视化**:使用Matplotlib或Seaborn等可视化库绘制真实值与预测值的对比图。
以下是一个简单的示例代码:
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# 1. 数据准备
# 假设我们有一个包含 财务指标 和 企业所得税 的数据集
data = pd.read_csv('enterprise_data.csv')
# 2. 数据预处理
# 假设企业所得税在最后一列
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# 处理缺失值(简单填充法)
from sklearn.impute import SimpleImputer
imputer = SimpleImputer(missing_values=np.nan, strategy='mean')
X = imputer.fit_transform(X)
# 3. 模型选择与训练
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
model = LinearRegression()
model.fit(X_train, y_train)
# 4. 预测
y_pred = model.predict(X_test)
# 5. 结果可视化
plt.figure(figsize=(10, 6))
plt.plot(y_test, label='真实值', marker='o')
plt.plot(y_pred, label='预测值', marker='x')
plt.legend()
plt.title('企业所得税真实值与预测值对比图')
plt.xlabel('样本编号')
plt.ylabel('企业所得税')
plt.grid(True)
plt.show()
# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
print(f'均方误差: {mse}')
```
### 代码说明:
1. **数据准备**:从CSV文件中读取数据。
2. **数据预处理**:使用`SimpleImputer`处理缺失值。
3. **模型选择与训练**:使用线性回归模型进行训练,并划分训练集和测试集。
4. **预测**:对测试集进行预测。
5. **结果可视化**:使用Matplotlib绘制真实值与预测值的对比图,并计算均方误差。
使用k近邻回归算法,对波士顿房价数据进行预测,并画出真实值与预测值的图像对比图python
好的,我可以为您提供代码。但在此之前,需要确保您已经安装了以下库:numpy、pandas、sklearn、matplotlib。
接下来,我们可以按照以下步骤进行操作:
1. 加载波士顿房价数据集
```python
from sklearn.datasets import load_boston
boston = load_boston()
```
2. 将数据集拆分为特征和目标变量
```python
X = boston.data
y = boston.target
```
3. 对数据集进行训练集和测试集的划分
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. 导入k近邻回归算法
```python
from sklearn.neighbors import KNeighborsRegressor
```
5. 创建k近邻回归模型并进行训练
```python
knn = KNeighborsRegressor(n_neighbors=5)
knn.fit(X_train, y_train)
```
6. 对测试集进行预测
```python
y_pred = knn.predict(X_test)
```
7. 绘制真实值与预测值的对比图像
```python
import matplotlib.pyplot as plt
plt.scatter(y_test, y_pred)
plt.xlabel('True Values')
plt.ylabel('Predictions')
plt.show()
```
完整代码如下:
```python
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsRegressor
import matplotlib.pyplot as plt
# 加载波士顿房价数据集
boston = load_boston()
# 将数据集拆分为特征和目标变量
X = boston.data
y = boston.target
# 对数据集进行训练集和测试集的划分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建k近邻回归模型并进行训练
knn = KNeighborsRegressor(n_neighbors=5)
knn.fit(X_train, y_train)
# 对测试集进行预测
y_pred = knn.predict(X_test)
# 绘制真实值与预测值的对比图像
plt.scatter(y_test, y_pred)
plt.xlabel('True Values')
plt.ylabel('Predictions')
plt.show()
```
希望对您有所帮助!
阅读全文
相关推荐
















