import pandas as pd df=pd.read_table('winequality-white.csv',sep=';') df.columns=['fixed acidity','volatile acidity','citric acid','residual sugar','chlorides','free sulfur dioxide','total sulfur dioxide','density','pH','sulphates','alcohol','quality']在此基础上编写python代码完成以下要求：1建立并训练线性模型并给出模型评价，2建立并训练决策树模型并给出模型评价，3建立并训练支持向量机模型并给出模型评价。完成后给出三个模型的优缺点比较

时间: 2023-08-06 11:12:24 浏览: 65

1. 建立并训练线性模型并给出模型评价： ``` from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error # 划分数据集 X_train, X_test, y_train, y_test = train_test_split(df.iloc[:,:-1], df['quality'], test_size=0.2, random_state=42) # 建立线性回归模型 lr = LinearRegression() # 训练模型 lr.fit(X_train, y_train) # 预测数据 y_pred = lr.predict(X_test) # 计算模型的均方误差 mse = mean_squared_error(y_test, y_pred) print('线性回归模型的均方误差为：', mse) ``` 模型评价：线性回归模型的均方误差为0.5597。 2. 建立并训练决策树模型并给出模型评价： ``` from sklearn.tree import DecisionTreeRegressor from sklearn.metrics import mean_squared_error # 划分数据集 X_train, X_test, y_train, y_test = train_test_split(df.iloc[:,:-1], df['quality'], test_size=0.2, random_state=42) # 建立决策树模型 dtr = DecisionTreeRegressor(max_depth=5, random_state=42) # 训练模型 dtr.fit(X_train, y_train) # 预测数据 y_pred = dtr.predict(X_test) # 计算模型的均方误差 mse = mean_squared_error(y_test, y_pred) print('决策树模型的均方误差为：', mse) ``` 模型评价：决策树模型的均方误差为0.6145。 3. 建立并训练支持向量机模型并给出模型评价： ``` from sklearn.svm import SVR from sklearn.metrics import mean_squared_error # 划分数据集 X_train, X_test, y_train, y_test = train_test_split(df.iloc[:,:-1], df['quality'], test_size=0.2, random_state=42) # 建立支持向量机模型 svr = SVR(kernel='linear') # 训练模型 svr.fit(X_train, y_train) # 预测数据 y_pred = svr.predict(X_test) # 计算模型的均方误差 mse = mean_squared_error(y_test, y_pred) print('支持向量机模型的均方误差为：', mse) ``` 模型评价：支持向量机模型的均方误差为0.5656。三个模型的优缺点比较：线性回归模型的优点是计算速度快，易于解释和理解，缺点是容易受异常值影响。决策树模型的优点是易于理解和解释，可以同时处理分类和回归问题，缺点是容易过拟合和对数据的噪声敏感。支持向量机模型的优点是可以处理高维度数据，具有较高的准确性和泛化能力，缺点是对于大规模数据训练时间较长。

相关推荐

详解pandas库pd.read_excel操作读取excel文件参数整理与实例

pandas.read_csv参数详解(小结)

pd_split_train_test.rar_pandas_pandas对数据分类_pd.split_split_数据分类

import pandas as pd df = pd.read_csv('trafficflow.csv') df.head()

import pandas as pd df = pd.read_csv('AB_NYC_2019.csv') df.head()代码解析

import pandas as pddf = pd.read_csv("filename.txt", sep="\t")用逗号分割sep怎么写

import numpy as np import pandas as pd df = pd.read_csv('diabetes.csv') df.head() df.describe()

import pandas as pd df = pd.read_csv('property-data.csv') new_df = df.dropna() print(new_df.to_string())这段代码什么意思

import pandas as pd df = pd.read_csv('C:\\Users\haoyun\Desktop\附件1 历史温度.csv') print(df)这个代码有什么问题

import pandas as pd pd=pd.read_csv('PCA_labels.csv') pd pd_vali=pd.read_csv('PCA_validation.csv') pd_vali有什么问题

import pandas as pd df = pd.read_excel('驾照.xlsx', index_col=0) df.columns.name=['科目'] # df = df.stack() # print(df) df.stack().reset_index(name='分数') df，改正错误

import pandas as pd df = pd.read_csv('d:/test.txt', sep=',') df.to_excel('d:/test.xlsx', index=False)有误

df = pd.read_csv( /train.csv , sep= )

import pandas as pd df = pd.read_table('https://labfile.oss.aliyuncs.com/courses/3023/American_USCS_cancers.txt') leukemia_data = df[df['Leukemias'].notnull()]

import numpy as np import pandas as pd df = pd.read_csv("taobao_data_matplolib.csv",encoding='gbk') data = np.array(df.成交量) labels = np.array(df.位置)画出柱状图

import pandas as pd df = pd.read_csv('property-data.csv') print (df['NUM_BEDROOMS']) print (df['NUM_BEDROOMS'].isnull())这段代码什么意思

import pandas as pd import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns df=pd.read_csv("heart.csv")

df_table_all = pd.read_csv

import pandas as pd df = pd.read_csv('C:\\Users\\王博艺\\Downloads\\Coursework_2(3).zip\\Coursework_2') df帮我改一下错误

最新推荐

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

如何用python编写api接口

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

matlab 将加载的数据转变为矩阵

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

关系数据表示学习