import pandas as pd from sklearn.linear_model import LinearRegression # 读取 EXCEL 文件 df = pd.read_excel('D://数据1.xlsx', sheet_name='8') # 取出训练数据 X_train = df.iloc[:, :-1] y_train = df.iloc[:, -1] # 初始化线性回归模型 lr = LinearRegression() # 训练模型 lr.fit(X_train, y_train) # 预测数据 X_test = [[0, 0, 1, 0, 1, 1, 1, 2]] y_pred = lr.predict(X_test) # 输出预测结果 print('预测结果：', y_pred[0])运行一个线性回归模型时遇到了 TypeError。错误信息提示说，特征名只在所有输入特征都具有字符串名称/列名称类型时受支持，但你的输入具有整数和字符串特征名/列名称类型。如果你想要存储和验证特征名，必须将它们全部转换为字符串，例如使用 X.columns = X.columns.astype(str)。否则，你可以从输入数据中删除特征/列名称，或将它们全部转换为非字符串数据类型怎么改

时间: 2024-02-16 22:03:37 浏览: 79

你可以将以下代码添加到读取 EXCEL 文件后面，以将所有特征名转换为字符串类型： ``` df.columns = df.columns.astype(str) ``` 这将确保所有特征名都是字符串类型，从而解决 TypeError。完整代码如下： ``` import pandas as pd from sklearn.linear_model import LinearRegression # 读取 EXCEL 文件 df = pd.read_excel('D://数据1.xlsx', sheet_name='8') # 将所有特征名转换为字符串类型 df.columns = df.columns.astype(str) # 取出训练数据 X_train = df.iloc[:, :-1] y_train = df.iloc[:, -1] # 初始化线性回归模型 lr = LinearRegression() # 训练模型 lr.fit(X_train, y_train) # 预测数据 X_test = [[0, 0, 1, 0, 1, 1, 1, 2]] y_pred = lr.predict(X_test) # 输出预测结果 print('预测结果：', y_pred[0]) ```

import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression from sklearn.metrics import r2_score df = pd.read_csv('train_price.csv') # 筛选bodyType为'微型车'的样本 df = df[df['bodyType'] == '微型车'] # 选择price作为目标变量,yearMade、modelId作为特征变量 X = df[['yearMade', 'modelId']] y = df['price'] # 使用train_test_split划分,random_state为学号后4位 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1234) # 训练线性回归模型 lr = LinearRegression() lr.fit(X_train, y_train) # 预测测试样本并计算R2 y_pred = lr.predict(X_test) r2 = r2_score(y_test, y_pred) print('R2值为:', r2)

这段代码是用来训练一个简单的线性回归模型，对微型车的价格进行预测，并计算预测结果的R2值。其中使用了pandas库读取CSV文件，使用train_test_split函数将数据集划分为训练集和测试集，使用LinearRegression类创建一个线性回归模型，并使用fit方法对训练数据进行拟合，使用predict方法对测试数据进行预测，并使用r2_score函数计算预测结果的R2值。

# 导入需要的库import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.svm import SVCfrom sklearn.metrics import accuracy_score, confusion_matrix# 读取 Excel 表格数据df = pd.read_excel('data.xlsx')# 分离特征变量和因变量X = df.iloc[:, :-1]y = df.iloc[:, -1]# 将数据分为训练集和验证集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)# 训练支持向量机模型svm = SVC(kernel='linear')svm.fit(X_train, y_train)# 预测新的数据new_data = pd.read_excel('new_data.xlsx')y_pred = svm.predict(new_data)# 输出预测结果到 Excel 表格new_data['Prediction'] = y_prednew_data.to_excel('predictions.xlsx', index=False)# 输出模型精度和混淆矩阵print('Accuracy:', accuracy_score(y_test, svm.predict(X_test)))print('Confusion Matrix:', confusion_matrix(y_test, svm.predict(X_test)))输出混淆矩阵图片

由于我是一个文本AI模型，无法在这里直接输出图片，但是可以通过代码生成并保存混淆矩阵图片，代码如下： ```python import matplotlib.pyplot as plt import seaborn as sns import pandas as pd from sklearn.metrics import confusion_matrix # 读取 Excel 表格数据 df = pd.read_excel('data.xlsx') # 分离特征变量和因变量 X = df.iloc[:, :-1] y = df.iloc[:, -1] # 将数据分为训练集和验证集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2) # 训练支持向量机模型 svm = SVC(kernel='linear') svm.fit(X_train, y_train) # 预测新的数据 new_data = pd.read_excel('new_data.xlsx') y_pred = svm.predict(new_data) # 输出预测结果到 Excel 表格 new_data['Prediction'] = y_pred new_data.to_excel('predictions.xlsx', index=False) # 输出模型精度和混淆矩阵 print('Accuracy:', accuracy_score(y_test, svm.predict(X_test))) confusion = confusion_matrix(y_test, svm.predict(X_test)) print('Confusion Matrix:', confusion) # 生成混淆矩阵图片并保存 plt.figure(figsize=(8, 6)) sns.heatmap(confusion, annot=True, cmap='Blues') plt.xlabel('Predicted Label') plt.ylabel('True Label') plt.title('Confusion Matrix') plt.savefig('confusion_matrix.png') ``` 这段代码会在运行时生成一个名为 `confusion_matrix.png` 的图片文件，保存在当前工作目录下。你可以打开该文件查看混淆矩阵图片。

阅读全文

相关推荐

python 常用 示例 数据 train.csv eval.csv titanic.csv

Python分析与可视化案例源代码-二手房数据分析预测系统

Data_Analysis_Practices:数据分析实战

使用Scikit-learn自带的逻辑回归算法解决“marks. csv”中根据两门入学考试成绩预测是否被学校录取的问题。 marks_df = pd.read_csv(“marks. csv”) 性能指标： from sklearn.metrics import accuracy_score accuracy_score(y_true, y_pred)

大家在看

chessClock:一个简单的Arduino Chess Clock，带有3个按钮和LCD 240X320屏幕

学堂云《信息检索与科技写作》单元测试考核答案

【蒙特卡洛模拟】这个项目旨在通过强化学习和蒙特卡洛模拟的结合，解决银行购买股票的最优策略和预期利润折现率的问题KL.zip

码垛机器人说明书

《智能调度集中系统暂行技术条件》.pdf

最新推荐

基于OpenCV的人脸识别小程序.zip

精选毕设项目-宅男社区.zip

免安装JDK 1.8.0_241：即刻配置环境运行

管理建模和仿真的文件

【提升效率与稳定性】：深入掌握单相整流器的控制策略

你看这是ashx映射的cs文件初始代码,你看这里边根本就没有写对action参数进行任何操作但你.ashx?action=submit这样去做他就能返回出数据这是为什么

机器学习预测葡萄酒评分：二值化品尝笔记的应用

"互动学习：行动中的多样性与论文攻读经历"

【单相整流器终极指南】：电气工程师的20年实用技巧大揭秘

OxyPlot CategoryAxis

python 常用示例数据 train.csv eval.csv titanic.csv