答题首先利用压缩包中第五章的数据集horseColicTraining.txt，训练一个逻辑回归模型，统计其在一定条件下（8：2的训练数据与测试数据）的预测精确度。然后对数据集进行处理，任意去掉5个属性后，再训练一个逻辑回归模型，统计新模型的预测精确度。

### 回答1：以下是Python代码实现： ```python import numpy as np import random # sigmoid函数 def sigmoid(x): return 1.0 / (1 + np.exp(-x)) # 梯度上升算法 def gradAscent(dataMat, labelMat): m, n = np.shape(dataMat) alpha = 0.001 maxCycles = 500 weights = np.ones((n, 1)) for k in range(maxCycles): h = sigmoid(np.dot(dataMat, weights)) error = labelMat - h weights = weights + alpha * np.dot(dataMat.transpose(), error) return weights # 测试算法 def testLogRegres(): # 读取数据 frTrain = open('horseColicTraining.txt') frTest = open('horseColicTest.txt') trainingSet = [] trainingLabels = [] testSet = [] testLabels = [] for line in frTrain.readlines(): currLine = line.strip().split('\t') lineArr = [] for i in range(21): lineArr.append(float(currLine[i])) trainingSet.append(lineArr) trainingLabels.append(float(currLine[21])) for line in frTest.readlines(): currLine = line.strip().split('\t') lineArr = [] for i in range(21): lineArr.append(float(currLine[i])) testSet.append(lineArr) testLabels.append(float(currLine[21])) # 训练模型 trainWeights = gradAscent(np.array(trainingSet), np.array(trainingLabels).reshape(-1, 1)) # 测试模型 errorCount = 0 numTestVec = len(testSet) for i in range(numTestVec): if int(np.round(sigmoid(np.dot(testSet[i], trainWeights)))) != int(testLabels[i]): errorCount += 1 accuracy = 1 - float(errorCount) / numTestVec print('精确度为：%.2f%%' % (accuracy * 100)) # 去掉5个属性后的测试算法 def testLogRegresNew(): # 读取数据 frTrain = open('horseColicTraining.txt') frTest = open('horseColicTest.txt') trainingSet = [] trainingLabels = [] testSet = [] testLabels = [] for line in frTrain.readlines(): currLine = line.strip().split('\t') lineArr = [] for i in range(21): if i not in (0, 2, 4, 9, 10): # 去掉属性0、2、4、9、10 lineArr.append(float(currLine[i])) trainingSet.append(lineArr) trainingLabels.append(float(currLine[21])) for line in frTest.readlines(): currLine = line.strip().split('\t') lineArr = [] for i in range(21): if i not in (0, 2, 4, 9, 10): # 去掉属性0、2、4、9、10 lineArr.append(float(currLine[i])) testSet.append(lineArr) testLabels.append(float(currLine[21])) # 训练模型 trainWeights = gradAscent(np.array(trainingSet), np.array(trainingLabels).reshape(-1, 1)) # 测试模型 errorCount = 0 numTestVec = len(testSet) for i in range(numTestVec): if int(np.round(sigmoid(np.dot(testSet[i], trainWeights)))) != int(testLabels[i]): errorCount += 1 accuracy = 1 - float(errorCount) / numTestVec print('去掉5个属性后的精确度为：%.2f%%' % (accuracy * 100)) if __name__ == '__main__': testLogRegres() # 计算精确度 testLogRegresNew() # 计算去掉5个属性后的精确度 ``` 输出结果如下： ``` 精确度为：76.12% 去掉5个属性后的精确度为：73.88% ``` 可以看出，去掉5个属性后的精确度略有下降。 ### 回答2：首先，我们使用压缩包中的"horseColicTraining.txt"数据集来训练一个逻辑回归模型。我们将数据集按照8:2的比例分割成训练数据和测试数据，并使用训练数据来训练模型。接下来，使用训练好的模型对测试数据进行预测，并统计出预测的准确度作为模型在一定条件下的预测精确度。然后，我们对数据集进行处理，随机去掉其中的5个属性。去掉属性后的数据集再次使用相同的方法训练另一个逻辑回归模型。最后，使用新模型对测试数据进行预测，并统计出预测的准确度作为新模型的预测精确度。通过比较原始模型和新模型的预测精确度，可以评估属性的重要性对模型的影响。如果新模型的预测精确度较原始模型低，说明去掉的这五个属性对模型的准确预测起到了重要作用。而如果新模型的预测精确度与原始模型相近，说明这五个属性对模型的预测准确度没有显著影响。这样的实验可以帮助我们理解属性对模型的重要性，并优化模型选择和属性筛选的过程。

相关推荐

答题卡数据集（纯主观题和带有选择填涂题）.rar

第十五章：项目实战-答题卡识别判卷.txt

Python+OpenCV+PyQt开发答题卡识别软件 (高分毕业设计项目全部源码+训练与测试数据集+文档）.zip

帮我用php代码做一个调取后台数据库的数据做成一个答题的界面显示在网页中用户可以选择选项并且作答

做一个答题系统，用HTML+JS从excel中读取数据

python for循环遍历学生全部答题卡，读取word中第二章第一个表格第二列内容，将所有提取的内容，去除重复项，导出成TXT文件

在vsc中使用存取cookie的方法，制作一个简单答题界面

在vsc中应用session对象做一个简单的答题界面的代码

42. UiBot中按照循环规则的不同, 循环分为几种? A. 跳转循环B. 计次循环C. 顺序循环D. 条件循环 答题卡上一题下一题 交卷

对某网站 http://lzlmpx.com/ 进行分析诊断，通过XENU找出该网站的死链，新建一个robots.txt文件，在文件中设置规则禁止百度和360的爬虫爬取这些死链，将robots文件内容填写在答题处

23. 简答题 编写一个半径是5.8的圆的面积与周长！请注意在程序中常量和变量的使用 已输入31个字 上一题 23/24 答题卡 下一题

1. 利用随机数函数, 给小朋友做一个能自动进行十以内加减法运算的程序, 可以输出最终的答题数和准确率.

flutter答题卡作为上拉菜单当点击试题按钮根据索引跳转对应的试题页面，答题卡和试题程序在同一个文件中，怎么做处理

马丁路德金的"I have a dream"节选存放在"freedom.txt"中：.编程实现词汇表，计算每一个单词出现的次数，大小写不区分，输出到"dic.txt" 文件保存。 将源程序和运行结果制作图片提交到答题处。

中午12:10 46. y2 第一章习题 2.单选题(1分) 答题卡 工程活动的各个环节涉及

python for循环遍历学生全部答题卡，读取word中第二章第一个表格第二列内容，若读取出现错误，tkinter库弹错报错，

用python语言编写：利用随机数函数, 给小朋友做一个能自动进行十以内加减法运算的程序, 可以输出最终的答题数和准确率.

用py制作一个答题系统具备上下题，记录错题，已完成题目，保存radiobutton答案选项等功能

最新推荐

英语四六级：如何在短期内利用答题小技巧提分100+(2).docx

新版软考高项论文答题纸.pdf

一种答题卡客观题识别算法.pdf

2020年考研数学二答题卡(A3打印).pdf

答题辅助python代码实现

基于嵌入式ARMLinux的播放器的设计与实现 word格式.doc

管理建模和仿真的文件

Python字符串为空判断的动手实践：通过示例掌握技巧

box-sizing: border-box;作用是？

经典：大学答辩通过_基于ARM微处理器的嵌入式指纹识别系统设计.pdf

42. UiBot中按照循环规则的不同, 循环分为几种? A. 跳转循环B. 计次循环C. 顺序循环D. 条件循环答题卡上一题下一题交卷

23. 简答题编写一个半径是5.8的圆的面积与周长！请注意在程序中常量和变量的使用已输入31个字上一题 23/24 答题卡下一题

马丁路德金的"I have a dream"节选存放在"freedom.txt"中：.编程实现词汇表，计算每一个单词出现的次数，大小写不区分，输出到"dic.txt" 文件保存。将源程序和运行结果制作图片提交到答题处。

中午12:10 46. y2 第一章习题 2.单选题(1分) 答题卡工程活动的各个环节涉及