def standRegres(xArr,yArr): xMat = mat(xArr); yMat = mat(yArr).T xTx = xMat.TxMat#计算xTx if linalg.det(xTx) == 0.0:#判断行列式是否为0 print("This matrix is singular, cannot do inverse") return ws = xTx.I * (xMat.TyMat)#计算回归系数 return ws from numpy import * def loadDataSet(fileName): #general function to parse tab -delimited floats numFeat = len(open(fileName).readline().split('\t')) - 1 #get number of fields dataMat = []; labelMat = [] fr = open(fileName) for line in fr.readlines(): lineArr =[] curLine = line.strip().split('\t') for i in range(numFeat): lineArr.append(float(curLine[i])) dataMat.append(lineArr) labelMat.append(float(curLine[-1])) return dataMat,labelMat ##测试线性回归 xArr,yArr=loadDataSet('ex0.txt') xArr[0:2] ws=standRegres(xArr,yArr)#计算回归系数 xMat=mat(xArr) yMat=mat(yArr) #绘散点图 import matplotlib.pyplot as plt fig=plt.figure() ax=fig.add_subplot(111) ax.scatter(xMat[:,1].flatten().A[0],yMat.T[:,0].flatten().A[0])#.A转变为数组 xCopy=xMat.copy() xCopy.sort(0)#维度,行排序 yHat=xCopyws ax.plot(xCopy[:,1],yHat) plt.show #求预测值和真实值的相关系数 yHat1=xMatws corrcoef(yHat1.T,yMat) 如何处理ex0.txt里的文件不出现could not convert string to float: 'M,0.455,0.365,0.095,0.514,0.2245,0.101,0.15,15'的报错
时间: 2023-06-18 14:03:07 浏览: 233
您可以尝试使用 `open()` 函数打开文件时指定文件的编码方式,例如:
```python
fr = open(fileName, encoding='utf-8')
```
如果您不确定文件的编码方式,可以使用 `chardet` 库来自动检测文件编码方式,例如:
```python
import chardet
with open(fileName, 'rb') as f:
result = chardet.detect(f.read())
fr = open(fileName, encoding=result['encoding'])
```
这样可以避免出现无法将字符串转换为浮点数的错误。
相关问题
def standRegres(xArr,yArr): xMat = mat(xArr); yMat = mat(yArr).T xTx = xMat.T*xMat#计算xTx if linalg.det(xTx) == 0.0:#判断行列式是否为0 print("This matrix is singular, cannot do inverse") return ws = xTx.I * (xMat.T*yMat)#计算回归系数 return ws from numpy import * def loadDataSet(fileName): #general function to parse tab -delimited floats numFeat = len(open(fileName).readline().split('\t')) - 1 #get number of fields dataMat = []; labelMat = [] fr = open(fileName) for line in fr.readlines(): lineArr =[] curLine = line.strip().split('\t') for i in range(numFeat): lineArr.append(float(curLine[i])) dataMat.append(lineArr) labelMat.append(float(curLine[-1])) return dataMat,labelMat ##测试线性回归 xArr,yArr=loadDataSet('ex0.txt') xArr[0:2] ws=standRegres(xArr,yArr)#计算回归系数 xMat=mat(xArr) yMat=mat(yArr) #绘散点图 import matplotlib.pyplot as plt fig=plt.figure() ax=fig.add_subplot(111) ax.scatter(xMat[:,1].flatten().A[0],yMat.T[:,0].flatten().A[0])#.A转变为数组 xCopy=xMat.copy() xCopy.sort(0)#维度,行排序 yHat=xCopy*ws ax.plot(xCopy[:,1],yHat) plt.show #求预测值和真实值的相关系数 yHat1=xMat*ws corrcoef(yHat1.T,yMat) 如何处理ex0.txt里的文件不出现could not convert string to float: 'M,0.455,0.365,0.095,0.514,0.2245,0.101,0.15,15'的报错
这个报错意味着你的代码无法将文件中的字符串转换为浮点数。这是因为在ex0.txt中,每行最后一个字段是一个字符串,而不是一个浮点数。你需要确保将该字段排除在读取数据的过程中。你可以修改loadDataSet函数,如下所示:
```python
def loadDataSet(fileName):
# general function to parse tab-delimited floats
dataMat = []
labelMat = []
fr = open(fileName)
for line in fr.readlines():
lineArr = line.strip().split('\t')
# 将最后一个字段排除在数据中
lineArr = [float(lineArr[i]) for i in range(len(lineArr)-1)]
dataMat.append(lineArr)
labelMat.append(float(lineArr[-1]))
return dataMat, labelMat
```
这样,你就可以成功读取数据并进行回归分析了。
帮我看看哪里有错误,代码#利用局部加权线性回归函数,对数据集xArr中的每一个样本点进行预测,并绘制预测折线图与原数据散点图的叠加图 #step1:绘制原数据散点图 xArr,yArr = loadDataSet('ex0.txt') plt.scatter(array(xArr)[:,1],array(yArr)) #step2: 绘制拟合线(局部加权线性回归) yHat = array(xArr)[:,1].argsort(0) xSort = array(xArr)[srtInd] yHat =lwlrTest(xSort, xArr, yArr,k=0.01) plt.plot(xSort[:,1], yHat, c='blue')
代码中有一些错误,可能是因为缺少了一些导入模块的语句,或者是函数调用参数的错误。以下是修正后的代码:
```python
import matplotlib.pyplot as plt
from numpy import *
# 加载数据集
def loadDataSet(filename):
dataMat = []
labelMat = []
fr = open(filename)
for line in fr.readlines():
lineArr = line.strip().split('\t')
dataMat.append([1.0, float(lineArr[0])])
labelMat.append(float(lineArr[1]))
return dataMat, labelMat
# 局部加权线性回归函数
def lwlr(testPoint, xArr, yArr, k=1.0):
xMat = mat(xArr)
yMat = mat(yArr).T
m = shape(xMat)[0]
weights = mat(eye((m)))
for j in range(m):
diffMat = testPoint - xMat[j,:]
weights[j,j] = exp(diffMat * diffMat.T / (-2.0 * k**2))
xTx = xMat.T * (weights * xMat)
if linalg.det(xTx) == 0.0:
print("This matrix is singular, cannot do inverse")
return
ws = xTx.I * (xMat.T * (weights * yMat))
return testPoint * ws
# 测试局部加权线性回归函数
def lwlrTest(testArr, xArr, yArr, k=1.0):
m = shape(testArr)[0]
yHat = zeros(m)
for i in range(m):
yHat[i] = lwlr(testArr[i], xArr, yArr, k)
return yHat
# 绘制原数据散点图
xArr, yArr = loadDataSet('ex0.txt')
plt.scatter(array(xArr)[:,1], array(yArr))
# 绘制拟合线(局部加权线性回归)
srtInd = array(xArr)[:,1].argsort(0)
xSort = array(xArr)[srtInd]
yHat = lwlrTest(xSort, xArr, yArr, k=0.01)
plt.plot(xSort[:,1], yHat, c='blue')
plt.show()
```
请注意,这里我添加了几个函数,包括 `lwlr`、`lwlrTest` 和 `loadDataSet`,这些函数都是局部加权线性回归的相关函数,需要在代码中定义。此外,我还添加了一些导入模块的语句,确保这些模块可以正确加载。最后,我添加了一个 `plt.show()` 语句,以便将绘图显示在屏幕上。
阅读全文