首先,使用open函数打开文件,并使用readlines函数读取文件的所有行。 使用len函数和split函数获取每行数据的特征数量numFeat。 创建空的数据矩阵和标签向量dataMat和labelMat。 遍历文件的每一行,使用strip函数和split函数获取当前行的特征值和标签。 将特征值转换为浮点数,并添加到lineArr列表中。 将lineArr添加到dataMat中,并将标签值添加到labelMat中。 返回dataMat和labelMat。python代码
时间: 2023-06-18 18:03:23 浏览: 108
下面是代码示例:
```python
def loadDataSet(filename):
with open(filename) as f:
lines = f.readlines()
numFeat = len(lines[0].strip().split('\t')) - 1
dataMat = []
labelMat = []
for line in lines:
lineArr = []
curLine = line.strip().split('\t')
for i in range(numFeat):
lineArr.append(float(curLine[i]))
dataMat.append(lineArr)
labelMat.append(float(curLine[-1]))
return dataMat, labelMat
```
在这个示例中,我们假设文件中的每行数据以制表符分隔,并且标签值位于每行数据的最后一列。我们首先使用open函数打开文件,并使用readlines函数读取所有行。接下来,我们使用len函数和split函数获取每行数据的特征数量numFeat。然后,我们创建空的数据矩阵dataMat和标签向量labelMat。接下来,我们遍历文件的每一行,并使用strip函数和split函数获取当前行的特征值和标签。我们将特征值转换为浮点数,并添加到lineArr列表中。最后,我们将lineArr添加到dataMat中,并将标签值添加到labelMat中。最终,我们返回dataMat和labelMat。
阅读全文