读取数据集,提取特征数据与标签数据,并绘制数据集散点图 xArr,yArr = loadDataSet('ex0.txt')
时间: 2024-02-23 19:01:23 浏览: 69
读多个数据集提取特征
好的,我会按照您的要求回答问题。
首先,我们需要定义一个函数来读取数据集,提取特征数据和标签数据。以下是这个函数的实现:
```python
def loadDataSet(filename):
xArr = []
yArr = []
with open(filename) as f:
for line in f.readlines():
lineArr = line.strip().split('\t')
xArr.append([1.0, float(lineArr[0])])
yArr.append(float(lineArr[1]))
return xArr, yArr
```
接下来,我们可以使用这个函数来加载数据集:
```python
xArr, yArr = loadDataSet('ex0.txt')
```
最后,我们可以使用 matplotlib 库来绘制数据集的散点图:
```python
import matplotlib.pyplot as plt
plt.scatter([x[1] for x in xArr], yArr)
plt.show()
```
完整的代码如下所示:
```python
import matplotlib.pyplot as plt
def loadDataSet(filename):
xArr = []
yArr = []
with open(filename) as f:
for line in f.readlines():
lineArr = line.strip().split('\t')
xArr.append([1.0, float(lineArr[0])])
yArr.append(float(lineArr[1]))
return xArr, yArr
xArr, yArr = loadDataSet('ex0.txt')
plt.scatter([x[1] for x in xArr], yArr)
plt.show()
```
执行这段代码,会生成一个散点图,显示数据集的分布情况。
阅读全文