分别加载鸢尾花数据集文件, iris.csv,iris.data (1)输出花萼的长度和花瓣的长度这两个特征列
时间: 2024-09-06 07:03:06 浏览: 42
iris.data.csv:鸢尾花csv格式数据集,用于机器学习训练的经典数据集。
为了分别加载鸢尾花数据集文件`iris.csv`和`iris.data`并输出花萼的长度和花瓣的长度这两个特征列,我们可以使用Python的Pandas库,因为它非常适合处理表格数据。以下是使用Pandas加载数据并提取特定列的步骤:
**对于`iris.csv`文件:**
```python
import pandas as pd
# 加载CSV文件
data_iris_csv = pd.read_csv('iris.csv')
# 提取花萼长度(sepal_length)和花瓣长度(petal_length)列
feature_columns_csv = ['sepal_length', 'petal_length']
flower_lengths_csv = data_iris_csv[feature_columns_csv]
print(flower_lengths_csv)
```
**对于`iris.data`文件(假设是一个逗号分隔值的文本文件):**
```python
# 由于这是一个文本文件,通常没有直接的read_csv函数,需要先读入文本然后分割
with open('iris.data', 'r') as file:
lines = file.readlines()
# 将数据分为行和特征,假设每行由四个数值表示(花萼长度,花萼宽度,花瓣长度,花瓣宽度)
data_rows = [line.strip().split(',')[:4] for line in lines]
data_iris_data = pd.DataFrame(data_rows, columns=['sepal_length', 'sepal_width', 'petal_length', 'petal_width'])
# 提取相同的两个特征列
flower_lengths_data = data_iris_data[['sepal_length', 'petal_length']]
print(flower_lengths_data)
```
在运行上述代码后,你会得到包含花萼长度和花瓣长度的DataFrame。
阅读全文