python读取csv文件数据用于建立训练集和测试集,csv文件共有187个样本,样本数据的前5列为特征,第六列为标签,写代码
时间: 2024-04-11 13:28:27 浏览: 168
当然,我可以帮你写代码来读取CSV文件并创建训练集和测试集。以下是一个示例代码:
```python
import csv
from sklearn.model_selection import train_test_split
# 设置CSV文件路径
csv_file = 'path/to/your/csv/file.csv'
# 读取CSV文件
data = []
with open(csv_file, 'r') as file:
csv_reader = csv.reader(file)
# 跳过表头
next(csv_reader)
# 读取数据行
for row in csv_reader:
data.append(row)
# 将特征和标签分离
features = [row[:5] for row in data]
labels = [row[5] for row in data]
# 划分训练集和测试集
train_features, test_features, train_labels, test_labels = train_test_split(features, labels, test_size=0.2, random_state=42)
# 打印训练集和测试集的大小
print("训练集大小:", len(train_features))
print("测试集大小:", len(test_features))
```
以上代码使用了Python的csv模块来读取CSV文件,并使用sklearn库中的train_test_split函数将数据划分为训练集和测试集。请确保将`'path/to/your/csv/file.csv'`替换为你实际的CSV文件路径。还可以根据需要调整`test_size`参数来控制训练集和测试集的比例。
阅读全文