代码实现数据集中训练样本数量显示
时间: 2024-10-13 12:05:22 浏览: 33
数据挖掘领域十大算法代码实现KNN.rar
在数据集的准备阶段,如果你使用了Pandas DataFrame或者PyTorch的Dataset类来存储数据,你可以通过简单地访问DataFrame的长度或Dataset的`__len__`方法来获取训练样本的数量。这里是一个简单的例子:
```python
import pandas as pd
from torch.utils.data import Dataset
# 假设你有一个Pandas DataFrame df
train_dataset = pd.DataFrame(df)
# 或者你有一个自定义的PyTorch Dataset类
class CustomDataset(Dataset):
def __init__(self, data):
self.data = data
self.length = len(data)
custom_dataset = CustomDataset(data)
# 显示训练样本数量
print("训练样本数量:", len(train_dataset) or custom_dataset.length)
```
在这个例子中,无论你是用Pandas还是自定义的PyTorch Dataset,都可以直接计算出训练样本的数量。如果数据集非常大,可以直接取length可能会消耗较多内存,这时你可以选择只读取部分数据并计算长度。
阅读全文