#将 UTTRANSINFO.txt 文件转成了 CSV 的形式 def loadDataSet(test_dir): f = open(test_dir,'r',encoding='utf-8') fname ='ts.csv' with open(fname,'w') as fine: for line in f.readlines(): line1 =line.split() PROMPT=line1[3] linew = PROMPT+"\n" fine.write(linew)
时间: 2024-01-03 15:02:58 浏览: 119
这个函数是用来将一个名为 UTTRANSINFO.txt 的文件转换成 CSV 格式的函数。它首先打开 UTTRANSINFO.txt 文件,然后创建一个名为 ts.csv 的新文件。接着,它读取 UTTRANSINFO.txt 文件的每一行,将其分割成一个列表 line1,其中第四个元素是需要提取的信息。然后将该信息写入到 ts.csv 文件中。最后,该函数返回生成的 CSV 文件。
相关问题
def loadDataSet(test_dir): f = open(test_dir,'r',encoding='utf-8') fname ='ts.csv' with open(fname,'w') as fine: for line in f.readlines(): line1 =line.split() PROMPT=line1[3] linew = PROMPT+"\n" fine.write(linew)
这段代码的作用是从指定目录中加载数据集,并将数据集中的一列保存到一个新的文件中。具体来说,loadDataSet 函数接收一个指定目录的参数 test_dir,然后打开这个目录中的文件,并将文件中的每一行按空格进行分割,取出第四列的数据(即 PROMPT),并将其保存到一个新的文件中。新文件的文件名为 ts.csv,使用 with open 语句打开文件,然后使用 write 函数将数据写入文件中。最后返回一个包含 PROMPT 数据的列表。需要注意的是,这段代码中并没有关闭文件的操作,需要手动进行关闭。
#创建一个dataset类。 import os import pandas as pd from torchvision.io import read_image from torch.utils.data import Dataset from torch.utils.data import DataLoader import chardet with open(r'C:\Users\WXF\data\cifar10\cifar-10-batches-py\batches.meta', 'rb') as fp: result = chardet.detect(fp.read()) print(result) class CustomImageDataset(Dataset): def __init__(self, annotations_file, img_dir, transform=None, target_transform=None): #self.img_labels = pd.read_csv(annotations_file, sep=' ', header=None, encoding=result['encoding']) self.img_labels = pd.read_csv(annotations_file, sep=';', header=None, encoding=result['encoding']) self.img_labels[0] = self.img_labels[0].astype(str).str.cat(sep=' ') # 合并第一列为完整文件名 self.img_dir = img_dir self.transform = transform self.target_transform = target_transform def __len__(self): return len(self.img_labels) def __getitem__(self, idx): img_path = os.path.join(self.img_dir, self.img_labels.iloc[idx, 0]) image = read_image(img_path) label = self.img_labels.iloc[idx, 1] if self.transform: image = self.transform(image) if self.target_transform: label = self.target_transform(label) return image, label train_dataset = CustomImageDataset(annotations_file=r'C:\Users\WXF\data\cifar10\cifar-10-batches-py\batches.meta', img_dir = r'C:\Users\WXF\data\cifar10\cifar-10-batches-py\data_batch_1',transform=None, target_transform=None) test_dataset = CustomImageDataset(annotations_file=r'C:\Users\WXF\data\cifar10\cifar-10-batches-py\batches.meta', img_dir = r'C:\Users\WXF\data\cifar10\cifar-10-batches-py\test_batch',transform=None, target_transform=None) train_features, train_labels = next(iter(train_dataloader)) print(f"Feature batch shape: {train_features.size()}") print(f"Labels batch shape: {train_labels.size()}") img = train_features[0].squeeze() label = train_labels[0] plt.imshow(img, cmap="gray") plt.show() print(f"Label: {label}")
这段代码创建了一个自定义的图像数据集类 CustomImageDataset,用于读取 CIFAR-10 数据集中的图像数据和标签。该类继承了 PyTorch 中的 Dataset 类,并实现了 __init__、__len__ 和 __getitem__ 方法。其中,__init__ 方法用于初始化数据集,__len__ 方法返回数据集中样本的数量,__getitem__ 方法返回给定索引的图像数据和标签。在代码中,使用 pandas 库读取 CIFAR-10 数据集中的标签文件,然后根据文件名和路径读取图像数据,并将其返回。
此外,代码还创建了两个数据集对象 train_dataset 和 test_dataset,分别用于训练和测试。最后,使用 PyTorch 中的 DataLoader 类加载数据集对象,生成用于训练模型的数据批次。代码还展示了如何读取数据批次中的图像数据和标签,并使用 matplotlib 库显示图像和标签。
阅读全文
相关推荐
![py](https://img-home.csdnimg.cn/images/20250102104920.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![rar](https://img-home.csdnimg.cn/images/20241231044955.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)