df = pd.DataFrame({'file':glob.glob('custom/*/*.mp4')}) df ['cls'] = df.file.apply(lambda x:int(x.split('/')[-2].split('_')[1]))
时间: 2023-09-30 09:03:00 浏览: 59
pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例
5星 · 资源好评率100%
这段代码创建了一个 Pandas DataFrame 对象 df,其中包含了一个名为 file 的列,该列使用 glob 函数遍历 "custom/*/*.mp4" 所匹配的所有文件路径,然后将其存储到 DataFrame 对象的 file 列中。另外,代码还添加了一个名为 cls 的列,该列使用 apply 方法对 file 列中的每个文件路径进行处理,首先使用 split 函数将其拆分成多个子字符串,然后取出文件路径中倒数第二个子字符串,并使用 split 函数将其拆分成多个子字符串,最后取出该子字符串的第二个元素,并将其转换为整数类型。这样就可以从文件路径中提取出类别信息,并将其存储到 DataFrame 对象的 cls 列中。
阅读全文