import pandas as pd download = pd.read_csv('E:\pyjupthon/使用pandaas进行数据预处理/user_all_info.csv', index_col=0,encoding'gbk',engine='python') #方法一 #定义去重函数 def del_rep(list1):#定义一个函数del_rep,接受一个列表参数list1 list2 = []定义一个空列表 for i in list1: if i not in list2: list2.append(i) return list2 #去重 #将下载意愿从数据框提取出来 download = list(download['是否愿意下载']) print('去重前下载意愿选项总数为:',len(download)) download_rep = del_rep(download)#使用自定义的函数去重 print('使用方法一去重后下载意愿选项总数为:’,len(download_rep)) print('用户选项为:',download_rep)
时间: 2023-12-06 10:45:33 浏览: 96
快速解决pandas.read_csv()乱码的问题
5星 · 资源好评率100%
在你的代码中,有一些语法错误,我帮你修改了一下:
```python
import pandas as pd
download = pd.read_csv('E:\pyjupthon/使用pandaas进行数据预处理/user_all_info.csv', index_col=0, encoding='gbk', engine='python')
#定义去重函数
def del_rep(list1):
list2 = [] #定义一个空列表
for i in list1:
if i not in list2:
list2.append(i)
return list2
#将下载意愿从数据框提取出来
download = list(download['是否愿意下载'])
print('去重前下载意愿选项总数为:', len(download))
download_rep = del_rep(download) #使用自定义的函数去重
print('使用方法一去重后下载意愿选项总数为:', len(download_rep))
print('用户选项为:', download_rep)
```
不过你需要注意一下,因为你的文件路径是用反斜杠 `\` 表示的,而在 Python 中,`\` 是转义字符,所以需要在路径前面加一个 `r`,表示原始字符串,或者使用正斜杠 `/` 表示路径。
阅读全文