import pandas as pd download = pd.read_csv('D:\实现\shixun/user_download.csv', index_col=0,encoding='gbk',engine='python') def del_rep(list1): list2 = [] for i in list1: list2.append(i) return list2 download = list(download['是否愿意下载']) print('去重新下载意愿选项总数为:',len(download_rep)) print('用户选项为;',download_rep)
时间: 2023-12-06 17:44:35 浏览: 86
您的代码有一些小问题,您定义了一个名为`del_rep`的函数,但是在下面的代码中却使用了`download_rep`这个变量名。另外,您在读取CSV文件时使用了`index_col=0`,这会将第一列作为行索引,如果您的CSV文件中第一列不是行索引的话,可能会导致数据读取错误。
下面是修改后的代码:
```
import pandas as pd
download = pd.read_csv('D:\实现\shixun/user_download.csv', encoding='gbk', engine='python')
download_list = list(download['是否愿意下载'])
def del_rep(list1):
list2 = []
for i in list1:
if i not in list2:
list2.append(i)
return list2
download_rep = del_rep(download_list)
print('去重后下载意愿选项总数为:', len(download_rep))
print('用户选项为:', download_rep)
```
这段代码会将CSV文件中的`是否愿意下载`列读取到一个列表中,并使用`del_rep`函数对列表进行去重,最后输出去重后的选项总数和用户选项。
相关问题
pd.read_csv去除行号
可以使用Pandas的read_csv方法的index_col参数来去除行号,将其设置为None即可。具体代码如下所示:
```python
import pandas as pd
# 读取数据文件,去除行号
data = pd.read_csv('data.csv', index_col=None)
# 输出修改后的数据
print(data)
```
pandas.read_csv读取其中一列
你可以通过pandas.read_csv中的usecols参数来指定读取的列,例如:
```python
import pandas as pd
# 读取csv文件中的name列
df = pd.read_csv('data.csv', usecols=['name'])
```
如果你只需要读取csv文件中的某一列数据作为一个Series对象,可以使用pandas的Series对象的from_csv方法,例如:
```python
import pandas as pd
# 读取csv文件中的name列数据作为Series对象
s = pd.Series.from_csv('data.csv', header=0, index_col=0)
```
其中,header参数表示是否将第一行作为列名,index_col参数表示将哪一列作为索引列。
阅读全文
相关推荐














