python实现筛选出某列元素词频大于1,将本行值保存至新工作表
时间: 2023-06-19 10:05:56 浏览: 135
基于python的将pdf转为txt然后进行分词,并进行词频统计
假设你要筛选的列是第一列(A列),以下是Python代码实现:
```python
import pandas as pd
# 读取原始数据
df = pd.read_excel('原始数据.xlsx')
# 筛选出A列元素词频大于1的行
filter_rows = df.groupby('A').filter(lambda x: len(x) > 1)
# 将筛选出来的行保存至新工作表
filter_rows.to_excel('筛选后数据.xlsx', index=False)
```
以上代码中,我们使用了pandas库来读取原始数据,并通过groupby函数对A列进行分组统计词频,然后使用filter函数筛选出词频大于1的行。最后,将筛选出来的行保存至新工作表中。
阅读全文