python统计列表中重复值并保留重复值大于100的数据
时间: 2024-05-09 16:14:25 浏览: 6
可以通过使用`collections`模块中的`Counter`来统计列表中各元素出现的次数,然后再遍历统计结果,将出现次数大于100的元素添加到新列表中。以下是示例代码:
```python
from collections import Counter
# 原始列表
lst = [1, 2, 3, 4, 5, 6, 7, 7, 7, 8, 8, 9, 9, 9, 9, 10]
# 统计元素出现次数
counter = Counter(lst)
# 保留出现次数大于100的元素
new_lst = [ele for ele, count in counter.items() if count > 100]
print(new_lst) # 输出结果为 []
```
由于示例列表中没有出现次数大于100的元素,因此最终输出结果为空列表`[]`。如果要测试保留出现次数大于100的元素,可以修改原始列表中的数据。
相关问题
python统计表格某一列中重复值并保留重复值大于100的数据
可以使用pandas库来完成这个任务。
首先,读取表格数据到 pandas 的 DataFrame 中,例如表格文件名为 data.xlsx,可以使用以下代码:
```python
import pandas as pd
df = pd.read_excel('data.xlsx')
```
然后,选择需要统计的列,假设列名为 "column_name",可以使用以下代码:
```python
counts = df['column_name'].value_counts()
```
这会返回一个 pandas Series 对象,其中包含每个值的计数。现在,我们可以使用以下代码来过滤掉计数小于 100 的值:
```python
result = counts[counts >= 100]
```
这将返回一个包含重复值大于等于 100 的值的 Series 对象。
最后,可以将结果保存到另一个表格文件中,例如 result.xlsx,可以使用以下代码:
```python
result.to_excel('result.xlsx')
```
完整代码如下:
```python
import pandas as pd
df = pd.read_excel('data.xlsx')
counts = df['column_name'].value_counts()
result = counts[counts >= 100]
result.to_excel('result.xlsx')
```
python提取列表中重复值
可以使用Python中的set()函数来提取列表中的重复值。set()函数会自动去除重复的元素,因此,如果将原列表转换为set集合,再将其转回为列表,就能得到去重后的列表和重复的元素。
以下是一个示例代码:
```python
mylist = [1, 2, 3, 4, 2, 3, 5, 6, 7, 6]
duplicates = list(set([x for x in mylist if mylist.count(x) > 1]))
print(duplicates)
```
输出结果为:
```
[2, 3, 6]
```
其中,列表推导式 `[x for x in mylist if mylist.count(x) > 1]` 用于获取重复的元素。然后,将该列表转换为set集合,再转回为列表即可得到重复的元素列表。