Python collections模块：高级容器与计数工具详解

178 浏览量更新于2024-08-31 收藏 79KB PDF 举报

Python的collections模块是一个强大的工具包，它扩展了内置容器类的功能，为开发者提供了更高效、定制化的数据结构解决方案。这个模块包含以下几个关键组件： 1. **Counter**：Counter是dict的子类，专门用于计数可哈希对象的出现频率。通过`collections.Counter`函数，可以方便地统计字符串中字符或单词的出现次数。例如，`collections.Counter('helloworld')`会返回一个字典，展示了每个字符及其出现的次数。常用方法如`elements()`返回所有出现过的元素（按频率降序），`most_common()`获取最常见的元素及其数量，`subtract()`用于减去指定元素的计数，而`update()`则可以合并其他Counter对象或迭代器中的计数。 2. **defaultdict**：作为字典的子类，defaultdict提供了一个工厂函数，当查询不存在的键时，会自动提供一个默认值。这在处理可能缺失的数据时非常有用，避免了频繁的`None`检查。 3. **OrderedDict**：保留了元素插入的顺序，这对于需要保持插入顺序的场景尤其适用，如日志记录或数据库操作中的历史数据跟踪。 4. **namedtuple**：提供了一个工厂函数来创建命名元组（NamedTuple），这是一种轻量级的固定长度元组，常用于存储具有命名字段的数据结构，有助于代码的可读性。 5. **deque**：双端队列（deque）类似于列表，但提供了高效的在两端添加和删除元素的功能，适合于需要频繁在两端操作的场景，如消息队列。 6. **ChainMap**：这个类将多个字典映射组合成一个视图，允许在多个源之间查找键值对。这对于需要跨越多个独立配置源的场景非常实用。使用collections模块，可以简化Python编程中的数据处理任务，提高代码的效率和可维护性。了解并熟练掌握这些数据结构和工具，能够帮助你在编写更复杂、更高效的代码时游刃有余。

Python collections模块的使用方法模块的使用方法

collections模块模块

这个模块实现了特定目标的容器，以提供Python标准内建容器 dict、list、set、tuple 的替代选择。

Counter：字典的子类，提供了可哈希对象的计数功能

defaultdict：字典的子类，提供了一个工厂函数，为字典查询提供了默认值

OrderedDict：字典的子类，保留了他们被添加的顺序

namedtuple：创建命名元组子类的工厂函数

deque：类似列表容器，实现了在两端快速添加(append)和弹出(pop)

ChainMap：类似字典的容器类，将多个映射集合到一个视图里面

Counter

Counter是一个dict子类，主要是用来对你访问的对象的频率进行计数。

>>> import collections

>>> # 统计字符出现的次数

... collections.Counter('hello world')

Counter({'l': 3, 'o': 2, 'h': 1, 'e': 1, ' ': 1, 'w': 1, 'r': 1, 'd': 1})

>>> # 统计单词个数

... collections.Counter('hello world hello lucy'.split())

Counter({'hello': 2, 'world': 1, 'lucy': 1})

常用方法：

elements()：返回一个迭代器，每个元素重复计算的个数，如果一个元素的计数小于1,就会被忽略

most_common([n])：返回一个列表，提供n个访问频率最高的元素和计数

subtract([iterable-or-mapping])：从迭代对象中减去元素，输入输出可以是0或者负数

update([iterable-or-mapping])：从迭代对象计数元素或者从另一个映射对象 (或计数器) 添加

>>> c = collections.Counter('hello world hello lucy'.split())

>>> c

Counter({'hello': 2, 'world': 1, 'lucy': 1})

>>> # 获取指定对象的访问次数，也可以使用get方法

... c['hello'] 2

>>> # 查看元素

... list(c.elements())

['hello', 'hello', 'world', 'lucy'] >>> c1 = collections.Counter('hello world'.split())

>>> c2 = collections.Counter('hello lucy'.split())

>>> c1

Counter({'hello': 1, 'world': 1})

>>> c2

Counter({'hello': 1, 'lucy': 1})

>>> # 追加对象，+或者c1.update(c2)

... c1+c2

Counter({'hello': 2, 'world': 1, 'lucy': 1})

>>> # 减少对象，-或者c1.subtract(c2)

... c1-c2

Counter({'world': 1})

>>> # 清除

... c.clear()

>>> c

Counter()

defaultdict

返回一个新的类似字典的对象。 defaultdict 是内置 dict 类的子类。

class collections.defaultdict([default_factory[, ...]])

>>> d = collections.defaultdict()

>>> d

defaultdict(None, {})

>>> e = collections.defaultdict(str)

>>> e

defaultdict(<class 'str'>, {})

例子

defaultdict的一个典型用法是使用其中一种内置类型（如str、int、list或dict等）作为默认工厂，这些内置类型在没有参数调用

时返回空类型。

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38678172

粉丝: 2
资源: 910

Python collections模块：高级容器与计数工具详解

Python collections模块使用方法详解

Python collections——容器数据类型.7z

python collections模块的使用

python collections模块

python collections模块解释

python collections模块安装

Python中collections模块的基本使用教程

Python collections模块：高级数据类型及使用教程

Python Collections模块深度解析：Counter容器类的使用

Python Collections模块深度解析：Counter容器类

最新资源