Python collections包深度解析：defaultdict与高效数据处理

17 浏览量更新于2024-08-29 收藏 83KB PDF 举报

"Python标准库中的collections模块提供了许多增强型的数据结构，可以帮助开发者更高效地处理数据。本教程将介绍collections包中的defaultdict类及其用法。defaultdict是普通字典的扩展，它允许我们在访问不存在的键时自动创建一个默认值，而无需显式检查键是否存在。这大大简化了编程逻辑，特别是当我们需要根据键动态初始化不同类型的值时，如列表或集合。" 在Python中，处理大规模数据时，基础的数据结构（如list、tuple、dict、set）可能无法满足所有需求。例如，list在某些情况下的插入性能不佳，而有时我们需要一个保持插入顺序的字典。collections模块应运而生，它包含了一系列高级集合类，例如defaultdict、Counter、OrderedDict等，这些工具能帮助我们编写更高效且具有Python特色的代码。 defaultdict类是collections模块的核心组件之一。它通过接收一个默认工厂函数default_factory作为参数，当尝试访问一个不存在的键时，会调用这个函数来生成默认值。这样，我们就不需要在访问字典时先检查键是否存在，简化了代码。例如，将一个包含颜色和数值的列表转换为一个字典，其中颜色作为键，其对应的数值存储在一个列表中，可以使用defaultdict(list)实现： ```python from collections import defaultdict s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)] d = defaultdict(list) for k, v in s: d[k].append(v) print(sorted(d.items())) # 输出: [('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])] ``` 上述代码等价于使用`setdefault`方法检查键是否存在并创建默认值，但defaultdict使得这一过程更为简洁。如果希望确保值的唯一性，可以使用defaultdict(set)，因为集合不允许有重复元素： ```python from collections import defaultdict s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)] d = defaultdict(set) for k, v in s: d[k].add(v) print(sorted(d.items())) # 输出: [('blue', {2, 4}), ('red', {1}), ('yellow', {1, 3})] ``` defaultdict的强大之处在于它可以与任何可调用对象作为default_factory，包括其他工厂函数或类的实例。这使得我们可以根据实际需求灵活地创建和管理字典的值，从而优化代码效率和可读性。熟悉并善于利用collections模块的这些高级数据结构，对于提升Python编程技能和项目性能至关重要。

Python标准库之标准库之collections包的使用教程包的使用教程

前言前言

Python为我们提供了4种基本的数据结构：list, tuple, dict, set，但是在处理数据量较大的情形的时候，这4种数据结构就明显

过于单一了，比如list作为数组在某些情形插入的效率会比较低，有时候我们也需要维护一个有序的dict。所以这个时候我们就

要用到Python标准库为我们提供的collections包了，它提供了多个有用的集合类，熟练掌握这些集合类，不仅可以让我们让写

出的代码更加Pythonic，也可以提高我们程序的运行效率。

defaultdict

defaultdict(default_factory)在普通的dict之上添加了default_factory，使得key不存在时会自动生成相应类型的

value，default_factory参数可以指定成list, set, int等各种合法类型。

我们现在有下面这样一组list，虽然我们有5组数据，但是仔细观察后发现其实我们只有3种color，但是每一种color对应多个

值。现在我们想要将这个list转换成一个dict，这个dict的key对应一种color，dict的value设置为一个list存放color对应的多个

值。我们可以使用defaultdict(list)来解决这个问题。

>>> from collections import defaultdict

>>> s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)] >>> d = defaultdict(list)

>>> for k, v in s:

... d[k].append(v)

...

>>> sorted(d.items())

[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

以上等价于：

>>> d = {}

>>> for k, v in s:

... d.setdefault(k, []).append(v)

...

>>> sorted(d.items())

[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

如果我们不希望含有重复的元素，可以考虑使用defaultdict(set) 。set相比list的不同之处在于set中不允许存在相同的元素。

>>> from collections import defaultdict

>>> s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)] >>> d = defaultdict(set)

>>> for k, v in s:

... d[k].add(v)

...

>>> sorted(d.items())

[('blue', {2, 4}), ('red', {1, 3})]

OrderedDict

Python3.6之前的dict是无序的，但是在某些情形我们需要保持dict的有序性，这个时候可以使用OrderedDict，它是dict的一个

subclass，但是在dict的基础上保持了dict的有序型，下面我们来看一下使用方法。

>>> # regular unsorted dictionary

>>> d = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2}

>>> # dictionary sorted by key

>>> OrderedDict(sorted(d.items(), key=lambda t: t[0]))

OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)])

>>> # dictionary sorted by value

>>> OrderedDict(sorted(d.items(), key=lambda t: t[1]))

OrderedDict([('pear', 1), ('orange', 2), ('banana', 3), ('apple', 4)])

>>> # dictionary sorted by length of the key string

>>> OrderedDict(sorted(d.items(), key=lambda t: len(t[0])))

OrderedDict([('pear', 1), ('apple', 4), ('orange', 2), ('banana', 3)])

使用popitem(last=True)方法可以让我们按照LIFO(先进后出)的顺序删除dict中的key-value，即删除最后一个插入的键值对，如果

last=False就按照FIFO(先进先出)删除dict中key-value。

>>> d = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2}

>>> # dictionary sorted by key

>>> d = OrderedDict(sorted(d.items(), key=lambda t: t[0]))

>>> d

OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)])

>>> d.popitem()

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38744435

粉丝: 373
资源: 2万+

Python collections包深度解析：defaultdict与高效数据处理

Python库Spruce_collections安装与使用指南

Python标准库实战教程

Python标准库实战指南

Python中collections模块的基本使用教程

python标准库_Python标准库_

Python标准库collections怎么安装

python标准库.pdf_Python标准库_

python基础教程：Python标准库使用OrderedDict类的实例讲解

python标准库

Python标准库

最新资源