Python入门:集合与字典基础操作详解

需积分: 0 0 下载量 113 浏览量 更新于2024-08-03 收藏 1.37MB PDF 举报
本课程是针对深度学习初学者的Python语言学习教程,专注于讲解Python中的集合和字典数据结构,帮助学习者扎实基础,更好地理解并应用这些概念于深度学习项目中。 在Python中,集合(Set)是一种无序且不包含重复元素的数据结构。它们在处理数据去重、成员关系测试以及集合运算等方面非常有用。创建集合有两种方式:使用花括号 `{}` 或者内置函数 `set()`。值得注意的是,空集合必须用 `set()` 创建,因为花括号通常用于创建字典(Dictionary)。 集合的主要特点包括: 1. 去除重复数据:集合内的元素都是唯一的,不允许重复。 2. 无序性:集合中的元素没有特定的顺序,因此无法通过索引访问。 常见的集合操作包括: 1. 创建集合:如 `s1 = {10, 20, 30, 40, 50}` 或 `s2 = set('abcdefg')`。 2. 增加数据:可以使用 `add()` 方法添加单个元素,例如 `s1.add(100)`;或者使用 `update()` 方法添加序列,如列表或字符串,例如 `s1.update([100, 200])` 和 `s1.update('abc')`。 3. 删除数据:`remove()` 方法根据提供的值删除元素,如 `s1.remove(10)`,如果元素不存在会抛出异常;`discard()` 方法则在元素不存在时不会抛出异常,例如 `s1.discard(10)`。 4. 查找数据:可以使用 `in` 和 `not in` 运算符检查元素是否存在于集合中,例如 `10 in s1` 或 `10 not in s1`。 5. 随机删除:`pop()` 方法会随机删除一个元素并返回它,如 `del_num = s1.pop()`,如果集合为空,也会抛出异常。 在实际使用中,集合的操作提供了很多灵活性。例如,可以使用 `update()` 更新集合,将其他序列中的元素合并到现有集合中。在处理数据时,这有助于快速去除重复项。此外,`add()` 和 `discard()` 方法是线程安全的,这意味着在多线程环境下,这两个方法可以安全地用于修改集合。 在删除元素时,`remove()` 方法要求指定的元素必须存在于集合中,否则会导致 `KeyError`。而 `discard()` 方法则更安全,即使元素不存在也不会引发错误。`pop()` 方法则用于移除并返回集合中的一个随机元素,如果集合为空,同样会抛出异常。 理解并熟练掌握Python的集合操作对于进行深度学习项目至关重要,因为它们可以方便地处理数据预处理、特征选择等任务,特别是需要处理无序且不重复元素的场景。通过这些基本操作,我们可以有效地构建、管理和操作数据集,为后续的机器学习模型训练提供基础。