Pandas入门:数据结构与索引操作详解
5 浏览量
更新于2024-08-29
收藏 151KB PDF 举报
n", 'o', 'p']
# obj2.values 保持不变,仍然是[4, 7, -5, 3]
# 但索引已更新为['m', 'n', 'o', 'p']
# 因此,访问元素的方式也会相应改变,如:
obj2['n']
7
# 二,DataFrame
# DataFrame是二维表格型数据结构,它含有一系列有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。
# DataFrame既有行索引也有列索引,可以被看作是由Series组成的字典,或者说是一个表格形式的字典,其中键是列名,值是Series。
# 创建DataFrame的基本方式是通过字典的列表:
data = {'city': ['Beijing', 'Shanghai', 'Guangzhou'],
'population': [21542000, 24256800, 13081000],
'area': [16410, 6340, 7434]}
df = pd.DataFrame(data)
# df
# city population area
# 0 Beijing 21542000 16410
# 1 Shanghai 24256800 6340
# 2 Guangzhou 13081000 7434
# DataFrame的列名可以通过.keys()方法获取,数据可以通过列名或位置访问:
df.columns
Index(['city', 'population', 'area'], dtype='object')
df['population']
# 输出人口数量的Series
# 0 21542000
# 1 24256800
# 2 13081000
# Name: population, dtype: int64
# 三,Panel
# Panel是Pandas中的三维数据结构,类似于DataFrame的扩展,它有三个轴:items、major_axis 和 minor_axis。
# 通常在实际应用中不如DataFrame常见,这里不做详细介绍。
# 索引操作
# 索引在Pandas中非常重要,它不仅用于数据的选取,还可以作为数据的一部分。Pandas提供了丰富的索引操作,包括选择、切片、布尔索引等。
# 数据运算
# Pandas提供了大量的数据运算功能,包括统计函数(如mean, sum, count等)、描述性统计、合并与连接、重采样和时间序列分析等。
# 层次化索引
# 层次化索引(Hierarchical Indexing)允许在一个轴上设置多级索引,这可以用来处理高维度的数据,或者创建具有复杂索引结构的数据集。
# 数据读取与存储
# Pandas支持多种数据格式的读取和写入,包括CSV、TXT、JSON、Excel、数据库文件等,方便数据的导入导出。
# 数据清洗与整理
# 数据清洗涉及缺失值处理、重复值检测、异常值识别等,Pandas提供了诸如dropna、fillna、replace等方法进行数据清理。数据整理则包括列的排序、重命名、合并、重塑等操作。
# 数据分组与聚合
# 使用groupby方法可以对数据进行分组,然后对每个组进行聚合操作,如计算平均值、总和等。这对于数据分析中的分组统计非常有用。
# 时间序列
# Pandas特别适合处理时间序列数据,它内置了对日期和时间的处理函数,支持时间序列的重采样、窗口统计等操作。
Pandas是Python数据分析中的核心库,其强大的数据结构和索引功能使得数据处理变得高效便捷。无论是数据清洗、分析还是建模,Pandas都能提供强大支持。通过学习和掌握Pandas,可以极大地提升数据工作的效率。
2022-01-16 上传
2022-01-16 上传
2020-12-21 上传
2021-01-07 上传
2020-12-21 上传
2020-12-21 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38629362
- 粉丝: 6
- 资源: 967
最新资源
- JavaScript实现的高效pomodoro时钟教程
- CMake 3.25.3版本发布:程序员必备构建工具
- 直流无刷电机控制技术项目源码集合
- Ak Kamal电子安全客户端加载器-CRX插件介绍
- 揭露流氓软件:月息背后的秘密
- 京东自动抢购茅台脚本指南:如何设置eid与fp参数
- 动态格式化Matlab轴刻度标签 - ticklabelformat实用教程
- DSTUHack2021后端接口与Go语言实现解析
- CMake 3.25.2版本Linux软件包发布
- Node.js网络数据抓取技术深入解析
- QRSorteios-crx扩展:优化税务文件扫描流程
- 掌握JavaScript中的算法技巧
- Rails+React打造MF员工租房解决方案
- Utsanjan:自学成才的UI/UX设计师与技术博客作者
- CMake 3.25.2版本发布,支持Windows x86_64架构
- AR_RENTAL平台:HTML技术在增强现实领域的应用