掌握Pandas基础：数据处理与操作实战

201 浏览量更新于2024-08-30 收藏 53KB PDF 举报

在本篇计算机视觉系列的文章中，主要讲解了Python编程中Pandas库的基础应用，Pandas是数据处理领域非常流行的库，因其高效且易用的特性而备受青睐。文章首先介绍了如何使用Pandas创建数据对象： 1. **Series对象创建**：通过`pd.Series()`函数，可以创建一维数组，如`s = pd.Series([1, 3, 5, np.nan, 6, 8])`，它将数据存储为有序序列，其中`np.nan`表示缺失值。`print(s)`会显示Series的索引（0, 1, 2, 3, 4, 5）和对应的值。 2. **DataFrame对象创建**：`pd.DataFrame()`用于创建二维表格结构，可以通过`index`参数指定行索引，`columns`参数指定列索引。例如，`dates = pd.DataFrame(np.random.rand(2, 2), index=[1, 2], columns=['A', 'B'])`创建了一个随机数据的DataFrame。接下来，文章详细讨论了Pandas中的数据属性和操作： - **数据属性**：`df.index`用于获取DataFrame的索引，`df.columns`获取列名，`df.describe()`则提供了常用统计数据，如计数、平均值、标准差等。 - **数据操作**： - **数据转置**：通过`.T`属性实现DataFrame的垂直转置，如`a.T`将`a`的行变成列，反之亦然。 - **按索引排序**：`frame.sort_index()`方法可以根据行或列索引进行排序，默认按行排序，通过`axis=1`可以按列排序。例如，先按列索引降序排列`a`，然后按行索引升序排列。 - **按值排序**：`sort_values()`方法允许根据指定列的值进行排序，可以指定`by`参数和`axis`参数来控制排序依据和方向。这些基础知识对于数据预处理、清洗、分析以及构建复杂的统计模型都至关重要，Pandas的强大功能使得在计算机视觉项目中数据处理变得更加高效。通过熟练掌握Pandas，可以大大提高数据分析和可视化的效率，为计算机视觉任务提供有力支持。

计算机视觉系列计算机视觉系列–Pandas基础基础

Pandas库是非常好用的数据处理库，下面对一些常见语法进行介绍。

import numpy as np

import pandas as pd

创建创建pandas对象对象

通过series创建

s=pd.Series([1,3,5,np.nan,6,8])

print(s)

#0 1.0

#1 3.0

#2 5.0

#3 NaN

#4 6.0

#5 7.0

#dtype: float64

通过dataframe创建

#使用DataFrame，通过index指定行索引，columns指定列索引

dates=pd.DataFrame(np.random.random(2,2),index=[1,2],columns=list('AB'))

print(dates)

# A B

#1 0.234430 0.115264

#2 0.583374 0.883520

pandas数据属性数据属性

属性属性说明说明

df.index 显示索引

df.columns 显示列索引

df.describe() 显示常见的一些统计数据

pandas数据操作数据操作

数据转置

a=pd.DataFrame(np.random.random((2,2)),index=[1,2],columns=list('AB'))

print(a)

# A B

#1 0.137045 0.489604

#2 0.578191 0.884470

print(a.T) #转置

# 1 2

#A 0.137045 0.578191

#B 0.489604 0.884470

按索引排序

通过frame.sort_index(axis=0)按索引排序:默认按行索引排序，指定axis=1则按列索引排序.

a=pd.DataFrame(np.random.random((2,2)),index=[2,1],columns=list('BA'))

print(a)

# B A

#2 0.987608 0.368984

#1 0.694016 0.315816

print(a.sort_index())

# B A

#1 0.694016 0.315816

#2 0.987608 0.368984

print(a.sort_index(axis=1))

# A B

#2 0.368984 0.987608

#1 0.315816 0.694016

按值排序

通过sort_values(by,axis=0,…)进行值的排序

by:这个参数要求传入一个字符或者是一个字符列表，用来指定按照哪个元素进行排序

axis=0表示调整行,axis=1表示调整列.

print(a)

# B A

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38730331

粉丝: 5

掌握Pandas基础：数据处理与操作实战

pandas基础到进阶

Python-pandas基础习题与答案

基于遗传算法的动态优化物流配送中心选址问题研究（Matlab源码+详细注释）,遗传算法与免疫算法在物流配送中心选址问题的应用详解（源码+详细注释，Matlab编写，含动态优化与迭代，结果图展示）,遗传

SpringBoot博客项目.zip(毕设&课设&实训&大作业&竞赛&项目)

基于改进蚁群算法与动态窗口法的多机器人路径规划与避障算法研究：去除冗余点、实现全局与局部实时动态规划,基于改进蚁群算法与动态窗口法的多机器人路径规划与避障算法研究：去除冗余点，实现全局与局部实时动态规

C语言epoll的实例服务端用法

Malab Simulink MW级直驱风机模型解析及参考文献资源分享,基于Malab Simulink构建的MW级直驱风机模型及其相关参考文献,Malab Simulink MW级直驱风机模型，附赠

GVIM，WINDOWS版本的VIM

2024年全国地区高级软件工程师职位薪酬调查报告

基于MATLAB的机器人运动学建模与动力学仿真研究：正逆解、雅克比矩阵求解及轨迹规划优化,MATLAB机器人运动学正逆解与动力学建模仿真：雅克比矩阵求解及轨迹规划策略研究,MATLAB机器人运动学正逆

最新资源