计算机视觉系列计算机视觉系列–Pandas基础基础
Pandas库是非常好用的数据处理库,下面对一些常见语法进行介绍。
import numpy as np
import pandas as pd
创建创建pandas对象对象
通过series创建
s=pd.Series([1,3,5,np.nan,6,8])
print(s)
#0 1.0
#1 3.0
#2 5.0
#3 NaN
#4 6.0
#5 7.0
#dtype: float64
通过dataframe创建
#使用DataFrame,通过index指定行索引,columns指定列索引
dates=pd.DataFrame(np.random.random(2,2),index=[1,2],columns=list('AB'))
print(dates)
# A B
#1 0.234430 0.115264
#2 0.583374 0.883520
pandas数据属性数据属性
属性属性 说明说明
df.index 显示索引
df.columns 显示列索引
df.describe() 显示常见的一些统计数据
pandas数据操作数据操作
数据转置
a=pd.DataFrame(np.random.random((2,2)),index=[1,2],columns=list('AB'))
print(a)
# A B
#1 0.137045 0.489604
#2 0.578191 0.884470
print(a.T) #转置
# 1 2
#A 0.137045 0.578191
#B 0.489604 0.884470
按索引排序
通过frame.sort_index(axis=0)按索引排序:默认按行索引排序,指定axis=1则按列索引排序.
a=pd.DataFrame(np.random.random((2,2)),index=[2,1],columns=list('BA'))
print(a)
# B A
#2 0.987608 0.368984
#1 0.694016 0.315816
print(a.sort_index())
# B A
#1 0.694016 0.315816
#2 0.987608 0.368984
print(a.sort_index(axis=1))
# A B
#2 0.368984 0.987608
#1 0.315816 0.694016
按值排序
通过sort_values(by,axis=0,…)进行值的排序
by:这个参数要求传入一个字符或者是一个字符列表,用来指定按照哪个元素进行排序
axis=0表示调整行,axis=1表示调整列.
print(a)
# B A