forestdataT = df.iloc[:int(1*(df.shape[0] - testpoint - 0 )),0:config.column_num] forestdataT1 = np.array(forestdataT) forestdataT1 = NormalizeMultUseData(forestdataT1, normalize) forestdataT1 = pd.DataFrame(data=forestdataT1, columns=forestdataT.columns) forestdataT1['column6'] = forestdataT1['column6'].astype(int) forestdataT1['column7'] = forestdataT1['column7'].astype(int)

时间: 2024-03-31 08:37:32 浏览: 89

pandas数据选取：df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]

5星 · 资源好评率100%

1 引言　　Pandas是作为Python数据分析著名的工具包，提供了多种数据选取的方法，方便实用。本文主要介绍Pandas的几种数据选取的方法。　　Pandas中，数据主要保存为Dataframe和Series是数据结构，这两种数据结构数据选取的方式基本一致，本文主要以Dataframe为例进行介绍。　　在Dataframe中选取数据大抵包括3中情况：　　1）行（列）选取（单维度选取）：df[]。这种情况一次只能选取行或者列，即一次选取中，只能为行或者列设置筛选条件（只能为一个维度设置筛选条件）。　　2）区域选取（多维选取）：df.loc[]，df.iloc[]，df.ix[]。在Pandas库中，数据操作的核心是对DataFrame对象的处理，它提供了一系列高效且灵活的数据选取方法。本篇文章将深入探讨如何使用df[]、df.loc[], df.iloc[], df.ix[], df.at[], df.iat[]来选取DataFrame中的数据。 1. **行（列）选取**：通过df[]进行单维度选取 - **整数索引切片**：你可以用整数索引来选取DataFrame的行。例如，df[0:1]会选取第一行，而df[0:2]则选取前两行。值得注意的是，这里的切片遵循“左闭右开”的规则。 - **标签索引切片**：如果你的DataFrame有自定义的行索引（如上述例子中的labels），可以使用标签来选取行。例如，df[:'a']选取标签为'a'之前的所有行，而df['a':'b']则选取标签从'a'到'b'（包含'a'但不包含'b'）的行。 - **布尔数组选取**：你可以创建一个与DataFrame行数相等的布尔数组，用它来选取满足特定条件的行。例如，选取age大于30的行，可以写成df[df['age'] > 30]。 2. **区域选取**：通过df.loc[], df.iloc[], df.ix[]进行多维选取 - **df.loc[]**：基于标签的选取，允许你同时根据行和列的标签来选取数据。例如，df.loc['a':'c', 'age':'gender']选取标签在'a'到'c'之间行以及'age'到'gender'之间列的数据。 - **df.iloc[]**：基于位置的选取，用整数来选取数据。例如，df.iloc[0:2, 1:3]选取前两行（位置0和1）和第二、三列（位置1和2）的数据。 - **df.ix[]**：这是一个混合定位器，可以同时接受标签和位置，但在Pandas 0.20.0版本之后已弃用，推荐使用其他两个定位器。 3. **单元格选取**：通过df.at[]和df.iat[]进行精确的点选取 - **df.at[]**：根据标签选取单个单元格。例如，df.at['a', 'age']会返回行标签为'a'的行中'age'列的值。 - **df.iat[]**：根据位置选取单个单元格。例如，df.iat[0, 1]会返回第一行（位置0）第二列（位置1）的值。在实际使用中，这些方法可以组合使用，构建复杂的数据选取逻辑。例如，如果想选取年龄大于30且性别为0的所有人的名字，可以这样操作： ```python selected = df[(df['age'] > 30) & (df['gender'] == 0)]['name'] ``` 了解并熟练掌握这些数据选取方法，能帮助你在数据分析时更加得心应手，高效地处理Pandas DataFrame中的数据。记得在实际操作中，要根据数据的特点和需求灵活选用不同的选取方式。

这段代码看起来是从DataFrame中选取一部分数据，并对选取的数据进行了归一化处理，接着将其转换为了Numpy数组，然后再转换回DataFrame，并将其中的两列数据转换为整数类型。其中，`df.iloc`用于选取DataFrame中的某一部分数据，`NormalizeMultUseData`函数用于对选取的数据进行归一化处理，`np.array`将DataFrame转换为Numpy数组，`pd.DataFrame`将Numpy数组转换为DataFrame，`astype`方法用于将某一列数据转换为指定的数据类型。这里将第6列和第7列转换为int类型。需要注意的是，这里的列索引是从0开始的，因此如果你的DataFrame中第6列和第7列的索引是从1开始的话，需要将代码中的6和7改为5和6。

阅读全文

相关推荐

Python pandas.DataFrame操作指南：创建、索引、增删

Pandas行选择解析：loc[]与iloc[]的区别

x=df.iloc[:,:-1] y=df.iloc[:,-1]

# 提取特征和目标列 X = df.iloc[:, :-1].values y = df.iloc[:, -1].values

解释代码： df = pd.read_csv(fileName, index_col=None) df_target = df.iloc[:, -1:] df_data = df.iloc[:, :-1]

df=pd.read_csv("ex2data1.txt",header=None) X=df.iloc[:,:-1].values y=df.iloc[:,-1].values

X, y = df.iloc[:,:-1],df.iloc[:,-1] y

df = pd.DataFrame(df0, columns=df1.columns) x=df.iloc[:,:-1]

x, y = df.iloc[:, 1:].values, df.iloc[:, 0].values

y=df.iloc[:,df.shape[1]-1]

df = pd.read_excel(r"C:\Users\xiangzi\Desktop\论文\2.28中文（改名）.xlsx", sheet_name="sheet1") # 读取数据文件 x = df.iloc[:, :-1] # 特征 y = df.iloc[:, -1] # 标签 bbc = BalancedBaggingClassifier(estimator=DecisionTreeClassifier(), random_state=42) bbc.fit(x, y)怎么解释

df.iloc[:, 0] = df.iloc[:, 0].astype(str).apply(replace_prefix)

x = df.iloc[0].values y = df.iloc[1].values

最新推荐

pandas数据选取：df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]

教师节主题班会.pptx

正整数数组验证库：确保值符合正整数规则

管理建模和仿真的文件

【损失函数与随机梯度下降】：探索学习率对损失函数的影响，实现高效模型训练

在ADS软件中，如何选择并优化低噪声放大器的直流工作点以实现最佳性能？

系统移植工具集：镜像、工具链及其他必备软件包

"互动学习：行动中的多样性与论文攻读经历"

【损失函数与批量梯度下降】：分析批量大小对损失函数影响，优化模型学习路径

在设计高性能模拟电路时，如何根据应用需求选择合适的运算放大器，并评估供电对电路性能的影响？