df.values用法及展示
时间: 2024-04-30 16:25:20 浏览: 102
`df.values` 是一个 NumPy 数组,它返回数据框中所有的数据。它返回的数组可以用于进行各种计算和分析。以下是一个例子:
假设我们有以下数据框:
```
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
'Age': [25, 32, 18, 47, 22],
'Gender': ['F', 'M', 'F', 'M', 'F'],
'Score': [88, 79, 91, 65, 77]}
df = pd.DataFrame(data)
```
使用 `df.values` 可以获取数据框中的所有值,如下所示:
```
array([['Alice', 25, 'F', 88],
['Bob', 32, 'M', 79],
['Charlie', 18, 'F', 91],
['David', 47, 'M', 65],
['Eva', 22, 'F', 77]], dtype=object)
```
需要注意的是,虽然 `df.values` 返回的是一个 NumPy 数组,但它不包含列名或行索引。如果您需要操作列名或行索引,请使用 Pandas 的相应功能。
相关问题
man = df['Gender']=='M' woman = df['Gender']=='F' data = pd.DataFrame() data['couple'] = df.Couple.unique() data['location'] = df.Location.values[::2] data['man_name'] = df.Name[man].values data['woman_name'] = df.Name[woman].values data['man_occupation'] = df.Occupation[man].values data['woman_occupaiton'] = df.Occupation[woman].values data['man_age'] = df.Age[man].values data['woman_age'] = df.Age[woman].values data['man_decision'] = df.Decision[man].values data['woman_decision']=df.Decision[woman].values data['status'] = df.Status.values[::2] data.head() data.to_csv('./data.csv') data.head()
这段代码是使用 Pandas 包对一个数据集进行处理和清洗,生成一个新的数据集并将其保存为 CSV 文件。具体来说,它做了以下几个步骤:
1. 从原始数据集中选出性别为男性和女性的行,分别对应变量 man 和 woman。
2. 创建一个空的 DataFrame 对象 data,用于存储处理后的数据。
3. 使用 unique() 方法获取原始数据集中所有的 Couple 值,并将其作为 data 的一个列。
4. 使用数组切片的方式从原始数据集中获取所有奇数行的 Location 和 Status 值,并将它们作为 data 的两个列。
5. 使用 man 和 woman 变量中的布尔值索引来获取男性和女性的 Name、Occupation、Age 和 Decision 值,并将它们分别作为 data 的四个列。
6. 将原始数据集中的偶数行的 Status 值作为 data 的最后一个列。
7. 使用 head() 方法查看生成的新数据集的前五行。
8. 使用 to_csv() 方法将 data 保存为一个 CSV 文件。
总体来说,这段代码的目的是将原始数据集按照特定的方式进行重新组织和清洗,以便进行后续的分析和可视化。
df.iloc.values用法
df.iloc.values是一个属性,可以用于获取DataFrame中的所有数据(不包括行标签和列标签),返回一个二维数组。它的使用方法如下:
``` python
values = df.iloc.values
```
其中,df是一个DataFrame对象,values是一个二维数组,可以使用NumPy的数组操作对其进行处理。例如,可以使用np.sum(values)计算所有数据的总和,或者使用np.mean(values, axis=0)计算每一列的平均值。
阅读全文