我要使用pandas.read_csv读取文件,并将某两列存入二维数组中,我该怎么做
时间: 2024-02-29 15:52:10 浏览: 150
你可以使用 `pandas.read_csv()` 读取文件,并使用 `iloc` 或者 `loc` 方法选择需要的两列,然后将其转换为二维数组。具体步骤如下:
1. 使用 `pandas.read_csv()` 读取文件,返回一个 DataFrame 对象。
2. 使用 `iloc` 或者 `loc` 方法选择需要的两列,并将其转换为 NumPy 数组对象。
3. 将两个 NumPy 数组对象按列合并,形成一个二维数组。
下面是一个例子,假设你要读取名为 `example.csv` 的 csv 文件,并将其中的 `Age` 和 `Gender` 两列存进一个二维数组 `data` 中:
``` python
import pandas as pd
import numpy as np
# 读取csv文件
df = pd.read_csv('example.csv')
# 选择 'Age' 和 'Gender' 两列,并转换为 NumPy 数组对象
age_array = df['Age'].values
gender_array = df['Gender'].values
# 将两个 NumPy 数组对象按列合并,形成一个二维数组
data = np.column_stack((age_array, gender_array))
# 打印 data
print(data)
```
输出的结果类似于:
```
[[18 'Male']
[20 'Male']
[19 'Female']
[21 'Male']
[22 'Female']]
```
其中,`df['Age']` 和 `df['Gender']` 分别选择了 DataFrame 中的 `Age` 和 `Gender` 两列,并返回一个 Series 对象,使用 `values` 方法将其转换为 NumPy 数组对象,分别存储在 `age_array` 和 `gender_array` 中。使用 `np.column_stack()` 方法将两个 NumPy 数组对象按列合并,形成一个二维数组 `data`。你可以根据自己的需求修改代码,选择读取不同的文件和不同的列,并将其存储为二维数组。