首页我要使用pandas.read_csv读取文件，并将某两列存入二维数组中，我该怎么做

我要使用pandas.read_csv读取文件，并将某两列存入二维数组中，我该怎么做

时间: 2024-02-29 09:52:10 浏览: 247

你可以使用 `pandas.read_csv()` 读取文件，并使用 `iloc` 或者 `loc` 方法选择需要的两列，然后将其转换为二维数组。具体步骤如下： 1. 使用 `pandas.read_csv()` 读取文件，返回一个 DataFrame 对象。 2. 使用 `iloc` 或者 `loc` 方法选择需要的两列，并将其转换为 NumPy 数组对象。 3. 将两个 NumPy 数组对象按列合并，形成一个二维数组。下面是一个例子，假设你要读取名为 `example.csv` 的 csv 文件，并将其中的 `Age` 和 `Gender` 两列存进一个二维数组 `data` 中： ``` python import pandas as pd import numpy as np # 读取csv文件 df = pd.read_csv('example.csv') # 选择 'Age' 和 'Gender' 两列，并转换为 NumPy 数组对象 age_array = df['Age'].values gender_array = df['Gender'].values # 将两个 NumPy 数组对象按列合并，形成一个二维数组 data = np.column_stack((age_array, gender_array)) # 打印 data print(data) ``` 输出的结果类似于： ``` [[18 'Male'] [20 'Male'] [19 'Female'] [21 'Male'] [22 'Female']] ``` 其中，`df['Age']` 和 `df['Gender']` 分别选择了 DataFrame 中的 `Age` 和 `Gender` 两列，并返回一个 Series 对象，使用 `values` 方法将其转换为 NumPy 数组对象，分别存储在 `age_array` 和 `gender_array` 中。使用 `np.column_stack()` 方法将两个 NumPy 数组对象按列合并，形成一个二维数组 `data`。你可以根据自己的需求修改代码，选择读取不同的文件和不同的列，并将其存储为二维数组。

阅读全文