使用pandas读取一个csv文件中指定列的数据,对数据进行,将拆分后的数据添加到该列的后面并保留原列
时间: 2024-05-08 09:15:44 浏览: 68
的数据。
假设有一个csv文件data.csv,其中包含以下数据:
```
name,age,city
Alice,26,New York
Bob,30,Los Angeles
Charlie,35,London
```
我们想要对city列进行处理,将每个城市的国家/地区名称拆分出来,并将其添加到该列的后面,结果如下:
```
name,age,city
Alice,26,New York,USA
Bob,30,Los Angeles,USA
Charlie,35,London,UK
```
可以使用pandas的read_csv函数来读取csv文件,并使用apply方法对city列进行处理:
```python
import pandas as pd
# 读取csv文件
df = pd.read_csv('data.csv')
# 定义处理函数
def process_city(city):
if city == 'New York':
return 'New York,USA'
elif city == 'Los Angeles':
return 'Los Angeles,USA'
elif city == 'London':
return 'London,UK'
else:
return city
# 对city列应用处理函数,并将处理结果添加到新的一列
df['city_new'] = df['city'].apply(process_city)
# 输出结果
print(df)
```
输出结果:
```
name age city city_new
0 Alice 26 New York New York,USA
1 Bob 30 Los Angeles Los Angeles,USA
2 Charlie 35 London London,UK
```
在处理函数中,我们可以根据需要对每个城市的名称进行处理,并返回处理后的结果。在apply方法中,我们可以将处理函数应用到整个city列,并将处理结果添加到新的一列(city_new)中。最终,我们可以输出包含原始数据和新处理数据的完整数据集。
阅读全文