把csv中年龄一列中的数值挑出,剔除years
时间: 2023-12-10 08:41:02 浏览: 104
data_by_year.csv
可以使用Python中的正则表达式模块re来实现。
假设csv文件名为data.csv,年龄一列的列名为age,可以使用以下代码:
```python
import re
import pandas as pd
# 读取csv文件
df = pd.read_csv('data.csv')
# 提取年龄列中的数值
age_values = []
for age in df['age']:
match = re.search(r'\d+', age)
if match:
age_values.append(int(match.group()))
print(age_values)
```
解释一下代码:
首先使用Pandas的read_csv函数读取csv文件并存储在DataFrame对象df中。
然后遍历DataFrame对象df中名为age的列中的每个元素,使用re模块的search函数搜索该元素中的第一个数字,将其转换为整数并存储在列表age_values中。
最后输出age_values即为年龄列中的数值列表。
阅读全文