dataframe筛选某列纯中文
时间: 2024-05-26 10:07:51 浏览: 100
DataFrame 将某列数据转为数组的方法
5星 · 资源好评率100%
您好,要筛选dataframe中某列纯中文的数据,可以利用正则表达式来匹配中文字符。以下是示例代码:
```python
import pandas as pd
import re
# 创建示例数据
data = {'姓名': ['张三', '李四', '王五', 'Tom', 'Jerry'], '年龄': [20, 25, 30, 35, 40]}
df = pd.DataFrame(data)
# 筛选姓名列中纯中文的数据
pattern = re.compile(r'^[\u4e00-\u9fa5]+$') # 定义纯中文的正则表达式
df_chinese = df[df['姓名'].apply(lambda x: pattern.match(x) is not None)]
print(df_chinese)
```
运行结果如下:
```
姓名 年龄
0 张三 20
1 李四 25
2 王五 30
```
以上代码中,`pattern` 定义了一个纯中文的正则表达式,`df['姓名'].apply(lambda x: pattern.match(x) is not None)` 对姓名列中的每个元素都进行正则匹配,只有匹配成功的才会被筛选出来。
阅读全文