pandas 如何表示如果某列的第一个字符串是字母就不管,但若是中文就提取出来
时间: 2024-03-27 10:40:16 浏览: 58
判断字符串是否含中文
可以使用 pandas 中的 str 属性中的 `str.extract()` 方法,该方法可以用于提取符合正则表达式的字符串,例如:
```python
import pandas as pd
df = pd.DataFrame({'col1': ['apple', '香蕉banana', 'cherry', '橘子orange']})
chinese_char = df['col1'].str.extract(r'([\u4e00-\u9fa5])', expand=False)
print(chinese_char)
```
输出结果为:
```
0 NaN
1 香
2 NaN
3 橘
Name: col1, dtype: object
```
其中 `chinese_char` 为一个 pandas Series 对象,包含了原始数据中每个字符串中的第一个中文字符。这里使用了正则表达式 `r'([\u4e00-\u9fa5])'` 来匹配中文字符,其中 `\u4e00` 和 `\u9fa5` 分别表示中文字符集的起始和结束字符。如果某列的第一个字符是英文字母,则提取结果为 NaN。
阅读全文