pandas获取数据里作者列中括号里的国家名
时间: 2023-06-29 22:11:16 浏览: 132
用pandas中的DataFrame时选取行或列的方法
可以使用 pandas 中的 `str.extract()` 方法来提取作者列中括号里的国家名。例如,假设数据集中有一个名为 `df` 的 pandas DataFrame,其中包含一个名为 `Author` 的列,该列包含作者姓名和国籍,格式为 `"Author Name (Country)"`,则可以使用以下代码提取国籍信息:
``` python
df['Country'] = df['Author'].str.extract('\((.*?)\)', expand=False)
```
上述代码中的正则表达式 `\((.*?)\)` 表示匹配以左括号开头、右括号结尾的字符串,并提取其中的内容。`expand=False` 参数表示不将结果转换为 DataFrame 形式,而是保留为 Series 形式。执行上述代码后,DataFrame 中会新增一列名为 `Country`,其中包含从 `Author` 列中提取出来的国籍信息。
阅读全文