python用关键词提取dataframe某几列
时间: 2023-06-30 18:18:22 浏览: 170
您可以使用Pandas库中的DataFrame的loc方法来提取指定列的关键词。下面是一个示例代码:
```python
import pandas as pd
import re
# 创建一个示例DataFrame
data = {'name': ['Tom', 'Jack', 'Steve', 'Ricky'],
'age': [28, 34, 29, 42],
'address': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen'],
'hobby': ['reading books', 'playing basketball', 'listening to music', 'watching movies']}
df = pd.DataFrame(data)
# 定义一个函数,提取关键词
def extract_keywords(text):
keywords = re.findall(r'\b\w+\b', text)
return ' '.join(keywords)
# 提取'hobby'列的关键词
df['keywords'] = df['hobby'].apply(extract_keywords)
# 输出结果
print(df[['name', 'keywords']])
```
在这个示例中,我们定义了一个提取关键词的函数extract_keywords,然后使用apply方法将其应用到'hobby'列上,得到一个新的'keywords'列,最后使用loc方法提取'name'和'keywords'列。您可以根据自己的需要修改这个示例代码。
阅读全文