python怎么提取出来excel表格中一列中全部信息中带有我国开头的句子 文件地址为C:\Users\张赫\Desktop\plant.xlsx 文件名为plant.xlsx 关注的列名为File2 LongText
时间: 2024-09-17 15:05:20 浏览: 60
在Python中,你可以使用pandas库来读取Excel文件,并利用正则表达式来筛选出包含特定字符串(如“我国”)的行。以下是一个简单的步骤示例:
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel(r'C:\Users\张赫\Desktop\plant.xlsx', sheet_name='Sheet1') # 确保文件有对应的sheet名为'File2 LongText'
column_name = 'File2 LongText' # 列名假设就是你要关注的列
# 创建一个函数用于检查句子是否包含"我国"
def contains_china(text):
pattern = r"\b(我国)\b" # 匹配以"我国"开头的单词,加\b防止匹配部分词组
return bool(pattern.search(text))
# 应用函数到指定列
filtered_rows = df[df[column_name].apply(contains_china)]
# 打印或保存结果
print(filtered_rows)
```
这个脚本会返回一个DataFrame,其中只包含`File2 LongText`列中包含“我国”的行。
阅读全文
相关推荐











