首页python 正则之提取excel单元格中的汉字,数字,字母

python 正则之提取excel单元格中的汉字,数字,字母

时间: 2024-04-10 13:26:54 浏览: 231

通过excel实现，批量提取汉字和数字

帮助大家快速学会提取单元格内的汉字和数字。支持如下模式： 1.前面是汉字，后面是数字 2.前面是数字，后面是汉字 3.汉字和数字混排，不规则的混排

要提取Excel单元格中的汉字、数字和字母，你可以使用Python的正则表达式模块`re`。下面是一个示例代码，演示如何实现这个功能： ```python import openpyxl import re # 打开Excel文件 workbook = openpyxl.load_workbook('your_file.xlsx') # 选择要操作的工作表 sheet = workbook['Sheet1'] # 遍历每个单元格 for row in sheet.iter_rows(): for cell in row: # 提取汉字、数字和字母 result = re.findall(r'[\u4e00-\u9fa5a-zA-Z0-9]+', str(cell.value)) # 打印结果 if result: print(result) # 关闭Excel文件 workbook.close() ``` 你需要将代码中的`'your_file.xlsx'`替换为你要处理的Excel文件的路径。代码将遍历工作表中的每个单元格，并使用正则表达式`r'[\u4e00-\u9fa5a-zA-Z0-9]+'`提取汉字、数字和字母。请注意，上述示例假设Excel单元格的值是字符串类型。如果值是其他类型，你可能需要进行适当的转换。另外，正则表达式也可以根据你的需求进行调整，以匹配更多或更少的字符。

阅读全文