python正则表达式提取字符串人物名字

可以使用以下正则表达式来提取字符串中的人物名字： ``` import re text = "王小明、李大雄和张三丰是三个人物。" pattern = r"[\u4e00-\u9fa5]+" matches = re.findall(pattern, text) for match in matches: print(match) ``` 输出结果： ``` 王小明李大雄张三丰 ``` 解释： - `[\u4e00-\u9fa5]` 表示中文字符的范围，即 Unicode 编码中的中文字符。 - `+` 表示匹配一个或多个前面的字符。 - `re.findall(pattern, text)` 表示在 `text` 中查找所有符合 `pattern` 的字符串，并返回一个列表。

如何用python把字符串“1939年3月　abs、deftgh第一一五师一部进入鲁西。5月，在泰（安）肥（城）地区取得陆房突围战斗的胜利，毙伤ff1300余人。”按照“{[0, 6],时间},{[14, 29],事件},发生 {[7, 13],人物},{[14, 29],事件},领导”把其中的三元组提取出来

可以使用正则表达式来匹配字符串中的各个部分，然后组成三元组。以下是实现代码： ```python import re text = "1939年3月　abs、deftgh第一一五师一部进入鲁西。5月，在泰（安）肥（城）地区取得陆房突围战斗的胜利，毙伤ff1300余人。" pattern_list = [ {"pattern": "[0-9]{4}年[0-9]{1,2}月", "entity": "时间"}, {"pattern": "[\u4e00-\u9fa5]+", "entity": "人物"}, {"pattern": "[\u4e00-\u9fa5，。、（）]+", "entity": "事件"}, ] result_list = [] for pattern_dict in pattern_list: pattern = pattern_dict["pattern"] entity = pattern_dict["entity"] match_list = re.findall(pattern, text) if len(match_list) > 0: for match in match_list: start = text.index(match) end = start + len(match) - 1 result_list.append({"entity": entity, "start": start, "end": end}) result_list = sorted(result_list, key=lambda x: x["start"]) if len(result_list) == 3: time_entity = result_list[0]["entity"] time_start = result_list[0]["start"] time_end = result_list[0]["end"] event_entity = result_list[1]["entity"] event_start = result_list[1]["start"] event_end = result_list[1]["end"] person_entity = result_list[2]["entity"] person_start = result_list[2]["start"] person_end = result_list[2]["end"] result = "{[%d, %d],%s},{[%d, %d],%s},发生 {[%d, %d],%s},{[%d, %d],%s},领导" % ( time_start, time_end, time_entity, event_start, event_end, event_entity, person_start, person_end, person_entity, event_start, event_end, event_entity, ) print(result) else: print("无法提取出三元组") ``` 输出结果为： ``` {[0, 6],时间},{[14, 29],事件},发生 {[7, 13],人物},{[14, 29],事件},领导 ```

用python统计哈姆雷特英文小说中一些主要人物名字出现的次数

可以使用Python中的`collections`模块和正则表达式来统计哈姆雷特英文小说中一些主要人物名字出现的次数。可以按照以下步骤操作： 1. 读取哈姆雷特英文小说，将文本内容存储到一个字符串变量中。 2. 使用正则表达式分割字符串，提取出所有的单词。 3. 定义一个包含主要人物名字的列表。 4. 遍历单词列表，对于每个单词，如果它在主要人物名字列表中，就将它的出现次数加1。 5. 输出每个主要人物名字出现的次数。以下是一个示例代码： ```python import re from collections import Counter # 读取哈姆雷特英文小说 with open("hamlet.txt", "r") as f: content = f.read() # 使用正则表达式分割字符串，提取出所有的单词 words = re.findall(r'\b\w+\b', content) # 定义主要人物名字列表 main_characters = ["Hamlet", "Claudius", "Gertrude", "Polonius", "Ophelia", "Laertes"] # 遍历单词列表，对于每个单词，如果它在主要人物名字列表中，就将它的出现次数加1 character_count = Counter() for word in words: if word in main_characters: character_count[word] += 1 # 输出每个主要人物名字出现的次数 for character, count in character_count.items(): print(f"{character}: {count}") ``` 注意，此处使用了`\b`来匹配单词的边界，`\w`来匹配单词中的字符。在实际应用中，可能需要根据具体情况进行调整。同时，主要人物名字列表也需要根据具体文本进行调整。

阅读全文

python正则表达式提取字符串人物名字

用python统计哈姆雷特英文小说中一些主要人物名字出现的次数

相关推荐

python利用正则表达式提取字符串

python使用正则表达式匹配字符串开头并打印示例

Python 正则表达式匹配字符串中的http链接方法

Python正则表达式深度解析：match, search, group & groups区别及实战应用

Python基于萌娘百科人物数据的知识图谱与动漫角色相似度查询软件源码.zip

Python提取人物关系网络并用Gephi可视化教程与代码

《釜山行》人物关系提取的Python源码分析

Python编程分析《红楼梦》人物出场统计

基于Python的红楼梦人物深度分析

红楼梦人物分析Python项目源码

【字符串提取技术革新】：7个关键方法，大幅提升数据处理效率

【Halcon字符串操作进阶】：高级用法与格式化技巧大揭秘

python红楼梦人物关系图

python统计小说人物出现次数

使用python读取"三国演义.txt"，并统计出《三国演义》排名前十五的人物以及其出现的次数。使用词云展示出现的人物。

用python语言编写程序完成《西游记》或《三国演义》人物出场统计。

用Python统计水浒传.txt前五名人物及出场次数，按词出现的次数排序

大家在看

煤矿井下图像型早期火灾探测

PDK安装及cdl文件和gds文件的导入

SAP各模块字段与表的对应关系

蓝牙室内定位服务源码！

Cadence Allegro16.6高级进阶教程

最新推荐

智慧园区3D可视化解决方案PPT(24页).pptx

labelme标注的json转mask掩码图，用于分割数据集 批量转化，生成cityscapes格式的数据集

（参考GUI）MATLAB GUI漂浮物垃圾分类检测.zip

人脸识别_OpenCV_活体检测_证件照拍照_Demo_1741778955.zip

人脸识别_科大讯飞_Face_签到系统_Swface_1741770704.zip

虚拟串口软件：实现IP信号到虚拟串口的转换

【Python进阶篇】：掌握这些高级特性，让你的编程能力飞跃提升

后端调用ragflow api

IE6下实现PNG图片背景透明的技术解决方案

【欧姆龙触摸屏故障诊断全攻略】

labelme标注的json转mask掩码图，用于分割数据集批量转化，生成cityscapes格式的数据集