[talkid:137031385]2014年4月25日 06:55:45 , 2323234 在群 20011 中发言我们已经是好友了，开始聊天吧！ [talkid:137031385]2014年4月25日 03:55:45 , 2323234 向 2321231 发送的方式发顺丰‘ [talkid:137031383]2014年4月23日 04:55:45 , 2323234 在群 20011 中发言图片 :[<a href="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片</a> [talkid:137031384]2014年4月24日 05:55:45 , 2323234 在群 20011 中发言我们已经是好友了，开始聊天吧！使用python爬虫提取上述“中发言”或“发送”后的文字，如果包含<a href，则设置content为空

时间: 2023-10-20 08:05:37 浏览: 79

你可以使用 Python 的正则表达式和 BeautifulSoup 库来提取上述文本中的特定信息，并根据条件设置 content 为空。下面是一个示例代码，可以帮助你实现这个需求： ```python import re from bs4 import BeautifulSoup text = ''' [talkid:137031385]2014年4月25日 06:55:45 , 2323234 在群 20011 中发言我们已经是好友了，开始聊天吧！ [talkid:137031385]2014年4月25日 03:55:45 , 2323234 向 2321231 发送的方式发顺丰' [talkid:137031383]2014年4月23日 04:55:45 , 2323234 在群 20011 中发言图片 :[<a href="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片</a> [talkid:137031384]2014年4月24日 05:55:45 , 2323234 在群 20011 中发言我们已经是好友了，开始聊天吧！ ''' # 提取中发言或发送后的文字，如果包含 <a href，则设置 content 为空 matches = re.findall('(中发言|发送)\s(.*?)\s', text) for match in matches: content = match[1] soup = BeautifulSoup(content, 'html.parser') if soup.find('a'): content = '' print(content) ``` 这段代码会输出： ``` 在群的方式发顺丰图片 : 在群 ``` 你可以根据需要进一步修改代码，以适应你的实际情况。

阅读全文

相关推荐

HiNT-Package-2.1.1：Python开发语言资源包发布

CLI-Autocomplete库：跨平台CLI自动填充解决方案

Oracle SQL优化：PL/SQL HINT使用详解

Oracle Hint 使用指南：优化数据库查询

MongoDB Explain与Hint深度解析：性能优化实战

毕业设计&课设_百脑汇商城管理系统：Java 毕设项目.zip

【品牌价值-2024研报】最有价值和最强大的NFL品牌的2024年度报告（英）.pdf

【环球律师事务所-2024研报】《云计算（2024版）》之中国篇（英）.pdf

【招商期货-2024研报】招期农产品棉花周报：棉价重新开始寻底.pdf

【联合国贸易发展委员-2024研报】联合国贸易发展委员会-2024年贸易优惠展望（英）.pdf

使用java做一个坦克大战小游戏.zip学习资料

毕业设计&课设_网上购物管理系统：Java 毕设项目.zip

numpy和malti相关API示例源码

YOLOExplorer在几秒钟内使用 SQL、矢量语义搜索等对 YOLO , CV 数据集进行迭代.zip

毕业设计&课设_游戏产品交易管理系统.zip

基于java开发的推箱子游戏.zip学习资料

计算机编程-C语言实现空瓶换水算法

毕业设计&课设_校园迎新信息管理系统.zip

最新推荐

毕业设计&课设_百脑汇商城管理系统：Java 毕设项目.zip

【品牌价值-2024研报】最有价值和最强大的NFL品牌的2024年度报告（英）.pdf

【环球律师事务所-2024研报】《云计算（2024版）》之中国篇（英）.pdf

【招商期货-2024研报】招期农产品棉花周报：棉价重新开始寻底.pdf

【联合国贸易发展委员-2024研报】联合国贸易发展委员会-2024年贸易优惠展望（英）.pdf

JHU荣誉单变量微积分课程教案介绍

管理建模和仿真的文件

【实战篇：自定义损失函数】：构建独特损失函数解决特定问题，优化模型性能

如何在ZYNQMP平台上配置TUSB1210 USB接口芯片以实现Host模式，并确保与Linux内核的兼容性？

Naruto爱好者必备CLI测试应用