bodydata中字符串如下： [talkid:138031378]2014年4月20日 05:55:45 , 111222 向 323456 发送我们已经是好友了，开始聊天吧！ [talkid:138031379]2014年4月20日 06:55:45 , 111222 向 342112 发送我们已经是好友了，开始聊天吧！ [talkid:137031381]2014年4月20日 03:55:45 , 2323234 在群 20011 中发言我们已经是好友了，开始聊天吧！ [talkid:137031382]2014年4月22日 04:45:45 , 2323234 在群 20011 中发言音频 :[<a href="files/f/f123fsasfsfsjdfrhf_n.m4a"]>音频</a> [talkid:137031383]2014年4月23日 04:55:45 , 2323234 在群 20011 中发言图片 :[<a href="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片</a> [talkid:137031384]2014年4月24日 05:55:45 , 2323234 在群 20011 中发言我们已经是好友了，开始聊天吧！ [talkid:137031385]2014年4月25日 06:55:45 , 2323234 在群 20011 中发言我们已经是好友了，开始聊天吧！使用Python爬虫提取“发送”或“中发言”后的文字，如果包含</a href>标签，则设置content默认为空

时间: 2023-10-20 08:05:37 浏览: 142

你可以使用以下代码来提取 "发送" 或 "中发" 后的文字，并在有 "</a href>" 标签时将 content 设置为空： ```python import re body_data = ''' [talkid:138031378]2014年4月20日 05:55:45 , 111222 向 323456 发送我们已经是好友了，开始聊天吧！ [talkid:138031379]2014年4月20日 06:55:45 , 111222 向 342112 发送我们已经是好友了，开始聊天吧！ [talkid:137031381]2014年4月20日 03:55:45 , 2323234 在群 20011 中发言我们已经是好友了，开始聊天吧！ [talkid:137031382]2014年4月22日 04:45:45 , 2323234 在群 20011 中发言音频 :[<a href="files/f/f123fsasfsfsjdfrhf_n.m4a"]>音频</a> [talkid:137031383]2014年4月23日 04:55:45 , 2323234 在群 20011 中发言图片 :[<a href="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片</a> [talkid:137031384]2014年4月24日 05:55:45 , 2323234 在群 20011 中发言我们已经是好友了，开始聊天吧！ [talkid:137031385]2014年4月25日 06:55:45 , 2323234 在群 20011 中发言我们已经是好友了，开始聊天吧！ ''' matches = re.findall('(中发言|发送)\s(.*?)\s', body_data) for match in matches: content = match[1] if '</a href>' in content: content = '' print(content) ``` 这段代码将提取 "发送" 或 "中发言" 后的文字，并在 content 中包含 "</a href>" 标签时将其设置为空。你可以根据需要将这部分代码整合到你的爬虫代码中。

阅读全文

相关推荐

youzheng.zip_site:www.pudn.com_注册 登录

关于微信小程序的支付开发：40013错误

detekt-hint：检测Kotlin中作为detekt插件的设计原则冲突

[talkid:137031385]2014年4月25日 06:55:45 , 2323234 在群 20011 中发言 我们已经是好友了，开始聊天吧！使用python爬虫提取“ 发言”后的文字

毕设和企业适用springboot企业数据管理平台类及跨境电商管理平台源码+论文+视频.zip

基于net的超市管理系统源代码（完整前后端+sqlserver+说明文档+LW）.zip

LABVIEW程序实例-公式节点.zip

毕设和企业适用springboot社交应用平台类及用户数据分析平台源码+论文+视频.zip

大米商城开源版damishop(适合外贸)

LABVIEW程序实例-通过全局变量接收数据.zip

毕设和企业适用springboot生鲜鲜花类及生物识别平台源码+论文+视频.zip

毕设和企业适用springboot企业健康管理平台类及视觉识别平台源码+论文+视频.zip

毕设和企业适用springboot视频编辑类及餐饮管理平台源码+论文+视频.zip

LABVIEW程序实例-日历控件.zip

最新推荐

毕设和企业适用springboot企业数据管理平台类及跨境电商管理平台源码+论文+视频.zip

基于net的超市管理系统源代码（完整前后端+sqlserver+说明文档+LW）.zip

LABVIEW程序实例-公式节点.zip

毕设和企业适用springboot社交应用平台类及用户数据分析平台源码+论文+视频.zip

大米商城开源版damishop(适合外贸)

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践

youzheng.zip_site:www.pudn.com_注册登录

[talkid:137031385]2014年4月25日 06:55:45 , 2323234 在群 20011 中发言我们已经是好友了，开始聊天吧！使用python爬虫提取“ 发言”后的文字