请帮我用js写一个正则匹配li标签的href和title

好的，可以使用以下正则表达式来匹配li标签中的href和title属性： ```javascript const regex = /<li.*?><a\s+href="([^"]*)"\s*title="([^"]*)"/gi; ``` 其中，`([^"]*)`表示匹配任何非双引号字符的序列，`\s+`表示匹配一个或多个空格字符，`gi`分别表示全局匹配和不区分大小写的匹配。你可以在代码中使用`match()`方法来执行正则表达式匹配，例如： ```javascript const html = '<ul><li><a href="http://example.com" title="Example">Example</a></li></ul>'; const regex = /<li.*?><a\s+href="([^"]*)"\s*title="([^"]*)"/gi; let match; while ((match = regex.exec(html)) !== null) { const href = match[1]; const title = match[2]; console.log(`href: ${href}, title: ${title}`); } ``` 这段代码将输出： ``` href: http://example.com, title: Example ```

运行下面代码，运行结果没有保存文件，请帮我找出原因 # -- coding: utf-8 -- # 指定文件编码格式为utf-8 import urllib.request import re def getNovertContent(): url = 'http://www.quannovel.com/read/640/' req = urllib.request.Request(url) req.add_header( 'User-Agent', ' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36') data = urllib.request.urlopen(req).read().decode('gbk') str1 = str(data) # 将网页数据转换为字符串 reg = r'<li><a href="(.?)" title=".?">(.?)</a><li>' reg = re.compile(reg) urls = reg.findall(str1) for url in urls: novel_url = url[0] novel_title = url[1] chapt = urllib.request.urlopen(novel_url).read() chapt_html = chapt.decode('gbk') reg = r'</script> (.?)</script> type="text/javascript">' reg = re.compile(reg, re.S) chapt_content = reg.findall(reg, chapt_html) chapt_content = chapt_content[0].replace( " ", "") chapt_content = chapt_content.replace("<br />", "") print("正在保存 %s" % novel_title) with open("{}.txt".format(novel_title), 'w') as f: f.write(chapt_content) getNovertContent()

代码中存在两个问题导致没有保存文件： 1. 在正则表达式匹配章节内容时，应该调用 `reg.findall(chapt_html)` 而不是 `reg.findall(reg, chapt_html)`。 2. 在打开文件时，需要指定文件的编码格式为 utf-8，因为在代码开头已经指定了文件编码格式为 utf-8。可以将 `with open("{}.txt".format(novel_title), 'w') as f:` 改为 `with open("{}.txt".format(novel_title), 'w', encoding='utf-8') as f:`。修改后的代码如下： ```python # -- coding: utf-8 -- # 指定文件编码格式为utf-8 import urllib.request import re def getNovertContent(): url = 'http://www.quannovel.com/read/640/' req = urllib.request.Request(url) req.add_header('User-Agent', ' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36') data = urllib.request.urlopen(req).read().decode('gbk') str1 = str(data) # 将网页数据转换为字符串 reg = r'<li><a href="(.+?)" title=".+?">(.+?)</a><li>' reg = re.compile(reg) urls = reg.findall(str1) for url in urls: novel_url = url[0] novel_title = url[1] chapt = urllib.request.urlopen(novel_url).read() chapt_html = chapt.decode('gbk') reg = r'</script> (.+?)</script> type="text/javascript">' reg = re.compile(reg, re.S) chapt_content = reg.findall(chapt_html) chapt_content = chapt_content[0].replace(" ", "") chapt_content = chapt_content.replace("<br />", "") print("正在保存 %s" % novel_title) with open("{}.txt".format(novel_title), 'w', encoding='utf-8') as f: f.write(chapt_content) getNovertContent() ```

阅读全文

请帮我用js写一个正则匹配li标签的href和title

相关推荐

JS实现点击li标签弹出对应的索引功能【案例】

JavaScript正则表达式匹配 div style标签

js通过正则匹配没有内容的空标签

XPath和正则表达式：网页内容定位和匹配

正则表达式提取网址、标题、图片等一例（.Net Asp Javascript/Js）的实现

轻松学习javascript

Web开发基础：韩顺平笔记解读HTML, CSS, JavaScript与RegExp

HTML解析利器：BeautifulSoup与正则表达式的完美组合

BeautifulSoup与正则表达式的完美结合：提升数据提取效率

【正则表达式与rvest】：打造数据提取规则，提升数据抓取质量

【数据抓取高级技巧】bs4与正则表达式：提取复杂数据的秘诀

JavaScript页面解析：结合Selenium与BeautifulSoup的技术指南

从零到一：用Django Forms构建用户注册系统的专业教程

【Django Admin验证技巧】：使用django.contrib.admin.validation解决常见问题的5个步骤

CSS选择器使用攻略：BeautifulSoup中的高级技巧

【Java HTML解析器入门】：JSoup使用技巧与案例教程

Django us_states：调试和故障排除

bs4中的CSS选择器：快速定位和提取网页内容的秘诀

pyparsing在XML和HTML分析中的应用：高效处理标记语言，提取关键信息

大家在看

新项目基于YOLOv8的人员溺水检测告警监控系统python源码(精确度高)+模型+评估指标曲线+精美GUI界面.zip

Handbook of PI and PID Controller Tuning Rules 3e

中国AI安防行业：Ambarella业绩反映AI需求强劲.zip

0065-极智AI-解读T4上商汤OpenPPL vs TensorRT7 vs TensorRT8性能对比修正-个人笔记

hanlp 自然语言处理入门

最新推荐

java正则表达式匹配网页所有网址和链接文字的示例

Java实现字符串匹配（基于正则）

STM32之光敏电阻模拟路灯自动开关灯代码固件

PHP在线工具箱源码站长引流+在线工具箱源码+多款有趣的在线工具+一键安装

PowerShell控制WVD录像机技术应用

管理建模和仿真的文件

Honeywell打印机驱动提升秘诀：从基础到高级配置的全方位解析

Python输入三个数 a,b,c。判断能否以它们为三个边长构成直角三角形。若能，输出 YES，否则 输出NO。

探索杂货店后端技术与JavaScript应用

"互动学习：行动中的多样性与论文攻读经历"

Python输入三个数 a,b,c。判断能否以它们为三个边长构成直角三角形。若能，输出 YES，否则输出NO。