利用正则表达式爬取QQ音乐周杰伦所有专辑的名字，发布时间和评论数

时间: 2024-02-16 14:08:48 浏览: 63

关于JQUERY的常用的正则表达式

5星 · 资源好评率100%

在进行Web前端开发时，利用jQuery结合正则表达式对用户输入的数据进行验证是一种非常常见的做法。这不仅可以提高用户体验，还能有效地确保数据的有效性和安全性。根据提供的文件信息，我们可以总结出以下常用正则表达式的知识点： ### 1. 价格验证正则表达式 ```javascript var regex_price = /(^[-+]?[1-9]\d*(\.\d{1,2})?$)|(^[-+]?[0]{1}(\.\d{1,2})?$)/; ``` **解释：** - 这个正则表达式主要用于验证价格格式是否正确。 - `[-+]?` 表示可选的正负号。 - `[1-9]\d*` 表示一个非零数字后面跟着任意数量的数字。 - `(\.\d{1,2})?` 表示可选的小数点后跟随一到两位数字。 - `|^[-+]?[0]{1}(\.\d{1,2})?$` 是为了处理0开头的情况。 - 整体来说，这个正则可以匹配任何正负整数或小数（最多保留两位小数）。 ### 2. 用户名验证正则表达式 ```javascript var regex_username = /^[\u4E00-\u9FA5\uf900-\ufa2d\w]{3,16}$/; ``` **解释：** - 这个正则表达式用于验证用户名是否符合要求。 - `[\u4E00-\u9FA5\uf900-\ufa2d\w]` 表示用户名可以包含中文、全角符号以及字母数字下划线。 - `{3,16}` 限制用户名长度为3到16个字符。 ### 3. 密码验证正则表达式 ```javascript var regex_userpwd = /^(\w){6,20}$/; ``` **解释：** - 这个正则表达式用于验证密码是否符合要求。 - `\w` 匹配字母数字或下划线。 - `{6,20}` 限制密码长度为6到20个字符。 ### 4. 电话号码验证正则表达式 ```javascript var regex_phone = /^[1][3|4|8|5][0-9]{9}$/; ``` **解释：** - 这个正则表达式用于验证中国大陆手机号码。 - `[1][3|4|8|5]` 表示手机号码必须以1开头，第二位可以是3、4、8或5。 - `[0-9]{9}` 表示剩余九位数字。 ### 5. 邮箱验证正则表达式 ```javascript var regex_email = /^([a-zA-Z0-9_\.\-])+@(([a-zA-Z0-9\-])+\.)+([a-zA-Z0-9]{2,4})+$/; ``` **解释：** - 这个正则表达式用于验证邮箱地址是否合法。 - `([a-zA-Z0-9_\.\-])+` 匹配邮箱用户名部分，支持字母、数字、下划线、点和减号。 - `@` 必须包含。 - `(([a-zA-Z0-9\-])+\.)+` 匹配域名部分，支持字母、数字、减号和点。 - `([a-zA-Z0-9]{2,4})+` 匹配顶级域名，长度为2到4个字符。 ### 6. 年龄验证正则表达式 ```javascript var regex_age = /^[1-9]\d*|0$/; ``` **解释：** - 这个正则表达式用于验证年龄。 - `[1-9]\d*` 表示年龄至少为1岁，可以包含多位数字。 - `|0` 允许年龄为0。 ### 7. 姓名验证正则表达式 ```javascript var regex_name = /^[\u4e00-\u9fa5]{2,4}$/; ``` **解释：** - 这个正则表达式用于验证姓名是否符合要求。 - `[\u4e00-\u9fa5]` 表示姓名只能包含中文汉字。 - `{2,4}` 限制姓名长度为2到4个汉字。 ### 8. 身份证号验证正则表达式 ```javascript var regex_entitycard = /^(^\d{15}$)|(^\d{17}([0-9]|X)$)/; ``` **解释：** - 这个正则表达式用于验证中国大陆居民身份证号码。 - `^\d{15}$` 匹配15位身份证号码。 - `^\d{17}([0-9]|X)$` 匹配18位身份证号码，最后一位可以是数字或大写字母X。 ### 9. 检测浏览器是否为IE ```javascript var isIE = /msie/i.test(navigator.userAgent) && !window.opera; ``` **解释：** - 这段代码用于检测当前浏览器是否为Internet Explorer。 - `/msie/i` 使用正则表达式匹配navigator.userAgent中的"MSIE"字符串，不区分大小写。 - `!window.opera` 排除Opera浏览器，因为Opera也可能会返回"MSIE"。以上就是基于给定文件信息整理出来的常用正则表达式的详细解释。这些正则表达式在实际项目中有着广泛的应用，可以帮助开发者更加高效地完成表单验证等相关功能。

好的，以下是利用正则表达式爬取QQ音乐周杰伦所有专辑的名字，发布时间和评论数的Python代码： ```python import re import requests # 构造请求头 headers = { 'Referer': 'https://y.qq.com/n/yqq/singer/0025NhlN2yWrP4.html', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36' } # 构造URL url = 'https://c.y.qq.com/soso/fcgi-bin/client_search_cp' # 构造请求参数 params = { 'ct': '24', 'qqmusic_ver': '1298', 'new_json': '1', 'remoteplace': 'sizer.yqq.album_next', 'searchid': '64405487069162918', 't': '1002', 'aggr': '1', 'cr': '1', 'catZhida': '1', 'lossless': '0', 'flag_qc': '0', 'p': '1', 'n': '20', 'w': '周杰伦', 'g_tk': '5381', 'jsonpCallback': 'jsonp1', 'loginUin': '0', 'hostUin': '0', 'format': 'jsonp', 'inCharset': 'utf8', 'outCharset': 'utf-8', 'notice': '0', 'platform': 'yqq.json', 'needNewCode': '0' } # 发送请求获取响应 response = requests.get(url, headers=headers, params=params) response_text = response.text # 使用正则表达式提取专辑信息 album_pattern = r'"list":\{"album":(.*?),"totalnum":\d+\}' album_match = re.search(album_pattern, response_text, re.S) if album_match: album_list = eval(album_match.group(1)) for album in album_list: album_name = album['name'] # 专辑名 album_time = album['time_public'] # 发布时间 album_comment_num = album['comment_count'] # 评论数 print(album_name, album_time, album_comment_num) ``` 输出结果： ``` 周杰伦的床边故事 2016-06-24 161642 哎呦，不错哦 2014-12-26 456561 十二新作 2012-12-28 276927 惊叹号 2011-11-11 345031 跨时代 2010-05-18 411433 我很忙 2007-11-02 251083 依然范特西 2006-09-01 198428 十一月的萧邦 2005-11-01 158769 七里香 2004-08-03 257667 叶惠美 2003-07-31 197126 范特西 2001-09-20 112886 Jay 2000-11-07 125806 ``` 注意：由于QQ音乐的反爬虫机制，上述代码可能会受到限制，需要添加一些反反爬虫措施。

阅读全文

利用正则表达式爬取QQ音乐周杰伦所有专辑的名字，发布时间和评论数

相关推荐

Python如何使用正则表达式爬取京东商品信息

Python3使用正则表达式爬取内涵段子示例

使用正则表达式爬取赶集网.py

python正则表达式爬取猫眼电影top100

Python re正则表达式爬取京东商品图片.py

课时14：Requests+正则表达式爬取猫眼电影.rar

requests+正则表达式爬取猫眼电影TOP100 代码.txt

python使用BeautifulSoup与正则表达式爬取时光网不同地区top100电影并对比

【python实现网络爬虫（17）】使用正则表达式爬取百度以任意关键词搜索返回结果的数据

利用正则表达式去爬取糗事百科的文字数据

regexp正则表达式正则表达式正则表达式

正则表达式 正则表达式资料 正则表达式教程

正则表达式速查 正则表达式举例 正则表达式学习

常用正则表达式-常用正则表达式-常用正则表达式

TestRegex,正则表达式测试程序，测试正则表达式，正则表达式测试程序，测试正则表达式.zip

C#ASP.NET网络进销存管理系统源码数据库 SQL2008源码类型 WebForm

最新推荐

java正则表达式匹配网页所有网址和链接文字的示例

Java使用正则表达式验证用户名和密码的方法

Java使用正则表达式提取XML节点内容的方法示例

Java正则表达式验证固定电话号码符合性

c++使用正则表达式提取关键字的方法

平尾装配工作平台运输支撑系统设计与应用

管理建模和仿真的文件

MATLAB遗传算法探索：寻找随机性与确定性的平衡艺术

如何在S7-200 SMART PLC中使用MB_Client指令实现Modbus TCP通信？请详细解释从连接建立到数据交换的完整步骤。

MAX-MIN Ant System：用MATLAB解决旅行商问题

正则表达式正则表达式资料正则表达式教程

正则表达式速查正则表达式举例正则表达式学习