Pattern L_PATTERN = Pattern.compile("\\d+(\\.\\d+)?[ ]?");

引用\[1\]:在给定的代码中，Pattern L_PATTERN = Pattern.compile("\\d+(\\.\\d+)?\[ \]?");是用来创建一个正则表达式模式的对象。这个模式用于匹配一个或多个数字，可选地跟随一个小数点和小数部分，最后可能有一个空格。其中，\\d表示匹配一个数字，+表示匹配一个或多个前面的元素，\\.表示匹配一个小数点，\\d+表示匹配一个或多个数字，?表示匹配前面的元素零次或一次，\[ \]表示匹配一个空格。所以，这个模式可以匹配如"123"、"3.14"、"42 "等字符串。 #### 引用[.reference_title] - *1* *2* *3* [Java中Pattern.compile函数的用法](https://blog.csdn.net/huangjhai/article/details/104096183)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

import requests # 导入网页请求库 from bs4 import BeautifulSoup # 导入网页解析库 import pandas as pd import numpy as np import re import matplotlib.pyplot as plt from pylab import mpl danurl=[]; def get_danurl(surl): r=requests.get(surl) r.encoding='utf-8' demo=r.text soup=BeautifulSoup(demo,"html.parser") wangzhi=soup.find_all('a',string=re.compile('杭州市小客车增量指标竞价情况')) list3=' '.join('%s' %id for id in wangzhi) res_url=r'href="(.?)"' alink = re.findall(res_url, list3, re.I | re.S | re.M) return alink def get_page(url): mydict={} r=requests.get(url) r.encoding='utf-8' demo=r.text #print(demo) soup=BeautifulSoup(demo,"html.parser") try: duan2=soup.find_all('p',class_="p")[0].text duan3=soup.find_all('p',class_="p")[2].text pattern3 = re.compile(r'(?<=个人)\d+.?\d') gerenbj=pattern3.findall(duan2)[0] jingjiariqi=soup.find_all('p',class_="p")[0].text.split('。')[0] except IndexError: duan2=soup.find_all('p',class_="p")[2].text duan3=soup.find_all('p',class_="p")[4].text pattern3 = re.compile(r'(?<=个人)\d+.?\d') gerenbj=pattern3.findall(duan2)[0] jingjiariqi=soup.find_all('p',class_="p")[2].text.split('。')[0] duan1=soup.find_all('p')[1].text pattern1 = re.compile(r'(?<=个人增量指标)\d+.?\d') gerenzb=pattern1.findall(duan1)[0] pattern2 = re.compile(r'(?<=单位增量指标)\d+.?\d') danweizb=pattern2.findall(duan1)[0] pattern4 = re.compile(r'(?<=单位)\d+.?\d') danweibj=pattern4.findall(duan2)[0] pattern5 = re.compile(r'(?<=个人)\d+.?\d') mingerencjj=pattern5.findall(duan3)[0] avegerencjj=pattern5.findall(duan3)[1] pattern6 = re.compile(r'(?<=单位)\d+.?\d') mindanweicjj=pattern6.findall(duan3)[0] avedanweicjj=pattern6.findall(duan3)[1] pattern7 = re.compile(r'(?<=成交)\d+.?\d*') mingerencjs=pattern7.findall(duan3)[0] mindanweicjs=pattern7.findall(duan3)[1] 解释代码

这段代码是用来爬取杭州市小客车增量指标竞价情况的数据。首先导入了requests库和BeautifulSoup库，用于进行网页请求和解析。然后定义了一个函数`get_danurl`，用于获取竞价情况网页的链接。函数中首先发送一个GET请求获取网页内容，然后使用BeautifulSoup进行解析，找到所有包含"杭州市小客车增量指标竞价情况"文本的链接，并通过正则表达式提取出链接地址。接下来是`get_page`函数，用于获取具体页面的数据。函数中同样发送一个GET请求获取网页内容，并使用BeautifulSoup进行解析。然后通过一些规则提取出所需的数据，如个人增量指标、单位增量指标、个人竞价、单位竞价、个人成交、单位成交等。最后返回一个包含这些数据的字典。

优化这段代码private static final Pattern P_QUOTED_ATTRIBUTES = Pattern.compile("([a-z0-9]+)=([\"'])(.*?)\\2", Pattern.CASE_INSENSITIVE | Pattern.DOTALL)

这段代码是用于匹配 HTML 标签中的属性和属性值，其中正则表达式 `([a-z0-9]+)=([\"'])(.*?)\\2` 匹配了一个属性和它的属性值。这个正则表达式可以进一步优化，具体有以下几个方面： 1. 去掉不必要的括号。正则表达式中的括号会生成捕获组，而如果不需要这些捕获组，可以将括号去掉以提高效率。因此，可以将 `([a-z0-9]+)` 和 `(.*?)` 中的括号去掉。 2. 使用单引号代替双引号。正则表达式中的双引号需要转义，而单引号则不需要，因此可以将 `([\"'])` 改为 `(')`。 3. 将属性名中的字符集改为更精确的字符集。属性名中可以包含字母、数字和减号，因此可以将 `[a-z0-9]` 改为 `[a-zA-Z0-9-]`。综上所述，可以将原来的正则表达式改为 `([a-zA-Z0-9-]+)='(.*?)'`，代码如下： ```java private static final Pattern P_QUOTED_ATTRIBUTES = Pattern.compile("([a-zA-Z0-9-]+)='(.*?)'", Pattern.CASE_INSENSITIVE | Pattern.DOTALL); ```

阅读全文

Pattern L_PATTERN = Pattern.compile("\\d+(\\.\\d+)?[ ]?");

优化这段代码private static final Pattern P_QUOTED_ATTRIBUTES = Pattern.compile("([a-z0-9]+)=([\"'])(.*?)\\2", Pattern.CASE_INSENSITIVE | Pattern.DOTALL)

相关推荐

Pattern的用法实例

正则表达式笔记（re.search_re.match_re.split_re.compile_用法） - douzujun -

Python中请不要再用re.compile了

self.pkg_name_pattern = re.compile(r"\w+(\.\w+)+")

优化这段代码private static final Pattern P_UNQUOTED_ATTRIBUTES = Pattern.compile("([a-z0-9]+)(=)([^\"\\s']+)", Pattern.CASE_INSENSITIVE | Pattern.DOTALL)

error_404_pattern = re.compile(r'^404$')解释一下这段代码里面的compile

error_404_pattern = re.compile(r'^404$')解释一下这段代码

C:\Users\test\PycharmProjects\pythonProject\1234.py:24: DeprecationWarning: The 'text' argument to find()-type methods is deprecated. Use 'string' instead. talkid_data = soup.find_all(text=re.compile(pattern))

说出以下代码的知识点aabb_pattern = re.compile(r'(\w)\1(\w)\2') aabc_pattern = re.compile(r'(\w)\1\w(\w)') abac_pattern = re.compile(r'(\w)\w(\w)\1')

Pattern pattern = Pattern.compile("@\\d+=(.*?)(?=(?:\\s/\\*|$|\\s@\\d+=))"); 这个正则不对，@4的值没有读出来

telnet_pattern1 = re.compile(r'6c6f67696e3a.*?0d|4c6f67696e3a.*?0d') 这段代码是什么意思

punctuation_pattern = re.compile(r'^[\W_]+$') filtered_lst =

import re x = '12.22,,22.33,121.2,444,222.33' pattern = re.compile(r'^(\-)?\d+(\.\d{1,2})?$') while re.search(pattern, x): m = re.search(pattern, x) x = re.sub(m.group(0), m.group(1), x) print(x)检查代码

Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(email); 代码解释

Pattern pattern = Pattern.compile("(#\\{(.*?)})"); Matcher matcher = pattern.matcher(sql);

大家在看

第五版数字通信ppt汇总

ASML_Reticle_manual_Final_2007

计算机组成与体系结构(性能设计)答案完整版-第八版

中南大学943数据结构1997-2020真题&解析

MOOC工程伦理课后习题答案（主观+判断+选择）期末考试答案.docx

最新推荐

vb定时显示报警系统设计(论文+源代码)(2024a7).7z

S7-PDIAG工具使用教程及技术资料下载指南

管理建模和仿真的文件

CC-LINK远程IO模块AJ65SBTB1现场应用指南：常见问题快速解决

python 画一个进度条

Nginx 1.19.0版本Windows服务器部署指南

"互动学习：行动中的多样性与论文攻读经历"

CC-LINK远程IO模块在环境监控中的应用：技术与案例探讨

Linux C开发中，如何判断open()函数创建的fd没有被close()

欧美风格生活信息网站模板下载

Pattern pattern = Pattern.compile("@\\d+=(.?)(?=(?:\\s/\\|$|\\s@\\d+=))"); 这个正则不对，@4的值没有读出来

telnet_pattern1 = re.compile(r'6c6f67696e3a.?0d|4c6f67696e3a.?0d') 这段代码是什么意思