pattern = re.compile(r'^https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+') valid_links = all_infos['News_url'].apply(lambda x: pattern.match(x) is not None) all_infos = all_infos 上述代码中，若all_infos最开始是一个只包含3个列名的空DataFrame，如何让运行上述代码过后all_infos依然包含列名

在代码中，如果`all_infos`是一个只包含列名的空DataFrame，我们可以使用以下方法来确保在运行上述代码后，`all_infos`仍然包含列名： ```python import pandas as pd # 创建一个空的DataFrame，并指定列名 all_infos = pd.DataFrame(columns=['col1', 'col2', 'News_url']) # 运行原始代码 pattern = re.compile(r'^https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+') valid_links = all_infos['News_url'].apply(lambda x: pattern.match(x) is not None) all_infos = all_infos[valid_links] ``` 这样，无论`all_infos`最开始是一个空的DataFrame还是具有其他列名的DataFrame，都可以确保在运行代码后，`all_infos`仍然包含列名。

aa 为以Datetime Title News_url Source为列名的空DataFrame，运行以下代码： pattern = re.compile(r'^https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+') valid_links = aa['News_url'].apply(lambda x: pattern.match(x) is not None) aa = aa[valid_links] 之后，aa变成了没有列名的空DataFrme，请帮忙解决这个问题，保留aa的原列名

要保留`aa`的原列名，可以使用以下： ```python import pandas as pd import re # 创建一个空的DataFrame，并指定列名 aa = pd.DataFrame(columns=['Datetime', 'Title', 'News_url', 'Source']) # 创建正则表达式模式 pattern = re.compile(r'^https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+') # 使用apply和pattern.match验证链接格式，并筛选出符合条件的链接 valid_links = aa['News_url'].apply(lambda x: pattern.match(x) is not None) # 通过布尔索引筛选出符合条件的行，并保存回aa aa = aa.loc[valid_links] # 检查aa是否为空DataFrame，并且重新设置列名 if aa.empty: aa.columns = ['Datetime', 'Title', 'News_url', 'Source'] # 输出aa，确保列名被保留 print(aa) ``` 这样，无论`aa`最初是一个空的DataFrame还是具有其他列名的DataFrame，都可以确保在运行代码后，`aa`仍然包含列名。请注意，如果经过筛选后的`aa`为空DataFrame，则会使用`columns`属性重新设置列名。希望这可以解决您的问题。如有其他疑问，请随时提问。

pattern = re.compile(u'\t|\n|.|-|:|;|)|(|?|"')

在你提供的代码中，正则表达式模式存在一些问题。在正则表达式中，一些特殊字符需要进行转义，例如句点、连字符和括号。此外，如果你想匹配双引号，你还需要将其转义。下面是修正后的正则表达式模式： ```python pattern = re.compile(r'\t|\n|\.|-|:|;|\)|\(|\?|"') ``` 在这个修正后的模式中，特殊字符都已经进行了转义。现在你可以使用这个模式来去除字符串中的符合模式的字符。如果你还有其他问题，请随时提问。

pattern = re.compile(u'\t|\n|.|-|:|;|)|(|?|"')

相关推荐

java.lang.NoClassDefFoundError: javax/persistence/EntityListener

pds-registry-app:注册表应用程序，使PDS节点可以注册其所有数据产品，以便长期保存并与其他PDS系统共享

webpack-compiler-plugin：:building_construction:轻松聆听webpack编译器挂钩并在事件上执行命令

pattern = re.compile(r'%s such/jj as/in (?:%s )?%s' % (np, np2, lsep))分析一下

pattern=re.compile('"thumbURL":"(.*?)"')

pattern = re.compile(u'\t|\n| |；|\.|。|：|：\.|-|:|\d|;|、|，|\)|\(|\?|"')什么意思啊

pattern = re.compile(u'\t|\n| |；|\.|。|：|：\.|-|:|\d|;|、|，|\)|\(|\?|"') string_data = re.sub(pattern, '', string_data) 什么意思啊

pattern = re.compile(u'\t|\n|\.|-|:|;|\)|\(|\?|\"|') string_data = re.sub(pattern, '', string_data)

Pattern pattern = Pattern.compile("@\\d+=(.*?)(?=(?:\\s/\\*|$|\\s@\\d+=))"); 这个正则不对，@4的值没有读出来

用正则表达式.?board-index.?>(.?).?data-src="(.?)".?name.?a.?>(.?).?star.?>(.?).?releasetime.?>(.?).?integer.?>(.?).?fraction.?>(.?).?爬取猫眼电影排行：爬取猫眼电影TOP100的所有信息。网址：https://www.maoyan.com/board/4

pattern = re.compile(r\w+)

pattern = re.compile( '.*?board-index.*?>(.*?) .*?data-src="(.*?)".*?name.*?a.*?>(.*? )</),*2star,*2(,*9) </0》,*/releasetime,*2(*I

pattern = re.compile(u'\t|\n|\.|-|:|;|\)|\(|\?|"') # 定义正则表达式匹配模式 string_data = re.sub(pattern, '', string_data) # 将符合模式的字符去除

最新推荐

pre_o_1csdn63m9a1bs0e1rr51niuu33e.a

matlab建立计算力学课程的笔记和文件.zip

FT-Prog-v3.12.38.643-FTD USB 工作模式设定及eprom读写

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

2． 通过python绘制y=e-xsin(2πx)图像

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

Pattern pattern = Pattern.compile("@\\d+=(.?)(?=(?:\\s/\\|$|\\s@\\d+=))"); 这个正则不对，@4的值没有读出来

用正则表达式
.?board-index.?>(.?).?data-src="(.?)".?name.?a.?>(.?).?star.?>(.?).?releasetime.?>(.?).?integer.?>(.?).?fraction.?>(.?).?
爬取猫眼电影排行：爬取猫眼电影TOP100的所有信息。网址：https://www.maoyan.com/board/4

pattern = re.compile( '
.?board-index.?>(.?) .?data-src="(.?)".?name.?a.?>(.? )</),2star,2(,9) </0》,/releasetime,2(*I

2．通过python绘制y=e-xsin(2πx)图像