strip(" ").strip("\n").strip("\u3000\u3000 \u200b")什么意思

这是一个Python字符串操作，用于去除字符串开头和结尾的空格、换行符和Unicode空格字符（包括全角空格和零宽空格字符）。具体解释如下： - strip(" ")：去除开头和结尾的空格字符。 - strip("\n")：去除开头和结尾的换行符。 - strip("\u3000\u3000 \u200b")：去除开头和结尾的Unicode空格字符，包括全角空格（\u3000）、半角空格（\u0020）和零宽空格（\u200b）。这个操作可以用于清理文本数据中的空白和换行符，使得文本更加整洁。

def get_detail(self,page_source): result = [] htmls = etree.HTML(page_source) count = htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div') temp="" list_1 = [] # creat_time ="".join(htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/div[2]/a[1]/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") creat_time ="".join(htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div//div/div[1]/div[2]/div[2]/a[1]/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") user_name ="".join(htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/div[1]/div[2]/a/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") title ="".join(htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/p[1]/a[1]/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") # text ="".join(htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/p[2]/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") text ="".join(htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div/div/div[1]/div[2]/p/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") list_1 =[str(creat_time),str(user_name),str(title),str(text)] result.append(list_1) titles=full3+'\\'+user_name+'.txt' f = open(titles,'a',encoding='utf-8',newline='') f.write(str(creat_time)+"\n") f.write(str(user_name)+"\n") f.write(str(title)+"\n") 怎么修改这段代码能够使得文本内容在不同用户名下存储

您可以将 `titles=full3+'\\'+user_name+'.txt'` 这一行代码放在 `user_name` 的赋值语句下方，这样每次处理一条微博时，都会根据 `user_name` 的不同来创建不同的文件。修改后的代码如下所示： ``` def get_detail(self, page_source): result = [] htmls = etree.HTML(page_source) count = htmls.xpath('//*[@id="pl_feedlist_index"]/div[2]/div') temp = "" list_1 = [] # creat_time ="".join(htmls.xpath('//*[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/div[2]/a[1]/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") creat_time ="".join(htmls.xpath('//*[@id="pl_feedlist_index"]/div[2]/div/*/div/div[1]/div[2]/div[2]/a[1]/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") user_name ="".join(htmls.xpath('//*[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/div[1]/div[2]/a/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") title ="".join(htmls.xpath('//*[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/p[1]/a[1]/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") # text ="".join(htmls.xpath('//*[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/p[2]/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") text ="".join(htmls.xpath('//*[@id="pl_feedlist_index"]/div[2]/div/div/div[1]/div[2]/p/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") list_1 =[str(creat_time),str(user_name),str(title),str(text)] titles = full3+'\\'+user_name+'.txt' f = open(titles,'a',encoding='utf-8',newline='') f.write(str(creat_time)+"\n") f.write(str(user_name)+"\n") f.write(str(title)+"\n") f.close() result.append(list_1) ``` 这样就可以实现将不同用户的微博内容存储在不同的文件中了。

\u200b\u200b\u200b是什么

C知道是一个基于CSDN开发的AI问答系统，它可以回答各种与编程、技术和计算机科学相关的问题。它使用了自然语言处理和机器学习技术，能够理解用户的问题并给出相应的答案。C知道可以提供编程语言、算法、数据结构、网络安全、数据库等方面的知识和帮助。用户可以通过输入问题或关键词来获取相关的信息和解决方案。C知道旨在帮助开发者和技术爱好者解决问题，提供技术支持和指导。

阅读全文

strip(" ").strip("\n").strip("\u3000\u3000 \u200b")什么意思

\u200b\u200b\u200b是什么

相关推荐

jre-8u201-windows-x64.exe

U200考勤软件说明书.doc

Citizen西铁城手表U200机芯快速说明书.pdf

UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\u200e’ in position 43: illegal multib...

在使用df["star"] = df["star"].str.strip().astype(int)和df["sentiment"] = df["star"].apply(lambda x: 1 if x >= 1 else 0)之后出现了报错ValueError: invalid literal for int() with base 10: '1\u200b'

\u200e对应的十六进制是什么

UnicodeEncodeError: 'gbk' codec can't encode character '\u200b' in position 43: illegal multibyte sequence是什么意思

pua_pattern = re.compile("[\uE000-\uF8FF]|[\u200b\u200d\u200e]")‘

invalid literal for int() with base 10: '\u200b'

Error:(170, 5) java: 非法字符: '\u200b'

python报错invalid non-printable character U+200B

java字符串 去掉\u200C

Error:(26, 98) java: 非法字符: '\u200b'

在反编译c#dll库的时候里面为什么会出现0F\u200D\u200D\u206F\u200B\u200D\u206D\u206C\u206D\u200E\u202E\u202B\u200D\u202A\u202E\u202B\u206E\u206B\u202D\u2

pandas删除所有Unicode字符集中的字符编码\u2013

UnicodeEncodeError: 'gbk' codec can't encode character '\u200b' in position 0: illegal multibyte sequence

USBCANFD-U200脚本二次开发

大家在看

NPPExport_0.3.0_32位64位版本.zip

H.323协议详解

单片机与DSP中的基于DSP的PSK信号调制设计与实现

DB2创建索引和数据库联机备份之间有冲突_一次奇特的锁等待问题案例分析-contracted.doc

IQ失衡_IQ失衡；I/Qimbalance；_IQ不均衡_

最新推荐

H3CNE-Security安全(GB0-510)题库13-11.docx

Windows下操作Linux图形界面的VNC工具

【SketchUp Ruby API：从入门到精通】

VMware虚拟机打开虚拟网络编辑器出现由于找不到vnetlib.dll,无法继续执行代码。重新安装程序可能会解决问题

基于Preact的高性能PWA实现定期天气信息更新

从停机到上线，EMC VNX5100控制器SP更换的实战演练

ubuntu labelme中文版安装

全新免费HTML5商业网站模板发布

EMC VNX5100控制器SP更换全流程指南：新手到高手的必备技能

lamada函数

java字符串去掉\u200C