def get_detail(self,page_source): result = [] htmls = etree.HTML(page_source) count = htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div') temp="" list_1 = [] creat_time ="".join(htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/div[2]/a[1]/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") user_name ="".join(htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/div[1]/div[2]/a/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") title ="".join(htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/p[1]/a[1]/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") # text ="".join(htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div[1]/div/div[1]/div[2]/p[2]/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") text ="".join(htmls.xpath('//[@id="pl_feedlist_index"]/div[2]/div/div/div[1]/div[2]/p/text()')).strip(" ").strip("\n").strip("\u3000").strip("\u200b") list_1 =[str(creat_time),str(user_name),str(title),str(text)] result.append(list_1) titles=full3+'\\'+user_name+'.txt' f = open(titles,'a',encoding='utf-8',newline='') f.write(str(creat_time)+"\n") f.write(str(user_name)+"\n") f.write(str(title)+"\n") for i in range( 0, len(text), 80 ): temp+=text[i:i+80]+"\n"

时间: 2024-03-07 08:51:31 浏览: 122

RAR

html+tree

标题“html+tree”可能指的是一个关于HTML与树形结构结合的应用或技术，可能是用于构建网页的交互式目录、导航菜单或者是数据展示的一种方式。在HTML中，元素可以通过DOM（Document Object Model）形成一个树状结构，这有助于理解和操作页面内容。在给出的博文链接中，虽然无法直接查看内容，但根据iteye博客平台，我们可以推测博主"PJZ19880808"可能分享了关于如何使用HTML和相关技术来创建或操作树形结构的技巧或工具。可能涉及的内容包括： 1. **HTML基础**：讲解HTML的基本语法，如元素、属性、标签等，以及它们如何构建网页的结构。 2. **DOM解析**：介绍DOM是如何将HTML文档转化为可编程的对象模型，使得JavaScript或其他脚本语言可以动态地访问和修改页面内容。 3. **树形结构的表示**：如何使用HTML和CSS创建视觉上呈现为树状的布局，例如通过无序列表（`<ul>`和`<li>`）和嵌套元素实现层次结构。 4. **JavaScript操作**：利用JavaScript进行树形数据的动态加载、展开、折叠等交互功能，可能涉及到事件监听和DOM操作方法。 5. **jQuery或其他库的应用**：如果博主提到了“工具”，那么可能使用了jQuery或者其他前端框架，如Bootstrap，来简化树形结构的实现。 6. **数据结构与算法**：如何将后台数据转换为适合显示为树形结构的格式，可能涉及到递归算法或者JSON数据结构的处理。 7. **示例代码与实践**：博主可能提供了具体的代码片段，演示如何创建和操作HTML树，供读者学习和实践。在“文件名称列表”中，有两个项目：“testtree”和“第五章”。这可能是博主提供的示例代码或者教程的章节，"testtree"可能是实现树形结构的一个测试文件，而"第五章"可能是一个系列教程的第五部分，详细讲解了某个特定的树形结构相关话题。由于没有实际的文件内容，以上分析都是基于标题、描述和标签的推测。在实际学习中，你需要访问博文链接获取具体信息，并可能需要下载提供的文件来进一步理解并实践HTML+tree的相关技术。

这段代码看起来像是用来从网页源代码中提取特定信息的。具体来说，它首先使用XPath语法来定位页面中的特定元素，例如用户名称、发布时间、标题和正文。然后，它将这些信息格式化为一个列表，并将其附加到结果列表中。接下来，它将这些信息写入一个文本文件中，其中文本被格式化为每80个字符一行。这个函数似乎是用来将微博的详细内容保存到本地文件中。

阅读全文

相关推荐

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通