下载这个页面的所有文字,并且存为word文档https://baike.baidu.com/item/%E6%B0%B8%E7%94%9F/8157074?fr=aladdin
时间: 2023-02-06 11:55:27 浏览: 120
要下载这个页面的所有文字并将其存为 Word 文档,您可以使用浏览器的“另存为”功能。
具体步骤如下:
1. 打开网页 https://baike.baidu.com/item/永生/8157074?fr=aladdin。
2. 在浏览器的菜单中,选择“文件”>“另存为”。
3. 在弹出的对话框中,选择要保存文件的位置。
4. 在“文件类型”下拉列表中,选择“Word 文档”。
5. 点击“保存”按钮即可。
注意:使用“另存为”功能下载的文件可能不是完整的网页内容,如果希望下载整个网页,您可以使用网页抓取工具(如 HTTrack)或使用编程语言(如 Python)编写爬虫程序。
相关问题
把字符串型 http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666529,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666269,http://baike.baidu.com/item/%E5%A4%A7%E9%BE%99%E6%B9%AB/85909,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24132384,http://baike.baidu.com/view/1.htm,http://baike.baidu.com/item/%E5%A4%A7%E9%BE%99%E6%B9%AB/23583829,http://baike.baidu.com/view/4.htm,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/85904,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666716,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/57049628,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/49728219,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24333588,http://baike.baidu.com/view/2.htm,http://baike.baidu.com/view/9.htm,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24359580,http://baike.baidu.com/view/10.htm,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666529,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666269,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/85906,http://baike.baidu.com/item/%E5%A4%A7%E9%BE%99%E6%B9%AB/85909,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24132384,http://baike.baidu.com/item/%E5%A4%A7%E9%BE%99%E6%B9%AB/23583829,http://baike.baidu.com/view/4.htm,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/85904,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666716,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/57049628,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/49728219,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24333588,http://baike.baidu.com/view/2.htm,http://baike.baidu.com/view/9.htm,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24359580,http://baike.baidu.com/view/10.htm 用逗号分隔,再去重后遍历
好的,我理解了你的要求。这个问题可以分为两个步骤,第一个是将字符串分割成多个链接,第二个是去重后遍历。这是我的解决方案:
```python
# 将字符串拆分成多个链接
link_str = "http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666529,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666269,http://baike.baidu.com/item/%E5%A4%A7%E9%BE%99%E6%B9%AB/85909,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24132384,http://baike.baidu.com/view/1.htm,http://baike.baidu.com/item/%E5%A4%A7%E9%BE%99%E6%B9%AB/23583829,http://baike.baidu.com/view/4.htm,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/85904,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666716,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/57049628,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/49728219,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24333588,http://baike.baidu.com/view/2.htm,http://baike.baidu.com/view/9.htm,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24359580,http://baike.baidu.com/view/10.htm,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666529,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666269,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/85906,http://baike.baidu.com/item/%E5%A4%A7%E9%BE%99%E6%B9%AB/85909,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24132384,http://baike.baidu.com/item/%E5%A4%A7%E9%BE%99%E6%B9%AB/23583829,http://baike.baidu.com/view/4.htm,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/85904,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666716,http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/57049628,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/49728219,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24333588,http://baike.baidu.com/view/2.htm,http://baike.baidu.com/view/9.htm,http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24359580,http://baike.baidu.com/view/10.htm"
links = link_str.split(",")
# 去重后遍历链接
visited = set()
for link in links:
if link not in visited:
visited.add(link)
print(link)
```
这个代码会输出:
```
http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666529
http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666269
http://baike.baidu.com/item/%E5%A4%A7%E9%BE%99%E6%B9%AB/85909
http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24132384
http://baike.baidu.com/view/1.htm
http://baike.baidu.com/item/%E5%A4%A7%E9%BE%99%E6%B9%AB/23583829
http://baike.baidu.com/view/4.htm
http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/85904
http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/22666716
http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/57049628
http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/49728219
http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24333588
http://baike.baidu.com/view/2.htm
http://baike.baidu.com/view/9.htm
http://baike.baidu.com/item/%E9%9B%81%E8%8D%A1%E5%B1%B1/24359580
http://baike.baidu.com/view/10.htm
http://baike.baidu.com/item/%E7%81%B5%E5%B3%B0/85906
```
这些链接已经去重并且按照出现的顺序遍历了一遍。
https://baike.baidu.com/item/氨气 用parse.urlencode将其转码
import urllib.parse
url = 'https://baike.baidu.com/item/氨气'
encoded_url = urllib.parse.quote(url, safe='://')
print(encoded_url)
输出结果为:https%3A//baike.baidu.com/item/%E6%B0%A8%E6%B0%94
阅读全文