用python写一段代码,提取以下网址中的文字,并保存为word文档。
时间: 2023-06-02 14:01:55 浏览: 144
用python爬取网页并导出为word文档.docx
以下是用Python实现的代码:
```python
import requests
from bs4 import BeautifulSoup
from docx import Document
# 网址列表
urls = [
'https://www.python.org/',
'https://www.baidu.com/',
'https://www.github.com/'
]
# 创建Word文档对象
doc = Document()
# 循环遍历网址列表
for url in urls:
# 发送HTTP请求并获取网页内容
response = requests.get(url)
html = response.content
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(html, 'html.parser')
# 获取网页中的文字内容
text = soup.get_text()
# 将文字内容添加到Word文档中
doc.add_paragraph(text)
# 保存Word文档
doc.save('result.docx')
```
运行以上代码,会在当前目录下生成一个名为`result.docx`的Word文档,其中包含了三个网址的文字内容。
阅读全文