python通过代码实现项目:税屋网站 网址:https://www.shui5.cn/article/BeiJingShiCaiShuiFaGui/ 要求:爬取10页数据,写入txt文档 数据内容: 1)标题 2)时间
时间: 2023-10-10 07:11:12 浏览: 44
好的,以下是使用requests库爬取税屋网站前10页数据并写入txt文档的Python代码。注意:请确保已经安装了requests库和BeautifulSoup库。
```python
import requests
from bs4 import BeautifulSoup
# 爬取税屋网站前10页数据
for page in range(1, 11):
url = f'https://www.shui5.cn/article/BeiJingShiCaiShuiFaGui/index_{page}.html'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
articles = soup.find_all('article')
# 将数据写入txt文档
with open('税屋网站数据.txt', 'a', encoding='utf-8') as f:
for article in articles:
title = article.find('h2').text.strip()
time = article.find('time').text.strip()
f.write(f'{title} {time}\n')
```
该代码将爬取税屋网站前10页数据,并将每篇文章的标题和时间写入名为“税屋网站数据.txt”的txt文档中。