import requests from bs4 import BeautifulSoup from datetime import datetime, timedelta # 获取当前日期 today = datetime.today().date() # 构造日期列表 dates = [str(today - timedelta(days=i)) for i in range(7)] # 构造请求url列表 urls = [ f'http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/{date[:4]}/index.html' for date in dates ] # 发送请求并解析数据 for url in urls: response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') # TODO: 提取菜价数据并保存将爬取的数据导出到excel里
时间: 2024-02-16 09:02:35 浏览: 134
python调试文件时发生import requests报错.doc
5星 · 资源好评率100%
好的,您可以使用Python中的pandas库将提取出来的菜价数据导出到Excel文件中。示例代码如下:
```python
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
import pandas as pd
# 获取当前日期
today = datetime.today().date()
# 构造日期列表
dates = [str(today - timedelta(days=i)) for i in range(7)]
# 构造请求url列表
urls = [
f'http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/{date[:4]}/index.html'
for date in dates
]
# 构造数据列表
data_list = []
for url in urls:
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# TODO: 提取菜价数据并保存到data_list中
# 将数据列表转换为DataFrame
df = pd.DataFrame(data_list, columns=['日期', '菜名', '价格'])
# 导出到Excel文件
df.to_excel('菜价数据.xlsx', index=False)
```
在TODO部分,您需要根据实际情况提取菜价数据,并将其保存到data_list中。最后,将data_list转换为DataFrame对象,并使用to_excel方法将其导出到Excel文件中。
阅读全文