用pandas库爬取http://www.weather.com.cn/textFC/hb.shtml并存入excle文件
时间: 2023-12-22 16:06:36 浏览: 186
Python爬取某招聘网站信息并保存excle
这是一个需要使用爬虫技术的任务。以下是一个示例代码,可以使用pandas库和requests库实现:
```python
import requests
import pandas as pd
url = 'http://www.weather.com.cn/textFC/hb.shtml'
response = requests.get(url)
response.encoding = 'utf-8'
html = response.text
table = pd.read_html(html, header=0)[0]
table.to_excel('weather.xlsx', index=False)
```
这段代码首先使用requests库获取网页的html代码,然后使用pandas的read_html函数将表格数据解析成DataFrame格式,最后将DataFrame保存到excle文件中。请注意,由于网页的编码方式可能不同,需要根据具体情况设置encoding属性。
阅读全文