python爬取出来的结果怎么存到Excel
时间: 2024-06-02 09:07:10 浏览: 39
中?
您可以使用Python中的xlwt或openpyxl库来将爬取的结果存储到Excel中。使用这些库,您可以先创建一个Excel文件,然后将数据写入文件中。下面是一个简单的代码示例:
import xlwt
# 创建Excel文件
workbook = xlwt.Workbook()
# 创建一个工作表
worksheet = workbook.add_sheet('Result')
# 写入表头
worksheet.write(0, 0, 'URL')
worksheet.write(0, 1, 'Title')
# 写入数据
for i in range(len(urls)):
worksheet.write(i+1, 0, urls[i])
worksheet.write(i+1, 1, titles[i])
# 保存文件
workbook.save('result.xls')
相关问题
python爬取数据保存到excel
1. 安装所需模块
使用Python爬虫需要安装requests、beautifulsoup4、openpyxl模块。可以通过以下命令进行安装:
```
pip install requests
pip install beautifulsoup4
pip install openpyxl
```
2. 爬取数据
以爬取豆瓣电影Top250为例,代码如下:
```python
import requests
from bs4 import BeautifulSoup
import openpyxl
# 定义表头
header = ['电影名称', '评分', '评价人数', '导演', '主演', '年份', '国家', '类型']
# 创建Excel工作簿
wb = openpyxl.Workbook()
ws = wb.active
ws.append(header)
# 爬取豆瓣电影Top250
url = 'https://movie.douban.com/top250'
for i in range(0, 250, 25):
params = {'start': i, 'filter': ''}
r = requests.get(url, params=params)
soup = BeautifulSoup(r.text, 'html.parser')
movies = soup.find_all('div', class_='info')
for movie in movies:
# 获取电影信息
name = movie.find('span', class_='title').text
rating_num = movie.find('span', class_='rating_num').text
rating_people = movie.find('div', class_='star').find_all('span')[-1].text[:-3]
director = movie.find('div', class_='bd').find_all('p')[0].text.split(':')[1].split('\n')[0].strip()
actors = movie.find('div', class_='bd').find_all('p')[0].text.split(':')[-1].strip()
year = movie.find('div', class_='bd').find_all('p')[1].text.split('/')[0].strip()
country = movie.find('div', class_='bd').find_all('p')[1].text.split('/')[1].strip()
genre = movie.find('div', class_='bd').find_all('p')[1].text.split('/')[-1].strip()
# 将电影信息写入Excel表格
row = [name, rating_num, rating_people, director, actors, year, country, genre]
ws.append(row)
# 保存Excel表格
wb.save('douban_movie_top250.xlsx')
```
3. 结果展示
运行上述代码后,会在当前目录下生成一个名为douban_movie_top250.xlsx的Excel文件,文件内容如下图所示:
![excel](https://img-blog.csdnimg.cn/20211029102914820.png)
如何使用python爬取网页数据存储到excel表中
要将网页数据存储到 Excel 表中,可以使用 Pandas 库和 openpyxl 库。
首先,使用 Pandas 库将网页数据读入到 DataFrame 中。然后,使用 openpyxl 库将 DataFrame 中的数据写入到 Excel 表中。
下面是一个示例代码:
```python
import pandas as pd
from openpyxl import Workbook
# 发送 HTTP 请求获取网页内容
url = 'https://www.example.com'
response = requests.get(url)
html = response.text
# 将网页内容读入到 DataFrame 中
df = pd.read_html(html)[0]
# 创建 Excel 表
wb = Workbook()
ws = wb.active
# 将 DataFrame 中的数据写入到 Excel 表中
for r in dataframe_to_rows(df, index=False, header=True):
ws.append(r)
# 保存 Excel 表
wb.save('example.xlsx')
```
其中,pd.read_html() 方法可以将 HTML 表格转换成 Pandas DataFrame,dataframe_to_rows() 方法可以将 DataFrame 转换成行列表。将行列表写入到 Excel 表中时,需要使用 ws.append() 方法。最后,使用 wb.save() 方法保存 Excel 表。
需要注意的是,写入 Excel 表时需要安装 openpyxl 库。另外,写入中文时需要设置编码格式,例如:
```python
ws.cell(row=i, column=j, value=str(df.iloc[i-2,j-1]).encode('utf-8'))
```
阅读全文
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![rar](https://img-home.csdnimg.cn/images/20241231044955.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![-](https://img-home.csdnimg.cn/images/20241231044930.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)