python爬取出来的结果怎么存到Excel
时间: 2024-06-02 14:07:10 浏览: 2
中?
您可以使用Python中的xlwt或openpyxl库来将爬取的结果存储到Excel中。使用这些库,您可以先创建一个Excel文件,然后将数据写入文件中。下面是一个简单的代码示例:
import xlwt
# 创建Excel文件
workbook = xlwt.Workbook()
# 创建一个工作表
worksheet = workbook.add_sheet('Result')
# 写入表头
worksheet.write(0, 0, 'URL')
worksheet.write(0, 1, 'Title')
# 写入数据
for i in range(len(urls)):
worksheet.write(i+1, 0, urls[i])
worksheet.write(i+1, 1, titles[i])
# 保存文件
workbook.save('result.xls')
相关问题
python爬取数据保存到excel
1. 安装所需模块
使用Python爬虫需要安装requests、beautifulsoup4、openpyxl模块。可以通过以下命令进行安装:
```
pip install requests
pip install beautifulsoup4
pip install openpyxl
```
2. 爬取数据
以爬取豆瓣电影Top250为例,代码如下:
```python
import requests
from bs4 import BeautifulSoup
import openpyxl
# 定义表头
header = ['电影名称', '评分', '评价人数', '导演', '主演', '年份', '国家', '类型']
# 创建Excel工作簿
wb = openpyxl.Workbook()
ws = wb.active
ws.append(header)
# 爬取豆瓣电影Top250
url = 'https://movie.douban.com/top250'
for i in range(0, 250, 25):
params = {'start': i, 'filter': ''}
r = requests.get(url, params=params)
soup = BeautifulSoup(r.text, 'html.parser')
movies = soup.find_all('div', class_='info')
for movie in movies:
# 获取电影信息
name = movie.find('span', class_='title').text
rating_num = movie.find('span', class_='rating_num').text
rating_people = movie.find('div', class_='star').find_all('span')[-1].text[:-3]
director = movie.find('div', class_='bd').find_all('p')[0].text.split(':')[1].split('\n')[0].strip()
actors = movie.find('div', class_='bd').find_all('p')[0].text.split(':')[-1].strip()
year = movie.find('div', class_='bd').find_all('p')[1].text.split('/')[0].strip()
country = movie.find('div', class_='bd').find_all('p')[1].text.split('/')[1].strip()
genre = movie.find('div', class_='bd').find_all('p')[1].text.split('/')[-1].strip()
# 将电影信息写入Excel表格
row = [name, rating_num, rating_people, director, actors, year, country, genre]
ws.append(row)
# 保存Excel表格
wb.save('douban_movie_top250.xlsx')
```
3. 结果展示
运行上述代码后,会在当前目录下生成一个名为douban_movie_top250.xlsx的Excel文件,文件内容如下图所示:
![excel](https://img-blog.csdnimg.cn/20211029102914820.png)
python如何爬取邮箱信息保存到excel
以下是一个简单的Python程序,用于从网页中爬取电子邮件地址,并将它们保存到Excel文件中:
```python
import requests
from bs4 import BeautifulSoup
import re
import pandas as pd
url = 'https://www.example.com' # 要爬取的网站URL
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
emails = []
for link in soup.find_all('a'):
if link.has_attr('href') and re.search(r'mailto:', link['href']):
email = link['href'][7:]
if email not in emails:
emails.append(email)
df = pd.DataFrame(emails, columns=['Email'])
df.to_excel('emails.xlsx', index=False)
```
说明:
1. 首先,我们使用requests库获取网页内容,并使用BeautifulSoup库解析网页。
2. 然后,我们遍历网页中的所有链接,并使用正则表达式检查是否为电子邮件地址。
3. 如果是,我们提取电子邮件地址并将其添加到一个列表中。
4. 最后,我们使用pandas库将电子邮件地址保存到Excel文件中。
请注意,这只是一个简单的示例程序。实际上,爬取电子邮件地址可能涉及到一些复杂的问题,例如反爬虫机制、HTML/CSS结构的变化等。因此,需要根据实际情况进行适当的修改和调整。
相关推荐
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)