生成一段代码，用python编写，能够爬取几个不同网页上，每条新闻的标题，作者，时间，最终导入excel表里

import requests from bs4 import BeautifulSoup import xlwt# 创建excel表 workbook = xlwt.Workbook(encoding = 'utf-8') sheet = workbook.add_sheet('Sheet1') # 设置表头 row0 = ['标题','作者','时间'] # 向表中写入表头 for i in range(0,3): sheet.write(0,i,row0[i]) # 爬取数据 urls = ['http://example1.com','http://example2.com','http://www.example3.com'] row_num = 1 for url in urls: response = requests.get(url) soup = BeautifulSoup(response.text,'html.parser') titles = soup.find_all('div',class_='title') authors = soup.find_all('div',class_='author') times = soup.find_all('div',class_='time') for i in range(0,len(titles)): sheet.write(row_num,0,titles[i].string) sheet.write(row_num,1,authors[i].string) sheet.write(row_num,2,times[i].string) row_num += 1# 保存excel表 workbook.save('news.xls')

阅读全文

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通