用python的requests、lxml、pandas、selenium编写一段代码。以https://www.sciencedirect.com/journal/the-lancet为初始界面，等待10秒，用selenium点击该页面上的链接（class="anchor js-volume volume-issue-text anchor-default"），跳转后等待10秒，用selenium点击该页面上的链接（class="switch-check switch-small js-previews-switch"），等待10秒，获取该页面上文章的标题、摘要、作者。建立excel表格，将结果导入excel表格

时间: 2023-03-20 20:01:56 浏览: 74

import requests from lxml import etree import pandas as pd from selenium import webdriverurl = 'https://www.sciencedirect.com/journal/the-lancet' driver = webdriver.Chrome() driver.get(url)#等待10秒 driver.implicitly_wait(10)#用selenium点击该页面上的链接（class="anchor js-volume volume-issue-text anchor-default"） links_1=driver.find_elements_by_css_selector('a.anchor.js-volume.volume-issue-text.anchor-default') for i in range(len(links_1)): links_1[i].click()#等待10秒 driver.implicitly_wait(10)#用selenium点击该页面上的链接（class="switch-check switch-small js-previews-switch"） links_2=driver.find_elements_by_css_selector('a.switch-check.switch-small.js-previews-switch') for i in range(len(links_2)): links_2[i].click()#等待10秒 driver.implicitly_wait(10)#获取该页面上文章的标题、摘要、作者 titles=driver.find_elements_by_css_selector('h2.article-title') titles=[i.text for i in titles] abstracts=driver.find_elements_by_css_selector('p.Para') abstracts=[i.text for i in abstracts] authors=driver.find_elements_by_css_selector('div.Authors') authors=[i.text for i in authors]#建立excel表格，将结果导入excel表格 dataframe = pd.DataFrame({'title':titles, 'abstract':abstracts, 'author':authors}) dataframe.to_excel('result.xlsx')

相关推荐

http://python-requests.org/库的透明持久缓存-Python开发

下载社会学相关公开数据的简单爬虫 http://www.dingxing.gov.cn/czyslist-394-more.

ofborg：@ofborg工具自动化https：//monitoring.nix.cidashboarddbofborg

4. Python Selenium-web：模拟用户行为

Python爬虫中的网页解析技术对比：Beautiful Soup vs. lxml

使用Python Selenium-web自动化：网页元素定位与交互

基于Python的Selenium-web自动化：利用PageFactory提高测试代码可维护性

Python Selenium-web自动化实战：简单网页操作

写一个python爬虫代码https://www.ddyueshu.com/1_1641/41234927.html

用python编写爬虫程序实现以下功能：爬取https://www.sciencedirect.com/science/article/pii/S0148296319304564中Abstract内容

python爬取https://www.xuanxiaodi.com/ranks/2391-1.html排名

python，写个爬虫代码爬取https://www.liaoxuefeng.com/wiki/1016959663602400

用Python编写一个爬取'https://www.mh4.cc'网页数据的爬虫

编写程序，读取“https://www.python.org”网站首页内容

写python代码，爬取https://www.ccdi.gov.cn/scdcn/内容

用python写一个爬取https://www.ivsky.com/tupian/meinv_t50/图片的代码

写一段Python爬虫代码爬取https://arxiv.org/abs/2303.16680的内容

给出用python爬取https://www.kaggle.com/datasets/sudhanshu2198/oil-spill-detection数据的代码

用python3.9写一段代码爬取https://d9737h.top/p/1/24195.html中的视频

最新推荐

课设毕设基于SSM的毕业生就业信息管理系统-LW+PPT+源码可运行

STM32设置闹钟中断-博文程序源码

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

SPDK_NVMF_DISCOVERY_NQN是什么 有什么作用

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

Windows 运行Python脚本

SPDK_NVMF_DISCOVERY_NQN是什么有什么作用