import requests from bs4 import BeautifulSoup url = 'http://www.greenfinancechina.com/zhengcefagui/list-1.html' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') # 获取政策标题和发布时间 policy_list = soup.find_all('div', class_='news-item') for policy in policy_list: title = policy.find('a').text time = policy.find('span', class_='time').text print(title, time)

这段代码用于爬取中国绿色金融网站上的政策信息，并输出政策标题和发布时间。如果您在 Spyder 中执行此代码，应该能够看到类似以下内容的输出： ```python 关于全面启动绿色信贷政策试点工作的通知 2021-11-02 关于发布《绿色债务融资外部评估管理办法》的公告 2021-11-02 ... ``` 这些输出显示了政策标题和发布时间。如果您想要保存这些政策信息，可以将输出写入文件中。例如，您可以将以下代码添加到循环中，将政策信息写入 CSV 文件中： ```python import csv # 打开 CSV 文件 with open('policies.csv', 'w', newline='', encoding='utf-8') as csvfile: writer = csv.writer(csvfile) writer.writerow(['title', 'time']) # 写入表头 # 写入政策信息 for policy in policy_list: title = policy.find('a').text time = policy.find('span', class_='time').text writer.writerow([title, time]) ``` 这样，政策信息就会被写入 CSV 文件中。请注意，您需要在代码中指定正确的文件路径，以便能够将数据写入到正确的文件中。

import requests from bs4 import BeautifulSoup url = 'http://www.greenfinancechina.com/zhengcefagui/list-1.html' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') # 获取政策标题和发布时间 policy_list = soup.find_all('div', class_='news-item') for policy in policy_list: title = policy.find('a').text time = policy.find('span', class_='time').text print(title, time)

这段代码可以用来爬取中国绿色金融网站上的政策信息，并将政策标题和发布时间输出到控制台上。您可以将这段代码保存为一个 Python 文件，然后在终端或者命令行中执行该文件。请注意，为了能够正常运行该代码，您需要安装 requests 和 BeautifulSoup 这两个库。您可以使用以下命令来安装这两个库： ```bash pip install requests pip install beautifulsoup4 ``` 如果您已经安装了这两个库，就可以运行该代码了。运行代码时，可能会遇到一些错误，例如网络连接错误或者解析错误。您可以根据错误提示修改代码或者调整网络设置，以便能够成功爬取政策信息。

修改代码，使得li_list的编码格式是utf-8import requests from bs4 import BeautifulSoup url = 'https://www.icbc.com.cn/page/827855918799994880.html' response = requests.get(url=url) page_response = response.text soup = BeautifulSoup(page_response, 'html.parser',from_encoding='utf-8') li_list = soup.select('#mypagehtmlcontent p')

import requests from bs4 import BeautifulSoup url = 'https://www.icbc.com.cn/page/827855918799994880.html' response = requests.get(url=url) page_response = response.content.decode('utf-8') soup = BeautifulSoup(page_response, 'html.parser') li_list = soup.select('#mypagehtmlcontent p') # 以下为测试代码，可以不用理会 for li in li_list: print(li.text)

阅读全文

相关推荐

Python爬虫实战：抓取http://www.win4000.com/美桌图片

Vue.js中的V-model插件：与RESTful服务的交互支持

被淘汰的Vuex-api库：轻松处理Vue.js中的API调用

以下代码爬取的内容是乱码，什么原因？from bs4 import BeautifulSoup import requests if name == 'main': url = 'https://www.pincai.com/article/2320333.htm' response = requests.get(url).text soup = BeautifulSoup(response, 'lxml')。帮我修改好代码

爬虫问题： （1）利用以下代码段获取指定url链接对应网页源代码 url='https://movie.douban.com/top250' importrequests strs=requests.

用python爬取新闻网页（URL：http://www.news.cn/politics/leaders/2023- 04/28/c_1129576764.htm）中的新闻文本。

使用requests库和BeautifulSoup爬取该网站https://top.baidu.com/board?tab=realtime

用requests获取 下一章href

大家在看

SM621G1 BA 手册

SCSI-ATA-Translation-3_(SAT-3)-Rev-01a

小华HC32L19X SPI 驱片外FLASH 例程

景象匹配精确制导中匹配概率的一种估计方法

STK Scheduler使用向导

最新推荐

Spring Websocket快速实现与SSMTest实战应用

电力电子技术的智能化：数据中心的智能电源管理

通过spark sql读取关系型数据库mysql中的数据

新版微软inspect工具下载：32位与64位版本

如何运用电力电子技术实现IT设备的能耗监控

2635.656845多位小数数字，js不使用四舍五入保留两位小数，然后把结果千分位，想要的结果是2,635.65;如何处理

解决最小倍数问题 - Ruby编程项目欧拉实践

电力电子技术：IT数据中心的能源革命者

设计一个程序，实现哈希表的相关运算：用Java语言编写

XMPP Web开发必备flXHR.js与strophe.flxhr.js文件介绍

爬虫问题：（1）利用以下代码段获取指定url链接对应网页源代码 url='https://movie.douban.com/top250' importrequests strs=requests.

用requests获取下一章href