首页用python爬取https://fin.paas.cmbchina.com/fininfo/interestrate网站的表格

用python爬取https://fin.paas.cmbchina.com/fininfo/interestrate网站的表格

时间: 2024-06-08 15:07:30 浏览: 160

python爬虫爬取网页表格数据

用python爬取网页表格数据，供大家参考，具体内容如下 from bs4 import BeautifulSoup import requests import csv import bs4 #检查url地址 def check_link(url): try: r = requests.get(url) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: print('无法链接服务器！！！') #爬取资源 def get_contents(ulist,rurl

你可以使用Python中的requests和BeautifulSoup库来爬取https://fin.paas.cmbchina.com/fininfo/interestrate网站的表格。首先，你需要发送一个GET请求来获取网页内容，然后使用BeautifulSoup库来解析HTML内容并提取表格。以下是代码示例： ```python import requests from bs4 import BeautifulSoup # 发送GET请求获取网页内容 url = 'https://fin.paas.cmbchina.com/fininfo/interestrate' response = requests.get(url) # 使用BeautifulSoup库解析HTML内容并提取表格 soup = BeautifulSoup(response.text, 'html.parser') table = soup.find('table', {'class': 'table'}) rows = table.find_all('tr') for row in rows: cols = row.find_all('td') for col in cols: print(col.text.strip(), end='\t') print() ``` 这段代码将会输出网页上的表格内容，每行一个记录，每个单元格用制表符分隔。你可以根据需要对输出进行格式化或存储为CSV文件。

阅读全文