首页使用request爬取http://data.eastmoney.com/hsgtcg/list.html网页的所有内容并保存在excel表中

使用request爬取http://data.eastmoney.com/hsgtcg/list.html网页的所有内容并保存在excel表中

时间: 2023-12-20 12:04:08 浏览: 266

好的，首先需要安装一些依赖包，包括`requests`、`beautifulsoup4`和`openpyxl`。你可以在终端中使用以下命令来安装： ``` pip install requests beautifulsoup4 openpyxl ``` 然后，我们可以使用`requests`库来获取网页的内容，再使用`beautifulsoup4`库来解析网页中的内容，最后使用`openpyxl`库将数据保存到Excel表中。下面是代码实现： ```python import requests from bs4 import BeautifulSoup import openpyxl # 获取网页内容 url = 'http://data.eastmoney.com/hsgtcg/list.html' res = requests.get(url) res.encoding = 'utf-8' html = res.text # 解析网页内容 soup = BeautifulSoup(html, 'html.parser') table = soup.find('table', class_='tab1') rows = table.find_all('tr') # 创建Excel表格 workbook = openpyxl.Workbook() worksheet = workbook.active worksheet.title = '沪股通持股' # 写入表头 header = ['序号', '股票代码', '股票名称', '持股数量', '持股市值（万元）', '占流通股比例', '占总股本比例', '持股变化'] for col_num, column_title in enumerate(header, 1): cell = worksheet.cell(row=1, column=col_num) cell.value = column_title # 写入数据 row_num = 2 for row in rows: cols = row.find_all('td') if len(cols) == 0: continue data = [col.text.strip() for col in cols] for col_num, cell_value in enumerate(data, 1): cell = worksheet.cell(row=row_num, column=col_num) cell.value = cell_value row_num += 1 # 保存Excel表格 workbook.save('沪股通持股.xlsx') print('数据保存成功！') ``` 运行以上代码后，会在当前目录下生成一个名为`沪股通持股.xlsx`的Excel表格，里面包含了网页上的所有数据。

阅读全文

最新推荐

使用request爬取http://data.eastmoney.com/hsgtcg/list.html网页的所有内容并保存在excel表中

相关推荐

VBA抓取HTML网页数据：实例解析表格标签

Python爬虫实战：批量采集股票数据并存储到Excel

Python股票爬虫实战：抓取沪深股市数据

利用爬虫爬取https://data.eastmoney.com/ifdata/kcsj.html中金属铜的库存数据

用selenium爬取https://data.eastmoney.com/xg/xg/?mkt=kzz页面信息

用python爬取https://data.eastmoney.com/ifdata/kcsj.html中的金属铜的库存数据（包括库存和库存变动），保存在csv文件中

编写城区爬取https://data.eastmoney.com/xg/xg/?mkt=kzz中可转债数据，判断程序中class类是否正确

爬取https://caifuhao.eastmoney.com/news/20230426161531148443550里面的评论内容

在爬取https://guba.eastmoney.com/list,300059.html?from=BaiduAladdin时出现如下错误：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 248: invalid continuation byte 写出解决方法

使用python爬去东方财富https://data.eastmoney.com/bkzj/gn.html 的概念板块资金流入流出所有内容

https://data.eastmoney.com/gdhs/用python写个爬虫爬取这个网站，获取股东户数

请设计一个phthon代码，将https://data.eastmoney.com/ifdata/kcsj.html中的table信息爬虫下来

爬取上证指数近30天数据注:1网站: http://quote.eastmoney.com/zs000001.html具体数据源自k线图(k线图如下图所示)2爬取数据包括: 开盘、收盘、最高、最低、换手率每个编程接口最多可能有365个数据

爬取上证指数近30天数据 注：①网站： http://quote.eastmoney.com/zs000001.html，具体数据 源自k线图（k线图如下图所示) ②爬取数据包括：开盘、收盘、最高、最低、换手率 ③每个编程接口最多可能有365个数据

打开http://guba.eastmoney.com/list,000506.html，获取帖子的阅读数、评论数、标题、作者、时间并输出。

用python编写一个读取https://data.eastmoney.com/xg/xg/?mkt=kzz网址中转债相关的数据

用python编写程序抓取https://data.eastmoney.com/xg/xg/?mkt=kzz可转债相关数据，并验证是否能成功

最新推荐

RuoYi-Vue 全新 Pro 版本，优化重构所有功能

(源码)基于Spring Boot和MyBatis的订餐管理系统.zip

深入浅出：自定义 Grunt 任务的实践指南

管理建模和仿真的文件

数据可视化在缺失数据识别中的作用

ABB机器人在自动化生产线中是如何进行路径规划和任务执行的？请结合实际应用案例分析。

网络物理突变工具的多点路径规划实现与分析

"互动学习：行动中的多样性与论文攻读经历"

自动化缺失值处理脚本编写

SQLite在非易失性内存环境下如何进行事务处理和缓冲区管理的优化？

爬取上证指数近30天数据注：①网站： http://quote.eastmoney.com/zs000001.html，具体数据源自k线图（k线图如下图所示) ②爬取数据包括：开盘、收盘、最高、最低、换手率 ③每个编程接口最多可能有365个数据