python根据网址页码分页爬取大麦网，使用__init__()

如果你想将网址和页码作为参数传递给类的初始化函数 `__init__()`，可以按照以下方式修改代码： ```python import requests from bs4 import BeautifulSoup class DamaiSpider: def __init__(self, keyword, num_pages): self.keyword = keyword self.num_pages = num_pages self.base_url = f"https://search.damai.cn/search.htm?keyword={keyword}" self.headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36" } def get_concert_info(self, page): url = f"{self.base_url}&currPage={page}" response = requests.get(url, headers=self.headers) soup = BeautifulSoup(response.text, "html.parser") concert_list = [] concert_items = soup.find_all("div", class_="item") for item in concert_items: concert_title = item.find("span", class_="txt-black").text.strip() concert_time = item.find("span", class_="txt-dmt-gray").text.strip() concert_location = item.find("div", class_="venueitem").text.strip() concert_info = { "title": concert_title, "time": concert_time, "location": concert_location } concert_list.append(concert_info) return concert_list def run(self): all_concert_info = [] for page in range(1, self.num_pages + 1): concert_info_list = self.get_concert_info(page) all_concert_info.extend(concert_info_list) return all_concert_info if __name__ == "__main__": spider = DamaiSpider(keyword="演唱会", num_pages=5) concert_info_list = spider.run() for concert in concert_info_list: print(concert) ``` 在这个示例中，我们创建了一个名为 `DamaiSpider` 的类。在类的初始化函数 `__init__()` 中，我们接受 `keyword` 和 `num_pages` 作为参数，并将其保存为类的属性。然后，在 `get_concert_info()` 方法中，我们使用保存的关键字和页码来构造URL。类的 `run()` 方法用于执行爬虫逻辑，它循环调用 `get_concert_info()` 方法来获取演唱会信息，并将所有信息存储在一个列表中。在主程序中，我们创建了 `DamaiSpider` 类的实例，并传入关键字和要爬取的页数。然后调用 `run()` 方法来运行爬虫并获取演唱会信息。最后，我们遍历演唱会信息列表并打印出来。请注意，在示例代码中，我们将关键字设置为"演唱会"，页码设置为5。你可以根据自己的需求修改这些参数。

阅读全文

python根据网址页码分页爬取大麦网，使用init()

相关推荐

python根据网址页码分页爬取大麦网，使用__init__()

相关推荐

python 爬取网页

使用Node.js编写爬虫抓取大麦网场馆数据

pdf_to_jpg.zip_Python_

python web框架中使用原生分页

python实现分页效果

Python Django 封装分页成通用的模块详解

python爬取百度贴吧前1000页内容（requests库面向对象思想实现）

Python-一个只需要处理获取的数据的Web分页组件

reportlab分页

Django自定义分页与bootstrap分页结合

Django原生sql也能使用Paginator分页的示例代码

【分页库对比】：django.core.paginator与其他Python分页库比较

【数据处理加速器】：使用UserDict优化Python应用性能

python tk 对查询的数据进行分页显示，python tk 对查询的数据进行分页显示并获取点击的对应行的信息，并获取点击的对应行的信息

用PYTHON 写一个类，可以进行MONGO数据库的增删改查，包含分页

用PYTHON 写一个类，可以进行MONGO数据库的增删改查，包含分页查询

python tk 对查询的数据进行分页显示，并在首列添加复选框，可以获取被选中的行对应行信息

（1）定义分页的地址结构和页表结构。 （2）对进程的逻辑地址空间、页表起址、给定的逻辑地址进行初始化。 （3）实现从逻辑地址到物理地址的变换。用python

免费的防止锁屏小软件，可用于域统一管控下的锁屏机制

Python代码实现带装饰的圣诞树控制台输出

大家在看

递推最小二乘辨识

论文研究-8位CISC微处理器的设计与实现.pdf

设置段落格式-word教学内容的PPT课件

QRCT调试指导.docx

python中matplotlib实现最小二乘法拟合的过程详解

最新推荐

Python模块包中__init__.py文件功能分析

Python爬虫实例_城市公交网络站点数据的爬取方法

如何基于python对接钉钉并获取access_token

python中时间转换datetime和pd.to_datetime详析

Python人脸识别第三方库face_recognition接口说明文档

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅

python根据网址页码分页爬取大麦网，使用init()

（1）定义分页的地址结构和页表结构。（2）对进程的逻辑地址空间、页表起址、给定的逻辑地址进行初始化。（3）实现从逻辑地址到物理地址的变换。用python

Python模块包中init.py文件功能分析