用Python编写爬虫程序

好的，下面是一个简单的Python爬虫程序示例（爬取豆瓣电影Top250）： ```python import requests from bs4 import BeautifulSoup url = 'https://movie.douban.com/top250' def get_html(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} try: response = requests.get(url, headers=headers) response.raise_for_status() response.encoding = response.apparent_encoding return response.text except Exception as e: print(e) return None def parse_html(html): soup = BeautifulSoup(html, 'html.parser') movies = [] for li in soup.find_all('li'): if li.find('div', class_='hd'): movie_name = li.find('span', class_='title').get_text() movie_rank = li.find('em').get_text() movie_info = li.find('div', class_='bd').find('p').get_text().strip() movie_rating = li.find('span', class_='rating_num').get_text() movie_comment = li.find('div', class_='star').find_all('span')[-1].get_text() movie = {'rank': movie_rank, 'name': movie_name, 'info': movie_info, 'rating': movie_rating, 'comment': movie_comment} movies.append(movie) return movies def main(): movies = [] for i in range(10): url = 'https://movie.douban.com/top250?start=' + str(i * 25) html = get_html(url) movies += parse_html(html) for movie in movies: print(movie) if __name__ == '__main__': main() ``` 这个程序使用requests库发送HTTP请求，获取豆瓣电影Top250的页面内容。然后使用BeautifulSoup库解析HTML内容，获取电影名称、排名、简介、评分和评论等信息。最后将获取到的电影信息输出到控制台。

用Python编写爬虫程序

相关推荐

python编写爬虫小程序

用Python语言编写一个爬虫程序

Python编写的爬虫程序

python编写爬虫程序

Python 编写爬虫程序

使用python编写爬虫程序实现数据的自动化获取

Python编写爬虫程序

使用python编写一个爬虫程序

使用Python编写爬虫程序，可以自动获取目标网站关于关键词幼儿园的信息

python编写网络爬虫程序

用python编写爬虫

用python 编写爬虫

使用Python语言编写网络爬虫程序

python编写一个爬虫程序

用python编写爬虫程序实现以下功能：爬取https://www.sciencedirect.com/science/article/pii/S0148296319304564中Abstract内容

用 python编写的爬虫项目集合

Python的爬虫程序编写框架Scrapy入门学习教程

Python爬虫学习之翻译小程序

最新推荐

微信小程序-番茄时钟源码

激光雷达专题研究：迈向高阶智能化关键，前瞻布局把握行业脉搏.pdf

安享智慧理财测试项目Mock服务代码

课程设计 基于SparkMLlib的ALS算法的电影推荐系统源码+详细文档+全部数据齐全.zip

华中科技大学电信专业 课程资料 作业 代码 实验报告-雷达与信息对抗-内含源码和说明书.zip

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

用 Python 画一个可以动的爱心

JSBSim Reference Manual

课程设计基于SparkMLlib的ALS算法的电影推荐系统源码+详细文档+全部数据齐全.zip

华中科技大学电信专业课程资料作业代码实验报告-雷达与信息对抗-内含源码和说明书.zip