python爬取十大热点的例程
时间: 2024-11-09 17:27:36 浏览: 13
Python爬虫通常使用requests库获取网页内容,BeautifulSoup或PyQuery解析HTML,然后使用如pandas存储数据。下面是一个简单的例子,展示如何爬取并列出某个网站的十大热点新闻标题:
```python
import requests
from bs4 import BeautifulSoup
# 目标网站URL
url = "https://www.example.com/top-10-news"
# 发送GET请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 找到包含新闻标题的元素,假设它们在`div`标签中
news_titles = soup.find_all('div', class_='news-title')
# 假设每个标题在第一个`h2`标签内
top_news = [title.find('h2').text for title in news_titles[:10]]
print("十大热门新闻标题:")
for index, title in enumerate(top_news, start=1):
print(f"{index}. {title}")
else:
print("无法加载页面")
阅读全文