首页爬去某网站的最新的新闻 python代码

爬去某网站的最新的新闻 python代码

时间: 2023-10-31 09:04:21 浏览: 16

抓取网站的最新新闻，需要先了解该网站的网页结构和请求方式。下面是一个基本的Python爬虫代码，可以抓取某网站的最新新闻： ```python import requests from bs4 import BeautifulSoup url = 'http://www.example.com/news/latest/' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') news_list = soup.find_all('div', {'class': 'news-item'}) for news in news_list: title = news.find('h2').text.strip() time = news.find('span', {'class': 'time'}).text.strip() content = news.find('div', {'class': 'content'}).text.strip() print(title) print(time) print(content) print('-' * 50) ``` 以上代码使用requests库发送HTTP请求，然后使用BeautifulSoup库解析HTML页面，最后从页面中提取新闻标题、发布时间和内容。请注意，以上代码仅供参考，具体实现需要根据目标网站的实际情况进行调整。此外，爬取网站数据需要遵守相关法律法规和网站的规定，务必注意。