爬去某网站的最新的新闻 python代码
时间: 2023-10-31 09:04:21 浏览: 16
抓取网站的最新新闻,需要先了解该网站的网页结构和请求方式。下面是一个基本的Python爬虫代码,可以抓取某网站的最新新闻:
```python
import requests
from bs4 import BeautifulSoup
url = 'http://www.example.com/news/latest/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
news_list = soup.find_all('div', {'class': 'news-item'})
for news in news_list:
title = news.find('h2').text.strip()
time = news.find('span', {'class': 'time'}).text.strip()
content = news.find('div', {'class': 'content'}).text.strip()
print(title)
print(time)
print(content)
print('-' * 50)
```
以上代码使用requests库发送HTTP请求,然后使用BeautifulSoup库解析HTML页面,最后从页面中提取新闻标题、发布时间和内容。请注意,以上代码仅供参考,具体实现需要根据目标网站的实际情况进行调整。此外,爬取网站数据需要遵守相关法律法规和网站的规定,务必注意。
相关推荐
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)