以及获取文章内容
时间: 2024-01-16 13:03:09 浏览: 53
在前面提取标题、链接、作者和时间的代码基础上,可以通过访问帖子链接,获取帖子的内容:
```python
for article in articles:
title = article.find("font", {"class": "list_title"}).text
link = article.find("a")["href"]
author = article.find("td", {"class": "list_vspace"}).text.strip()
time = article.find("td", {"class": "eng list_vspace"}).text.strip()
# 访问帖子链接,获取帖子内容
article_response = requests.get(link)
article_content = article_response.content
article_soup = BeautifulSoup(article_content, "html.parser")
content = article_soup.find("td", {"class": "board-contents"}).text.strip()
print(title, link, author, time, content)
```
在这里,我们访问了每个帖子的链接,获取了帖子的详细内容。需要注意的是,有些帖子内容可能包含了HTML标签和特殊字符,需要进行相应的处理。同时,也需要注意网站的反爬虫机制,不要发送过于频繁的请求,以免触发网站的限制机制。