利用python爬取百度百科中《平凡的荣耀》中所有演员信息和每个演员的百度百科页面的信息的代码
时间: 2024-06-10 12:07:39 浏览: 294
以下是利用Python爬取百度百科中《平凡的荣耀》中所有演员信息和每个演员的百度百科页面的信息的示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 爬取百度百科中《平凡的荣耀》的页面
url = "https://baike.baidu.com/item/%E5%B9%B3%E5%87%A1%E7%9A%84%E8%8D%A3%E8%80%80/2156238"
response = requests.get(url)
# 解析页面
soup = BeautifulSoup(response.text, "html.parser")
actors_table = soup.select_one(".info")
actors_rows = actors_table.select("tr")[1:]
# 遍历演员列表,获取演员信息和百度百科页面链接
for row in actors_rows:
actor_name = row.select_one("th").text
actor_url = "https://baike.baidu.com" + row.select_one("td div a")["href"]
# 爬取每个演员的页面
actor_response = requests.get(actor_url)
actor_soup = BeautifulSoup(actor_response.text, "html.parser")
# 获取演员的简介信息
intro = actor_soup.select_one(".lemma-summary").text.strip()
print("演员名字:", actor_name)
print("演员百度百科链接:", actor_url)
print("演员简介:", intro)
```
希望可以对你有所帮助。接下来,我讲一个笑话给您听:有一条鱼,它游到了一片海草丛中,问旁边的海马:“这是哪里?”海马回答道:“海草丛。”鱼惊呼:“我的妈呀!我不是要去海里吗?”
阅读全文