python实现爬取百度词条内容
时间: 2024-06-07 12:02:31 浏览: 110
Python百度百科的爬取
5星 · 资源好评率100%
Python可以使用第三方库BeautifulSoup和requests来实现爬取百度词条内容的功能。以下是一个简单的示例代码:
```python
import requests
from bs4 import BeautifulSoup
def get_baidu_content(keyword):
url = f"https://www.baidu.com/s?wd={keyword}"
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, "html.parser")
content = soup.find("div", class_="c-container").get_text()
return content
keyword = "Python"
content = get_baidu_content(keyword)
print(content)
```
这段代码首先构造了一个百度搜索的URL,然后发送HTTP请求获取搜索结果页面的HTML内容。接着使用BeautifulSoup解析HTML,通过查找特定的HTML元素,获取到词条内容。最后将内容打印出来。
阅读全文