python爬虫爬取网页所需的文字内容
时间: 2023-07-08 09:45:01 浏览: 140
一个可以抓取网页特定内容的爬虫
要爬取网页中的文字内容,可以使用Python中的requests和beautifulsoup库。以下是一个简单的例子:
```python
import requests
from bs4 import BeautifulSoup
# 发送请求并获取网页内容
url = "https://www.example.com"
response = requests.get(url)
html = response.content
# 解析网页内容并获取文字
soup = BeautifulSoup(html, "html.parser")
text = soup.get_text()
print(text)
```
这段代码中,我们首先使用requests库发送请求并获取网页内容。然后使用beautifulsoup库将网页内容解析成一个BeautifulSoup对象。最后使用get_text()方法获取网页中的所有文字内容。
阅读全文