python爬虫爬取名人名言
时间: 2023-12-22 16:29:37 浏览: 57
以下是使用Python爬虫爬取名人名言的示例代码:
```python
import requests
from bs4 import BeautifulSoup
def get_quotes():
url = 'http://quotes.toscrape.com/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
quotes = soup.find_all('div', class_='quote')
for quote in quotes:
text = quote.find('span', class_='text').text
author = quote.find('small', class_='author').text
print(f'{author}: {text}')
get_quotes()
```
这段代码使用了`requests`库发送HTTP请求,以及`BeautifulSoup`库解析HTML页面。它首先发送GET请求到名人名言网站(http://quotes.toscrape.com/),然后使用BeautifulSoup解析返回的HTML页面。通过查找特定的HTML元素,我们可以提取出名人名言的文本和作者,并将其打印出来。
相关问题
python爬虫爬取名言网
以下是使用Python爬虫爬取名言网的示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 设置请求头,模拟浏览器访问
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}
# 发送请求获取网页内容
url = 'https://mingyan.supfree.net/search.asp'
response = requests.get(url, headers=headers)
# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 获取名言列表
quote_list = soup.find_all('div', class_='quote')
# 遍历名言列表并提取信息
for quote in quote_list:
content = quote.find('span', class_='content').text
author = quote.find('span', class_='author').text
tag = quote.find('span', class_='tag').text
# 存储到数据库或其他地方
# ...
# 打印名言信息
print('名言:', content)
print('作者:', author)
print('标签:', tag)
print('--')
```
这段代码使用了requests库发送HTTP请求,通过设置请求头模拟浏览器访问。然后使用BeautifulSoup库解析网页内容,提取出名言的内容、作者和标签信息。你可以根据需要将这些信息存储到数据库或其他地方。最后,打印出每条名言的信息。
python爬虫爬取股票评论
Python爬虫是一种用于自动化获取网页数据的技术,可以用来爬取股票评论。以下是一种基本的Python爬虫爬取股票评论的步骤:
1. 导入所需的库:使用Python的requests库发送HTTP请求,使用BeautifulSoup库解析HTML页面。
2. 发送HTTP请求:使用requests库发送GET请求,获取股票评论所在的网页内容。
3. 解析HTML页面:使用BeautifulSoup库解析网页内容,提取出股票评论所在的HTML元素。
4. 提取评论数据:根据HTML元素的结构和属性,使用BeautifulSoup库提取出股票评论的文本内容。
5. 存储评论数据:将提取到的评论数据保存到本地文件或数据库中,以便后续分析和使用。
下面是一些相关问题:
1. 什么是Python爬虫?
2. Python爬虫有哪些常用的库?
3. 如何使用Python爬虫获取网页内容?
4. 如何使用BeautifulSoup库解析HTML页面?
5. 如何提取HTML页面中的特定数据?
6. 如何将爬取到的数据保存到本地文件或数据库中?