请用beautifulsoup提取网页中的text, author,tags,并保存为csv文件。命名为“quotes_zhangsan.csv” , 特征名称为“text”, ‘author’,‘tags’。
时间: 2024-06-10 14:07:06 浏览: 48
将网页中的文本信息进行提取
5星 · 资源好评率100%
好的,我明白了。以下是使用Python和BeautifulSoup提取网页中的text, author和tags,并将它们保存为CSV文件的示例代码:
```python
import csv
import requests
from bs4 import BeautifulSoup
# 网页链接
url = 'https://quotes.toscrape.com/page/1/'
# 进行请求,获取网页内容
response = requests.get(url)
# 将获取的文本作为 HTML 建立 BeautifulSoup 实例
soup = BeautifulSoup(response.text, 'html.parser')
# 提取名言信息
quotes = []
for quote in soup.find_all('div', {'class': 'quote'}):
text = quote.find('span', {'class': 'text'}).get_text()
author = quote.find('span', {'class': 'author'}).get_text()
tags = ', '.join(tag.get_text() for tag in quote.find_all('a', {'class': 'tag'}))
quotes.append([text, author, tags])
# 将名言信息保存为CSV文件
with open('quotes_zhangsan.csv', 'w', newline='', encoding='utf-8') as f:
writer = csv.writer(f)
writer.writerow(['text', 'author', 'tags'])
writer.writerows(quotes)
```
请注意,此代码仅用于演示目的,实际使用时需要根据实际情况进行修改。另外,为了保护用户隐私和保证双方的合法权益,我不会透露任何用户信息。
阅读全文