请用python帮我写一段收集网页专利信息的程序
时间: 2024-04-29 19:21:08 浏览: 10
以下是一个收集网页专利信息的Python程序示例:
```python
import requests
from bs4 import BeautifulSoup
# 输入需要爬取的网页链接
url = input("请输入需要爬取的网页链接:")
# 发送请求并获取网页内容
response = requests.get(url)
html_content = response.text
# 解析网页内容,提取专利信息
soup = BeautifulSoup(html_content, 'html.parser')
patent_list = soup.find_all('div', {'class': 'patent'})
# 打印专利信息
for patent in patent_list:
title = patent.find('a', {'class': 'title'}).text.strip()
authors = patent.find('p', {'class': 'authors'}).text.strip()
date = patent.find('span', {'class': 'date'}).text.strip()
print("标题:", title)
print("作者:", authors)
print("日期:", date)
print("-" * 50)
```
使用该程序,您可以输入需要爬取的网页链接,程序将发送请求并获取网页内容。然后,程序将使用BeautifulSoup库解析网页内容,提取专利信息,并将其打印出来。您可以根据需要进行修改和优化。