爬取http://www.cnena.com/brand/list-htm-fid-9.html 的企业数据
时间: 2023-12-20 14:07:10 浏览: 136
python课程设计基于知识图谱的会展知识问答系统python源码+项目说明.zip
5星 · 资源好评率100%
好的,你需要使用 Python 爬虫技术来获取该网站上的企业数据。可以使用 requests 库获取网页内容,使用 BeautifulSoup 库解析网页,然后使用正则表达式或者其他方法提取相关信息。以下是一个简单的示例代码:
```python
import requests
from bs4 import BeautifulSoup
import re
url = 'http://www.cnena.com/brand/list-htm-fid-9.html'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
companies = []
for item in soup.find_all('div', {'class': 'company'}):
name = item.find('h3').text
link = item.find('a')['href']
address = re.findall(r'地址:(.*)', item.text)[0]
tel = re.findall(r'电话:(.*)', item.text)[0]
companies.append({'name': name, 'link': link, 'address': address, 'tel': tel})
print(companies)
```
这段代码可以获取该网站上所有企业的名称、链接、地址和电话信息,并将其存储在一个列表中。你可以根据需要对代码进行修改和优化。
阅读全文