帮我用python写一个爬取企查查公司名称和公司地址

时间: 2024-06-10 18:06:20 浏览: 201

基于Python的企查查爬虫，爬取完整的公司数据+源代码+文档说明

5星 · 资源好评率100%

好的，以下是Python代码： ```python import requests from bs4 import BeautifulSoup url = 'https://www.qichacha.com/' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3' } # 搜索公司信息 def search(keyword): search_url = url + 'search?key=' + keyword r = requests.get(search_url, headers=headers) soup = BeautifulSoup(r.text, 'html.parser') result_table = soup.find_all('table', {'class': 'm_srchList'})[0] result_list = result_table.find_all('tr')[1:] results = [] for result in result_list: name = result.find_all('td')[1].a.text.strip() detail_url = result.find_all('td')[1].a['href'] address = result.find_all('td')[2].text.strip() results.append({ 'name': name, 'detail_url': detail_url, 'address': address }) return results # 获取公司详情页面信息 def get_detail(detail_url): r = requests.get(detail_url, headers=headers) soup = BeautifulSoup(r.text, 'html.parser') return soup # 解析公司详情页面信息，获取法人代表、注册资本等信息 def parse_detail(soup): article = soup.find_all('div', {'class': 'content'})[3].get_text() article = article.split('\n') article = [line.strip() for line in article if line.strip() != ''] legal_representative = '' registered_capital = '' for i in range(len(article)): if article[i] == '法定代表人': legal_representative = article[i+1] elif article[i] == '注册资本': registered_capital = article[i+1] return { 'legal_representative': legal_representative, 'registered_capital': registered_capital } # 测试代码 if __name__ == '__main__': keyword = '百度' results = search(keyword) for result in results: detail_url = url + result['detail_url'] soup = get_detail(detail_url) detail_info = parse_detail(soup) print('公司名称：', result['name']) print('公司地址：', result['address']) print('法定代表人：', detail_info['legal_representative']) print('注册资本：', detail_info['registered_capital']) print('\n') ``` 将关键词改成你需要查询的公司名称，运行以上代码，即可获取该公司的名称、地址、法人代表、注册资本等信息。

阅读全文

帮我用python写一个爬取企查查公司名称和公司地址

相关推荐

基于Python的天眼查爬虫，爬取完整的公司数据（可爬需要VIP才能用的邮箱和电话等）+源代码+文档说明

python爬取企查查公司工商信息

帮我用python写一个爬取企查查公司名称和地址

写一个爬取企查查公司名称，曾用名，营业状态的python代码

python爬虫爬取企查查公司工商信息

python爬取企查查

Python selenium 爬取企查查

爬虫python爬取企查查

python爬取企查查手机号码

帮我这个代码，根据Excel表格中企业名单，通过python爬取企查查中企业的所有投资信息，并整理到Excel表格中

使用python无账号无限制获取企查查信息的实例代码

python爬虫企查查

python爬企查查数据

Python抓取企查查 全国工业园区及企业信息.zip

给定公司名称excel列表在天眼查搜索爬取企业工商信息.pdf

详解用Python爬虫获取百度企业信用中企业基本信息

Python企查查爬虫教程：完整公司数据抓取及文档说明

企查查电话爬虫python

Python爬企查查网站数据的爬虫代码如何写？

最新推荐

Python requests30行代码爬取知乎一个问题的所有回答

探索数据转换实验平台在设备装置中的应用

管理建模和仿真的文件

ggflags包的国际化问题：多语言标签处理与显示的权威指南

如何使用MATLAB实现电力系统潮流计算中的节点导纳矩阵构建和阻抗矩阵转换，并解释这两种矩阵在潮流计算中的作用和差异？

使用git-log-to-tikz.py将Git日志转换为TIKZ图形

"互动学习：行动中的多样性与论文攻读经历"

ggflags包的定制化主题与调色板：个性化数据可视化打造秘籍

如何使用Matlab进行风电场风速模拟，并结合Weibull分布和智能优化算法预测风速？

小栗子源码2.9.3版本发布

Python抓取企查查全国工业园区及企业信息.zip