上述代码报错JSONDecodeError: Expecting value: line 1 column 1 (char 0)
时间: 2023-08-14 21:10:01 浏览: 174
抱歉,看起来您遇到了JSON解析错误。这可能是因为企查查返回的结果不是有效的JSON格式,导致解析失败。为了解决这个问题,您可以尝试使用其他方式来解析返回的数据。
一种方法是使用正则表达式来提取所需的信息。您可以根据返回的页面内容使用正则表达式模式进行匹配和提取。例如,如果您想要提取企业名称和法人信息,可以尝试以下代码:
```python
import requests
import re
def qcc_search(keyword):
url = f'https://www.qcc.com/search?key={keyword}'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36'
}
response = requests.get(url, headers=headers)
if response.status_code == 200:
# 使用正则表达式匹配企业名称和法人信息
pattern = r'<a class="ma_h1" href="/firm/(.*?)" target="_blank">(.*?)</a>.*?<span class="legalPersonName">(.*?)</span>'
result = re.findall(pattern, response.text)
for item in result:
company_id = item[0]
company_name = item[1]
legal_person = item[2]
print(f"企业ID: {company_id}")
print(f"企业名称: {company_name}")
print(f"法人: {legal_person}")
print('----------------------')
else:
print('请求失败')
qcc_search('python爬虫')
```
这段代码使用正则表达式模式`<a class="ma_h1" href="/firm/(.*?)" target="_blank">(.*?)</a>.*?<span class="legalPersonName">(.*?)</span>`来匹配企业名称和法人信息。您可以根据需要修改正则表达式模式,并使用`re.findall()`函数进行匹配和提取。
请注意,正则表达式可能会比较复杂且容易出错,需要根据具体的网页结构进行调整。另外,使用正则表达式提取信息时,需要注意处理可能存在的异常情况。
希望这可以帮助您解决问题。如果问题仍然存在,请提供更多的错误信息,以便我可以更好地帮助您。
阅读全文