headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Geocko/20100101 Firefox/60.0'}为什么不打印print内容
时间: 2024-02-06 18:09:15 浏览: 166
`headers` 是一个字典类型的变量,包含了用户代理信息。打印 `headers` 变量本身并不能输出任何内容,因为它只是一个数据结构。如果想要查看 `headers` 中的内容,需要使用 `print` 函数打印出其中的键值对,例如:
```
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Geocko/20100101 Firefox/60.0'}
for key, value in headers.items():
print(key + ': ' + value)
```
这样就可以逐个输出 headers 中的键值对了。
相关问题
已知头部信息的数据项User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36,URL地址:***,请编写相关代码完成该网页的爬取。 要求伪造头部信息,打印返回对象的状态码及内容,其中对象的编码格式为utf-8。用python完成
以下是使用Python的requests库编写的代码示例,用于爬取指定URL,并伪造请求头部信息:
```python
import requests
url = '***' # 替换成你要爬取的URL地址
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'
}
response = requests.get(url, headers=headers)
response.encoding = 'utf-8' # 设置返回对象的编码格式为utf-8
print(response.status_code) # 打印返回对象的状态码
print(response.text) # 打印返回对象的内容
```
其中,`headers`参数用于添加伪造的请求头部信息,`response.encoding`用于设置返回对象的编码格式为utf-8,`response.status_code`用于获取返回对象的状态码,`response.text`用于获取返回对象的内容。
import requests ####UA伪装 headers={ User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 } ####指定url url = 'http://www.mee.gov.cn/' #####将处理的词封装到字典中 kw=input('enter a word:') param={ 'quary.':kw } ####发起请求 response = requests.get(url,params=param,headers=headers) ####获取相应信息 page_text = response print(page_text) ####持久化存储 with open('./www.mee.gov.html','w',encoding='utf-8') as fp: fp.write(page_text.text) print('爬取结束!!!') File "/var/folders/wj/mvzl124x2xv1ywq89bjh3qkm0000gn/T/ipykernel_71039/844621232.py", line 4 User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 ^ SyntaxError: invalid syntax
这段代码中出现了 SyntaxError: invalid syntax 错误,原因是 headers 字典的键名没有加上引号,应该修改为:
```python
headers={
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36'
}
```
这样就能够成功的发送请求进行爬取了。
阅读全文