Python requests模块详解：基础用法与高级技巧

106 浏览量更新于2024-09-07 1 收藏 130KB PDF 举报

"本文将深入探讨Python中的requests模块，包括其基本使用方法和高级应用，如自动登录、抓取网页源码以及管理Cookies。requests是一个流行的HTTP库，它基于Apache2许可证，用Python语言编写，提供了比urllib2更为简便的操作方式。该库支持HTTP连接保持、连接池、Cookie管理、文件上传以及自动处理内容编码等功能，让Python的网络请求更加便捷。requests库的现代设计和国际化特性使其成为Python中进行网络交互的理想选择。首先，我们来了解如何导入requests模块。在Python代码中，你可以通过`import requests`语句引入这个库。接着，我们可以使用requests的`get`方法来发起HTTP GET请求，例如获取网页内容。例如，要获取GitHub的主页，只需调用`requests.get('https://github.com/')`。此外，`get`方法还可以接受参数，如在查询字符串中传递参数，如`requests.get(url='http://dict.baidu.com/s', params={'wd': 'python'})`，这将向百度词典搜索"python"。 requests模块还提供了其他HTTP方法，如`post`、`put`、`delete`、`head`、`options`，分别对应HTTP协议中的POST、PUT、DELETE、HEAD和OPTIONS请求，这些方法用法类似，只是针对不同的HTTP操作。对于更复杂的应用，比如自动登录，requests可以利用Session对象来管理会话。Session对象允许你在多个请求之间保持某些参数，例如登录状态。首先，创建一个Session对象，然后在其中进行登录操作，之后的请求会携带上登录后的状态。例如： ```python import requests s = requests.Session() s.get('http://login.example.com') s.post('http://login.example.com', data={'username': 'user', 'password': 'pass'}) # 此后的请求都将带有登录状态 r = s.get('http://members.example.com') ``` 抓取网页源码是Web爬虫的基础，requests模块同样可以轻松实现。你可以使用`content`属性获取响应的原始字节，或者使用`text`属性获取解码后的文本。例如： ```python response = requests.get('http://example.com') html_source = response.text ``` 处理Cookies也是requests的重要功能。通过`cookies`参数，你可以设置请求携带的Cookies，同时，响应的`cookies`属性可以获取服务器返回的Cookies。例如： ```python cookies = dict(cookies_are='yum') r = requests.get('http://example.com', cookies=cookies) ``` Python的requests模块是进行网络请求的强大工具，无论是简单的页面获取，还是复杂的Web交互，都能提供简洁、高效的解决方案。通过掌握requests的使用，开发者可以更方便地与Web服务进行交互，实现自动化任务和数据抓取。"

Python requests模块基础使用方法实例及高级应用模块基础使用方法实例及高级应用(自动登陆自动登陆,抓取网页源码抓取网页源码)实例详解实例详解

主要介绍了Python requests模块基础使用方法实例及高级应用(自动登陆,抓取网页源码,Cookies)实例详解,需要的朋友可以参考下

1、、Python requests模块说明模块说明

requests是使用Apache2 licensed 许可证的HTTP库。

用python编写。

比urllib2模块更简洁。

Request支持HTTP连接保持和连接池，支持使用cookie保持会话，支持文件上传，支持自动响应内容的编码，支持国际化的URL和POST数据自动编码。

在python内置模块的基础上进行了高度的封装，从而使得python进行网络请求时，变得人性化，使用Requests可以轻而易举的完成浏览器可有的任何操作。

现代，国际化，友好。

requests会自动实现持久连接keep-alive

2、、Python requests模块基础入门模块基础入门

1）导入模块）导入模块

import requests

2）发送请求的简洁）发送请求的简洁

示例代码：获取一个网页（个人github）

import requests

r = requests.get('https://github.com/Ranxf') # 最基本的不带参数的get请求

r1 = requests.get(url='http://dict.baidu.com/s', params={'wd': 'python'}) # 带参数的get请求

我们还可以使用requests模块其它请求方法

1 requests.get(‘https://github.com/timeline.json') # GET请求

2 requests.post(“http://httpbin.org/post”) # POST请求

3 requests.put(“http://httpbin.org/put”) # PUT请求

4 requests.delete(“http://httpbin.org/delete”) # DELETE请求

5 requests.head(“http://httpbin.org/get”) # HEAD请求

6 requests.options(“http://httpbin.org/get” ) # OPTIONS请求

3）为）为url传递参数传递参数

>>> url_params = {'key':'value'} # 字典传递参数，如果值为None的键不会被添加到url中

>>> r = requests.get('your url',params = url_params)

>>> print(r.url)

　　your url?key=value

4）响应的内容）响应的内容

r.encoding #获取当前的编码

r.encoding = 'utf-8' #设置编码

r.text #以encoding解析返回内容。字符串方式的响应体，会自动根据响应头部的字符编码进行解码。

r.content #以字节形式（二进制）返回。字节方式的响应体，会自动为你解码 gzip 和 deflate 压缩。

r.headers #以字典对象存储服务器响应头，但是这个字典比较特殊，字典键不区分大小写，若键不存在则返回None

r.status_code #响应状态码

r.raw #返回原始响应体，也就是 urllib 的 response 对象，使用 r.raw.read()

r.ok # 查看r.ok的布尔值便可以知道是否登陆成功

#*特殊方法*#

r.json() #Requests中内置的JSON解码器，以json形式返回,前提返回的内容确保是json格式的，不然解析出错会抛异常

r.raise_for_status() #失败请求(非200响应)抛出异常

post发送发送json请求：请求：

import requests

import json

r = requests.post('https://api.github.com/some/endpoint', data=json.dumps({'some': 'data'}))

print(r.json())

5）定制头和）定制头和cookie信息信息

header = {'user-agent': 'my-app/0.0.1''}

cookie = {'key':'value'}

r = requests.get/post('your url',headers=header,cookies=cookie)

data = {'some': 'data'}

headers = {'content-type': 'application/json',

'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:22.0) Gecko/20100101 Firefox/22.0'}

r = requests.post('https://api.github.com/some/endpoint', data=data, headers=headers)

print(r.text)

6）响应状态码）响应状态码

使用requests方法后，会返回一个response对象，其存储了服务器响应的内容，如上实例中已经提到的 r.text、r.status_code……

获取文本方式的响应体实例：当你访问 r.text 之时，会使用其响应的文本编码进行解码，并且你可以修改其编码让 r.text 使用自定义的编码进行解码。

r = requests.get('http://www.itwhy.org')

print(r.text, '{}'.format('*'*79), r.encoding)

r.encoding = 'GBK'

print(r.text, '{}'.format('*'*79), r.encoding)

示例代码：

import requests

下载后可阅读完整内容，剩余9页未读，立即下载

weixin_38674115

粉丝: 6
资源: 968

Python requests模块详解：基础用法与高级技巧

Python requests模块详解：基础用法与高级应用

Python Requests模块网络图片爬虫设计详解

Python requests模块详解：使用技巧与问题解答

Python requests模块安装及使用教程图解

作品提交python爬虫源码实例

python - requests库详解（csdn）————程序.pdf

分享一个Python爬虫入门实例（有源码，学习使用）

一个python爬虫反爬机制及具体实例

Python爬虫开发与项目实战-基础爬虫爬取百度百科词条标题-编程项目案例解析实例详解课程教程.pdf

使用Python的Requests、Selenium和BeautifulSoup结合的爬虫示例代码，用于爬取带有分页的动态网页

最新资源