Python中requests库的用法详解 - 迅博思语资讯移动站

Python中requests库的用法详解

2024-10-31 17:55

requests是使用Apache2 licensed 许可证的HTTP库。比urllib模块更简洁。

Python中requests库的用法详解

Request支持HTTP连接保持和连接池，支持使用cookie保持会话，支持文件上传，支持自动响应内容的编码，支持国际化的URL和POST数据自动编码。

在python内置模块的基础上进行了高度的封装，从而使得python进行网络请求时，变得人性化，使用Requests可以轻而易举的完成浏览器可有的任何操作。

requests是第三方库，需要独立安装：pip install requests。requests是基于urllib编写的，并且使用起来非常方便，个人推荐使用requests。

官方中文教程地址：http://docs.python-requests.org/zh_CN/latest/user/quickstart.html

学习之前推荐一个非常好的http测试网站：http://httpbin.org，提供非常非常完善的接口调试、测试功能～

requests支持http的各种请求，比如：

GET：请求指定的页面信息，并返回实体主体。
HEAD：只请求页面的首部。
POST：请求服务器接受所指定的文档作为对所标识的URI的新的从属实体。
PUT：从客户端向服务器传送的数据取代指定的文档的内容。
DELETE：请求服务器删除指定的页面。
OPTIONS：允许客户端查看服务器的性能。
访问baidu，获取一些基本信息：

请求后响应的内容是requests.models.Response对象，需要处理后才能得到我们需要的信息。

requests自动检测编码，可以使用属性查看。

无论响应是文本还是二进制内容，我们都可以用属性获得对象：

encoding：获取当前的编码
encoding = ‘utf-8’ ：设置编码
headers :以字典对象存储服务器响应头，但是这个字典比较特殊，字典键不区分大小写，若键不存在则返回None
requests.headers ：返回发送到服务器的头信息
cookies ：返回cookie
history ：返回重定向信息,当然可以在请求是加上allow_redirects = false 阻止重定向
status_code ：响应状态码
raw ：返回原始响应体，也就是 urllib 的 response 对象，使用 r.raw.read()
ok ：查看r.ok的布尔值便可以知道是否登陆成功
raise_for_status() ：失败请求(非200响应)抛出异常
text: 得到的是str类型，会自动根据响应头部的字符编码进行解码。
content：得到的是bytes类型，需要进行解码Response_get.content.decode(),相当于Response_get.text。字节方式的响应体，会自动为你解码gzip 和 deflate 压缩。
json()： Requests中内置的JSON解码器，以json形式返回,前提返回的内容确保是json格式的，不然解析出错会抛异常

其实使用requset.text避免乱码的方式还有一个，就是发出请求后，获取内容之前使用response.encoding属性来改变编码，例如：

url：请求url地址
headers：请求头
params：查询字符串

对于带参数的URL，传入一个dict作为参数，如果值为None的键不会被添加到url中。

结果为：

requests的方便之处还在于，对于特定类型的响应，例如JSON，可以直接获取：

requests里的json方法就是封装了json.loads方法。

控制台打印结果：

需要传入HTTP Header时，我们传入一个dict作为headers参数：

添加头信息访问：

equests对cookie做了特殊处理，使得我们不必解析cookie就可以轻松获取指定的cookie：

要在请求中传入cookie，只需准备一个dict传入参数：

url：请求url地址
headers：请求头
data：发送编码为表单形式的数据

要发送POST请求，只需要把get()方法变成post()，然后传入data参数作为POST请求的数据：

打印结果：

requests默认使用对POST数据编码。如果要传递JSON数据，可以直接传入json参数：

文件上传需要用到请求参数里的参数：

在读取文件时，注意务必使用即二进制模式读取，这样获取的长度才是文件的长度。

响应结果：

request更加方便的是，可以把字符串当作文件进行上传：

1、session会话维持
会话对象requests.Session能够跨请求地保持某些参数，比如cookies，即在同一个Session实例发出的所有请求都保持同一个cookies,而requests模块每次会自动处理cookies，这样就很方便地处理登录时的cookies问题。

auth：认证，接受元祖

基本身份认证(HTTP Basic Auth)

简写：

另一种非常流行的HTTP身份认证形式是摘要式身份认证，Requests对它的支持也是开箱即可用的:

如果代理需要用户名和密码，则需要这样：

现在的很多网站都是https的方式访问，所以这个时候就涉及到证书的问题

例如访问12306：

会报错，证书错误

解决：加上verify=false(默认是true)

timeout，单位：毫秒

使用GET或OPTIONS时，Requests会自动处理位置重定向。

Github将所有的HTTP请求重定向到HTTPS。可以使用响应对象的 history 方法来追踪重定向。我们来看看Github做了什么:

Response.history 是一个:class:Request 对象的列表，为了完成请求而创建了这些对象。这个对象列表按照从最老到最近的请求进行排序。

如果你使用的是GET或OPTIONS，那么你可以通过 allow_redirects 参数禁用重定向处理:

stream：是否下载获取的内容
cert：保存本地SSL证书路径

所有的异常都是在requests.excepitons中：

示例：

测试可以发现，首先被捕捉的异常是timeout超时异常,当把网络断掉就会捕捉到ConnectionError连接异常，如果前面异常都没有捕捉到，最后也可以通过RequestExctption捕捉到。

构建参数：在构建请求参数时，第一种需要将请求参数使用urllib库的urlencode方法进行编码预处理，非常麻烦。
请求方法：发送get请求时，第一种使用的urllib库的urlopen方法打开一个url地址，而第二种直接使用requests库的get方法，与http请求方式是对应的，更加直接、易懂。
请求数据：第一种按照url格式去拼接一个url字符串，显然非常麻烦，第二种按顺序将get请求的url和参数写好就可以了。
处理响应：第一种处理消息头部、响应状态码和响应正文时分别使用.info()、.getcode()、.read()方法，第二种使用.headers、.status_code、.text方法，方法名称与功能本身相对应，更方便理解、学习和使用。
连接方式：看一下返回数据的头信息的“connection”，使用urllib库时，“connection”:“close”，说明每次请求结束关掉socket通道，而使用requests库使用了urllib3，多次请求重复使用一个socket，“connection”:“keep-alive”，说明多次请求使用一个连接，消耗更少的资源。
编码方式：requests库的编码方式Accept-Encoding更全。

以上就是本篇文章【Python中requests库的用法详解】的全部内容了，欢迎阅览！文章地址：http://lianchengexpo.xrbh.cn/news/11054.html
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页迅博思语资讯移动站 http://lianchengexpo.xrbh.cn/mobile/ , 查看更多