Requests库整理

一、Requests库的安装

win平台下，直接在命令行使用

pip install requests

即可进行安装

成功后测试如下

>>> import requests
>>> r = requests.get('https://www.baidu.com')
>>> print(r.status_code)
200
>>> r.text
'<!DOCTYPE html>
<!--STATUS OK--><html>

二、Requests库的七个主要方法

三、Requests库的get()方法

get()方法是最常用的方法

requests.get(url,params=None, **kwargs)

其中：

url：想要获取的网页url
params： url中的额外参数，字典或字节流格式，如kw = {'wd': 'baidu'}， requests.get('https://www.baidu.com', kw)，其中访问的地址是https://www.baidu.com/?wd=baidu，可选参数
**kwargs: 12个控制访问的参数（较为少用）

四、两个重要的对象：Request和Response

对于r = requests.get(url), 其实是先构造了一个向服务器请求资源的Request对象，然后返回一个包含服务器资源的Response对象

PS:其实在requests库的源码中可以得知get是对request方法进行了封装

Response对象基本的属性：

有一点需要注意：如果在header中不存在charset，这认为编码为ISO‐8859‐1，r.encoding将为这个编码

r.apparent_encoding为程序根据网页内容分析出的编码，若网页编码已知的话，可以省略对此处进行一点小小的优化

五、异常

Requests库的异常

Response类的异常

r.raise_for_status() 如果不是200 这抛出异常requests.HTTPError，便于对异常的处理

-------

本文整理自嵩天老师的python系列课程，如有错误，还请斧正