requests库底层实现原理解析
时间:2026-02-02 10:36:41 184浏览 收藏
亲爱的编程学习爱好者,如果你点开了这篇文章,说明你对《requests 库的底层实现原理解析》很感兴趣。本篇文章就来给大家详细解析一下,主要介绍一下,希望所有认真读完的童鞋们,都有实质性的提高。
requests 底层基于 urllib3 而非 urllib,由 urllib3 管理连接池、重试、SSL 验证和 HTTP/1.1 流水线;它不支持 HTTP/2 和异步,重试需手动配置 HTTPAdapter。

requests 底层用的是 urllib3,不是 urllib
requests 本身不直接操作 socket,它把网络请求的细节全交给了 urllib3。这个库负责连接池、重试、SSL 验证、HTTP/1.1 流水线等核心逻辑。你调用 requests.get() 时,实际是 urllib3.PoolManager 在背后管理连接、复用 TCP 连接、自动处理 Connection: keep-alive。
常见误解是 requests 封装了标准库的 urllib.request,其实完全无关——requests 早期确实基于它,但 2013 年起就彻底切换到 urllib3(一个独立维护的第三方库),因为后者支持连接池、更可控的超时、更好的错误分类。
requests.Session()对应一个urllib3.PoolManager实例,所以复用 Session 才能真正复用连接池- 如果你禁用连接池(比如传
pool_connections=0),urllib3会退化为每次新建连接,性能骤降 requests.adapters.HTTPAdapter是你和urllib3之间的胶水层,所有自定义行为(如重试策略、池大小)都通过它配置
HTTP/2 和异步不是 requests 的事
requests 是同步阻塞式 HTTP 客户端,不支持 HTTP/2,也不支持 async/await。它发请求时会卡住当前线程,直到响应头收完(或超时)。这意味着:
- 即使服务端支持 HTTP/2,
requests也只走 HTTP/1.1 —— 它压根没实现 HTTP/2 帧解析 - 想并发发 100 个请求?靠
threading或multiprocessing硬扛,不是靠 requests 本身“变快” - 真正的异步替代方案是
aiohttp或httpx(后者 sync/async 双模式,底层用httpcore而非urllib3)
SSL 验证和证书路径由 urllib3 控制,但 requests 提供快捷入口
证书验证逻辑在 urllib3.util.ssl_.create_urllib3_context() 里,它默认加载系统 CA 包(如 certifi),但你可以绕过或替换:
- 设
verify=False会跳过全部 SSL 校验,同时 suppressInsecureRequestWarning - 传路径如
verify="/path/to/cert.pem",urllib3会用它作为 CA bundle,而非系统默认 - 环境变量
REQUESTS_CA_BUNDLE或CERT_PATH会影响urllib3加载位置,但优先级低于代码中显式传入的verify= - 自签名证书场景下,别只改
verify=False;更安全的做法是导出证书、用verify="mycert.crt"
重试机制必须手动打开,且只对部分状态码生效
requests 默认不重试任何请求。要启用重试,得配 HTTPAdapter 并挂到 Session 上:
from requests.adapters import HTTPAdapter
from urllib3.util.retry import Retry
retry_strategy = Retry(
total=3,
status_forcelist=[429, 500, 502, 503, 504],
allowed_methods=["HEAD", "GET", "OPTIONS"]
)
adapter = HTTPAdapter(max_retries=retry_strategy)
session = requests.Session()
session.mount("https://", adapter)
注意几个关键点:
total是总尝试次数(含首次),不是“额外重试几次”status_forcelist必须显式列出要重试的状态码;400、401、403、404 默认不重试allowed_methods默认不含POST,因为非幂等方法重试有风险;若真要重试 POST,得明确加上- 重试间隔默认是指数退避,但不会 sleep 主线程——urllib3 在每次重试前会调用
time.sleep(),这点容易被忽略
底层超时(connect / read)和重试是两套独立机制,别以为设了 timeout=(3, 30) 就自动带重试。
今天关于《requests库底层实现原理解析》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
195 收藏
-
391 收藏
-
268 收藏
-
232 收藏
-
255 收藏
-
459 收藏
-
408 收藏
-
179 收藏
-
262 收藏
-
153 收藏
-
242 收藏
-
377 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习