Python设置全局代理并跳过指定域名
时间:2026-02-17 14:03:45 248浏览 收藏
本文深入解析了 Python httpx 库中代理配置的核心机制与常见陷阱:虽然 httpx 不提供内置“全局代理”概念,但可通过 Client 或 AsyncClient 的 proxies 参数统一设置 HTTP/HTTPS 代理(支持字符串或字典形式),并特别强调其不自动识别 NO_PROXY 环境变量;真正灵活且可控的方案是传入自定义 callable 函数,根据 URL 的 host、scheme 等动态决定是否代理,同时需注意该函数为同步执行、每次请求(含重定向)均调用一次,且必须手动兼容 NO_PROXY 规则(如精确匹配或 .domain 后缀匹配),帮助开发者避开代理失效、重定向绕过、HTTPS 代理误配等高频坑点。

httpx 怎么设置全局代理(含 HTTP/HTTPS)
httpx 本身不提供“全局代理”概念,但可以通过 httpx.Client 或 httpx.AsyncClient 的 proxies 参数统一配置。它支持字符串形式(如 "http://127.0.0.1:8080")或字典形式,后者更灵活,能分别指定 http:// 和 https:// 流量的代理:
proxies = {
"http://": "http://127.0.0.1:8080",
"https://": "http://127.0.0.1:8080", # 注意:httpx 支持 HTTPS 流量走 HTTP 代理(CONNECT)
}注意:httpx 不支持直接用 https:// 代理地址(即 TLS over TLS),会报 ProxyError;若需 HTTPS 代理,得用支持 TLS tunneling 的代理服务(如 mitmproxy、squid 配置了 CONNECT),且仍用 http:// 前缀填写地址。
怎么跳过特定域名(如 localhost、127.0.0.1、内部域名)
httpx 没有内置的 no_proxy 解析逻辑,但支持传入一个可调用对象(callable)作为 proxies 值,由你自行控制是否代理。这是最可靠、最可控的方式:
- 函数接收一个
url(httpx.URL实例),返回代理 URL 字符串,或返回None表示不代理 - 可以基于
url.host、url.port、url.scheme做判断 - 推荐用
urllib.parse.urlparse或直接用url.host(httpx 0.24+ 已稳定)做匹配
示例(跳过 localhost、127.0.0.1、.test 域名):
def proxy_selector(url):
host = url.host
if host in ("localhost", "127.0.0.1") or host.endswith(".test"):
return None
return "http://127.0.0.1:8080"
<p>client = httpx.Client(proxies=proxy_selector)</p>为什么不能直接用环境变量 NO_PROXY?
httpx 默认**不读取** NO_PROXY 环境变量 —— 这和 requests 不同。即使你设置了 NO_PROXY=localhost,127.0.0.1,httpx 也不会自动识别。
如果你依赖环境变量,必须手动解析并封装进 callable:
import os
from urllib.parse import urlparse
<p>no_proxy_hosts = [h.strip() for h in os.getenv("NO_PROXY", "").split(",") if h.strip()]</p><p>def proxy_selector(url):
host = url.host
if any(host == h or host.endswith(f".{h}") for h in no_proxy_hosts):
return None
return "<a target='_blank' href='https://www.17golang.com/gourl/?redirect=MDAwMDAwMDAwML57hpSHp6VpkrqbYLx2eayza4KafaOkbLS3zqSBrJvPsa5_0Ia6sWuR4Juaq6t9nq5roGCUgXpusdyesIGcmtqxd2XbhM2pb4eqcWSvdX2errKFmoqAjmi0p6dojoailb54etyGla6jhdCbZLGGmKCys5yafbOHpLO6s2qNrKKi' rel='nofollow'>http://127.0.0.1:8080</a>"</p>注意:NO_PROXY 的匹配规则是「精确主机名」或「以 .domain 结尾」,不是通配符,也不是子域名自动包含(.example.com 不匹配 api.example.com,除非你显式写成 .example.com 并用 endswith 判断)。
异步 client 和 session 复用时要注意什么
使用 httpx.AsyncClient 时,proxies 同样支持 callable,逻辑一致。但要注意:
- 代理 callable 是同步函数,httpx 内部会同步调用它(不 await),所以不要在里面写
await - 如果用
httpx.Client配合mount或自定义 transport,代理逻辑会被绕过 ——proxies只在默认 HTTPTransport 下生效 - 多个 client 实例之间不共享代理状态,每个 client 都要单独传
proxies - 若用
httpx.Timeout或httpx.Limits,它们与代理无关,但超时可能掩盖代理连接失败的真实原因(比如代理宕机却只报ConnectTimeout)
真正容易被忽略的是:代理 callable 在每次请求时都会执行,包括重定向后的 URL —— 所以如果你跳过了原始域名但重定向到了代理域名,它仍会走代理;反之亦然。需要确保逻辑覆盖所有跳转目标。
今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
166 收藏
-
219 收藏
-
381 收藏
-
348 收藏
-
483 收藏
-
214 收藏
-
346 收藏
-
131 收藏
-
118 收藏
-
190 收藏
-
389 收藏
-
214 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习