首页 > 文章 > python教程

Requests库轻松处理HTTP请求与响应

时间：2025-11-08 08:06:32 496浏览收藏

本篇文章向大家介绍《Requests库轻松处理HTTP请求与响应》，主要包括，具有一定的参考价值，需要的朋友可以参考一下。

Requests库在实际项目中常用于API接口交互、Web数据抓取、自动化测试及文件上传下载。其核心优势在于简洁的语法和强大的功能集成，如自动处理编码、会话保持、异常分类等，使开发者能高效处理HTTP请求与响应，同时通过精细的错误处理和资源管理提升程序健壮性。

使用 Requests 库处理 HTTP 请求与响应

使用Requests库处理HTTP请求与响应，对我来说，它一直是Python生态中最优雅、最直观的选择。它把复杂的HTTP通信细节封装得很好，让开发者能专注于业务逻辑，而不是底层协议。无论是简单的API调用，还是更复杂的Web抓取任务，Requests都能提供强大而简洁的工具集。

使用Requests库处理HTTP请求与响应，核心在于其设计哲学——“人道化”。你不需要手动构造URL参数、编码POST数据，也不用担心HTTP连接的打开和关闭。导入requests模块后，一切都变得异常直接。

import requests

# 最常见的GET请求，获取网页内容或API数据
try:
    response = requests.get('https://api.github.com/events', timeout=5) # 加上超时是个好习惯
    response.raise_for_status() # 检查HTTP状态码，如果不是2xx，则抛出HTTPError异常
    print(f"状态码: {response.status_code}")
    print(f"响应头: {response.headers['Content-Type']}")
    print(f"响应内容（JSON解析）: {response.json()}") # 对于JSON响应，直接解析
except requests.exceptions.Timeout:
    print("请求超时了，服务器可能没有及时响应。")
except requests.exceptions.RequestException as e:
    print(f"请求发生错误: {e}")

我个人习惯在每个请求后都加上response.raise_for_status()，这能强制我在非200响应时立即处理错误，而不是让程序带着一个失败的状态码继续运行，导致后续逻辑出错。对于POST请求，数据传递也异常简单：

import requests

url_post = 'https://httpbin.org/post'
payload_form = {'key1': 'value1', 'key2': 'value2'}
payload_json = {'name': 'Alice', 'age': 30}

# 提交表单数据
# r_form = requests.post(url_post, data=payload_form)
# print(f"表单提交响应: {r_form.json()}")

# 提交JSON数据，Requests会自动设置Content-Type为application/json
r_json = requests.post(url_post, json=payload_json)
print(f"JSON提交响应: {r_json.json()}")

你会发现，Requests自动处理了数据的编码和Content-Type头部设置，这省去了很多手动操作的麻烦。文件上传同样直观，通过files参数即可：

import requests

url_upload = 'https://httpbin.org/post'
files = {'file': ('report.txt', open('report.txt', 'rb'), 'text/plain')} # (文件名, 文件对象, Content-Type)
# 也可以简单地 {'file': open('report.txt', 'rb')}
# 提前创建一个测试文件：
# with open('report.txt', 'w') as f:
#     f.write("This is a test report.")

try:
    r_upload = requests.post(url_upload, files=files)
    r_upload.raise_for_status()
    print(f"文件上传响应: {r_upload.json()}")
except requests.exceptions.RequestException as e:
    print(f"文件上传失败: {e}")

响应对象response包含了所有你需要的信息：response.status_code（HTTP状态码）、response.headers（响应头字典）、response.text（文本内容，Requests会尝试根据头部自动解码）、response.content（原始字节内容），以及response.json()（自动解析JSON响应）。我经常会先检查response.status_code，再根据其值决定是解析数据还是处理错误。

Requests库在实际项目中常见的应用场景有哪些？

Requests库的强大之处在于它能优雅地处理各种复杂场景，远不止简单的GET/POST。在我的实际项目中，它主要在以下几个方面大放异彩：

首先，API接口交互。这是最常见的用途。无论是调用第三方服务的API（如GitHub API、天气API），还是与自己后端服务的RESTful API通信，Requests都是首选。它能轻松处理JSON数据的发送和接收，以及各种认证机制（如Basic Auth、Token Auth）。

import requests

# 带有查询参数的GET请求
params = {'q': 'python requests', 'sort': 'stars'}
r_search = requests.get('https://api.github.com/search/repositories', params=params)
print(f"GitHub搜索结果状态码: {r_search.status_code}")
# print(r_search.json()) # 打印部分结果

# 带有自定义Header的请求，例如API Token认证
headers = {'Authorization': 'token YOUR_GITHUB_TOKEN'} # 替换为你的实际Token
r_auth = requests.get('https://api.github.com/user', headers=headers)
if r_auth.status_code == 200:
    print(f"认证成功，用户: {r_auth.json()['login']}")
else:
    print(f"认证失败，状态码: {r_auth.status_code}")

其次，Web数据抓取（爬虫）。虽然Requests本身不是一个完整的爬虫框架，但它是构建爬虫的基础。结合BeautifulSoup或lxml等解析库，可以高效地抓取网页内容。我在编写爬虫时，经常会用到Requests的Session对象来保持会话和Cookie，模拟用户登录后的行为。

import requests

# 使用Session保持会话，例如登录
s = requests.Session()
login_data = {'user': 'myuser', 'password': 'mypassword'} # 实际项目中替换为真实登录接口和数据
# s.post('https://some-login-site.com/login', data=login_data)
# r_protected = s.get('https://some-login-site.com/protected-page')
# print(r_protected.text)

# 模拟浏览器User-Agent
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}
r_web = requests.get('https://www.example.com', headers=headers)
# print(r_web.text[:500]) # 打印前500字符

再者，自动化测试。在对后端API进行集成测试或端到端测试时，Requests是发送HTTP请求、验证响应的理想工具。它可以轻松模拟各种请求场景，包括错误请求、不同数据格式等。

最后，文件下载与上传。无论是下载大型文件、图片，还是向服务器上传报告或媒体文件，Requests都提供了简洁的API。特别是对于大文件下载，它支持流式传输，避免一次性将整个文件加载到内存中，这在处理GB级别文件时非常关键。

如何优雅地处理Requests库中的异常和错误？

错误处理是任何健壮程序的核心，Requests库也不例外。虽然它让请求变得简单，但网络环境的复杂性、服务器的不稳定性以及各种潜在的编程错误，都意味着异常随时可能发生。我的经验是，不要仅仅依赖一个宽泛的try...except requests.exceptions.RequestException，而是要更细致地分类处理。

Requests库定义了一系列具体的异常，它们都是requests.exceptions.RequestException的子类，捕获这些更具体的异常能让你做出更精准的错误处理：

requests.exceptions.ConnectionError: 当网络连接出现问题时，比如DNS解析失败、目标主机拒绝连接、网络不通等。这通常意味着客户端无法建立到服务器的连接。
requests.exceptions.Timeout: 请求在设定的timeout时间内没有得到响应。这可能是服务器处理过慢，也可能是网络延迟过高。
requests.exceptions.HTTPError: 当你调用response.raise_for_status()且HTTP响应状态码是4xx（客户端错误）或5xx（服务器错误）时抛出。
requests.exceptions.TooManyRedirects: 请求超过了Requests默认或用户设定的最大重定向次数（通常是30次）。这可能意味着一个重定向循环。
requests.exceptions.URLRequired: 尝试发送请求但没有提供URL。
requests.exceptions.MissingSchema: URL中缺少协议头（如http://或https://）。

一个更完善的错误处理结构可能看起来像这样：

import requests

test_url = 'http://non-existent-domain-12345.com' # 故意设置一个不存在的域名
# test_url = 'http://httpbin.org/status/500' # 模拟服务器内部错误
# test_url = 'http://httpbin.org/delay/10' # 模拟超时

try:
    response = requests.get(test_url, timeout=3) # 设置3秒超时
    response.raise_for_status() # 检查HTTP状态码
    print(f"请求成功，状态码: {response.status_code}")
    print(response.json())
except requests.exceptions.ConnectionError as e:
    print(f"连接错误：无法连接到服务器。请检查URL、网络连接或DNS设置。详情：{e}")
    # 这里可以尝试重试，或者记录日志，通知管理员
except requests.exceptions.Timeout:
    print("请求超时：服务器在指定时间内没有响应。可能是服务器繁忙或网络延迟。")
    # 考虑增加超时时间，或者稍后重试
except requests.exceptions.HTTPError as e:
    print(f"HTTP错误：服务器返回了错误状态码 {e.response.status_code}。响应内容：{e.response.text}")
    # 根据状态码（如404、500）进行具体处理，比如404可能是资源不存在，500是服务器内部错误
except requests.exceptions.TooManyRedirects:
    print("重定向次数过多：可能存在重定向循环。")
except requests.exceptions.RequestException as e:
    print(f"发生未知Requests错误：{e}")
    # 捕获所有其他Requests相关的异常
except Exception as e:
    print(f"发生其他意外错误：{e}")
    # 捕获所有非Requests相关的Python异常

我会根据业务逻辑，对这些不同类型的错误采取不同的处理方式。例如，ConnectionError可能需要重试几次或者通知运维人员；Timeout可能需要调整超时时间或者换个时间再试；而HTTPError则需要根据具体的4xx或5xx状态码来判断是客户端请求问题还是服务器端问题。

除了Requests自身抛出的异常，很多API在返回200状态码时，响应体中也可能包含业务错误信息（如{"code": 1001, "message": "Invalid API Key"}）。在这种情况下，你需要解析response.json()或response.text，根据API文档中的业务错误码或消息来判断操作是否真正成功。这部分就不是Requests库能直接处理的了，需要你在业务逻辑层自行判断和处理。我的习惯是，在raise_for_status()之后，立即检查业务层面的错误码或消息，这样能确保数据处理的可靠性。

优化Requests库性能与资源管理的有效方法有哪些？

在使用Requests进行大量请求，特别是构建爬虫、数据同步服务或高并发API客户端时，性能和资源管理

今天带大家了解了的相关知识，希望对你有所帮助；关于文章的技术知识我们会一点点深入介绍，欢迎大家关注golang学习网公众号，一起学习编程~

资料下载

编程学习资料下载

精选编程（Golang、Python、Java、C++、JavaScript等）教程、电子书与示例源码，一键打包本地下载学习。

立即下载