Python发送HTTP请求方法详解
时间:2025-10-12 23:45:28 391浏览 收藏
Python发送HTTP请求,首选requests库!本教程将带你快速掌握Python发送HTTP请求的核心技巧,助你轻松实现数据交互。requests库以其简洁易用的API,封装了GET、POST等常用请求,并支持参数传递、自定义请求头、文件上传、会话保持等高级功能。通过本文,你将学会如何使用requests发送GET和POST请求,处理查询参数,进行身份认证和会话管理,以及应对常见的网络请求错误。掌握这些技能,能让你在网络编程中游刃有余,无论是爬虫开发、API调用还是其他需要与服务器交互的场景,都能轻松应对。本文还提供了丰富的代码示例和实用的调试技巧,助你快速上手,成为Python HTTP请求的高手!
Python发送HTTP请求最推荐使用requests库,它封装了GET、POST、认证、会话管理等操作,API简洁易用。首先安装:pip install requests。发送GET请求获取数据:import requests; response = requests.get('https://api.github.com/events'); print(response.status_code, response.json()[:3])。发送POST请求提交数据:requests.post('https://httpbin.org/post', json={'name': '张三', 'age': 30})。带参数的GET请求使用params:requests.get('https://api.github.com/search/repositories', params={'q': 'requests+language:python'})。需认证时可用auth=('user', 'passwd')进行基本认证。保持会话应使用Session对象:session = requests.Session(); session.get(login_url); session.get(protected_url)自动携带Cookie。高级功能包括文件上传:files = {'upload_file': open('example.txt', 'rb')}; requests.post(url, files=files)。自定义请求头:headers = {'User-Agent': 'MyApp'}; requests.get(url, headers=headers)。控制重定向:allow_redirects=False可禁用自动跳转。设置超时避免阻塞:timeout=(1, 3)。常见错误有ConnectionError、Timeout、HTTPError、SSLError和JSONDecodeError,应使用try-except捕获requests.exceptions.RequestException基类。调试时检查response.status_code、

Python要发送HTTP请求,最常用也最推荐的方式是使用requests库。它以简洁的API封装了复杂的HTTP操作,让开发者能轻松处理各种请求类型,如GET、POST,并支持参数、头信息、文件上传、会话管理等功能。当然,Python标准库中的urllib.request模块也能完成任务,但在易用性和功能丰富性上,requests无疑是现代Python开发的优选。
Python发送HTTP请求的核心,其实就是与服务器进行数据交换。这听起来有点抽象,但本质上就是你的程序像浏览器一样,向某个网址发出一个“请求”,然后等待服务器给你一个“回应”。最常见的请求类型是GET和POST。GET请求通常用于获取数据,比如你访问一个网页;POST请求则用于提交数据,比如你填写表单并点击提交。
我个人在工作中,几乎离不开requests这个库。它真的把很多繁琐的细节都处理好了,让我能更专注于业务逻辑本身,而不是去纠结HTTP协议的底层实现。
如何使用Python发送基本的HTTP请求?
使用requests库发送HTTP请求非常直观。首先,你需要确保已经安装了它:pip install requests。
发送GET请求
这是最简单的请求类型,通常用于从服务器获取信息。
import requests
try:
# 尝试获取一个公开的API数据
response = requests.get('https://api.github.com/events')
response.raise_for_status() # 如果状态码不是200,则抛出HTTPError异常
print(f"状态码: {response.status_code}")
print(f"响应头: {response.headers['Content-Type']}")
# 打印前几个JSON对象,避免输出过长
print("响应内容 (部分):")
for item in response.json()[:3]:
print(item.get('id'), item.get('type'))
except requests.exceptions.RequestException as e:
print(f"请求失败: {e}")这里我们向GitHub的公开API发送了一个GET请求。response.raise_for_status()是个好习惯,能帮你快速发现非2xx的HTTP状态码。response.json()则能方便地将JSON格式的响应体解析成Python字典或列表。
发送POST请求
POST请求通常用于向服务器提交数据,比如创建新资源或者发送表单数据。
import requests
import json
url = 'https://httpbin.org/post' # 一个测试POST请求的网站
payload = {'name': '张三', 'age': 30}
headers = {'Content-Type': 'application/json'} # 明确告诉服务器发送的是JSON数据
try:
# 发送JSON数据
response = requests.post(url, data=json.dumps(payload), headers=headers)
response.raise_for_status()
print(f"状态码: {response.status_code}")
print("服务器响应:")
print(response.json())
# 也可以直接通过json参数发送字典,requests会自动处理序列化和Content-Type
response_json_param = requests.post(url, json=payload)
response_json_param.raise_for_status()
print("\n使用json参数发送:")
print(response_json_param.json())
except requests.exceptions.RequestException as e:
print(f"POST请求失败: {e}")在POST请求中,data参数可以接受字典、字节串或文件对象。如果发送的是JSON数据,直接使用json参数会更方便,requests会帮你设置好Content-Type。
处理查询参数
GET请求经常需要带上查询参数,requests用params参数就能优雅地处理。
import requests
url = 'https://api.github.com/search/repositories'
params = {'q': 'requests+language:python', 'sort': 'stars', 'order': 'desc'}
try:
response = requests.get(url, params=params)
response.raise_for_status()
print(f"搜索Python requests库,星标最多的结果 (部分):")
for repo in response.json()['items'][:2]:
print(f"- {repo['full_name']} (Stars: {repo['stargazers_count']})")
except requests.exceptions.RequestException as e:
print(f"带参数的GET请求失败: {e}")requests会自动将params字典中的键值对编码并附加到URL后面。
Python发送HTTP请求时如何处理认证和会话?
在实际开发中,很多API都需要认证才能访问,而且我们经常需要保持与服务器的会话(session),比如登录后保持登录状态。requests在这方面提供了非常强大的支持。
基本认证 (Basic Authentication)
对于一些简单的API,可能只需要用户名和密码进行基本认证。
import requests
# 假设有一个需要基本认证的API
url = 'https://httpbin.org/basic-auth/user/passwd'
auth_tuple = ('user', 'passwd') # 用户名和密码
try:
response = requests.get(url, auth=auth_tuple)
response.raise_for_status()
print(f"基本认证状态码: {response.status_code}")
print(f"认证结果: {response.json()}")
except requests.exceptions.RequestException as e:
print(f"基本认证请求失败: {e}")auth参数接受一个元组(username, password),requests会自动将其编码为Base64并添加到请求头中。
会话管理 (Session)
当你需要跨多个请求保持某些状态(如cookies、自定义请求头)时,使用Session对象是最佳实践。它能自动处理cookies,让你的请求看起来更像一个真实用户的连续操作。
import requests
# 创建一个Session对象
session = requests.Session()
# 模拟登录(假设登录成功后服务器会设置cookie)
login_url = 'https://httpbin.org/cookies/set/sessioncookie/12345'
session.get(login_url) # 这一步会设置一个cookie到session对象中
print(f"Session中当前的Cookie: {session.cookies.get('sessioncookie')}")
# 接下来,所有通过这个session对象发送的请求都会自动带上之前获取的cookie
protected_resource_url = 'https://httpbin.org/cookies'
response = session.get(protected_resource_url)
response.raise_for_status()
print(f"访问受保护资源时的Cookie: {response.json().get('cookies')}")
# 你也可以给session设置默认的请求头
session.headers.update({'User-Agent': 'MyCustomApp/1.0'})
response_with_custom_ua = session.get('https://httpbin.org/headers')
print(f"使用自定义User-Agent: {response_with_custom_ua.json().get('headers').get('User-Agent')}")
session.close() # 使用完毕后记得关闭session,释放资源Session对象就像一个持久化的请求上下文,它会为你维护Cookies,并且可以设置默认的请求头,这在爬虫或需要多次交互的API调用中特别有用。我个人习惯在处理复杂业务流程时,都先创建一个Session,这样代码会更整洁,逻辑也更清晰。
面对复杂的HTTP请求场景,Python有哪些高级用法?
除了基本的GET和POST,HTTP请求还有很多高级的玩法,比如文件上传、自定义请求头、处理重定向、设置代理等。requests库都提供了非常优雅的解决方案。
文件上传
上传文件是常见的需求,requests通过files参数就能轻松搞定。
import requests
url = 'https://httpbin.org/post'
file_path = 'example.txt' # 假设有一个名为example.txt的文件
# 创建一个示例文件
with open(file_path, 'w') as f:
f.write('这是一个测试文件内容。\n')
f.write('用于Python requests的文件上传示例。')
try:
with open(file_path, 'rb') as f: # 注意,文件需要以二进制模式打开
files = {'upload_file': f} # 键是表单字段名,值是文件对象
response = requests.post(url, files=files)
response.raise_for_status()
print(f"文件上传状态码: {response.status_code}")
print("服务器响应 (文件部分):")
print(response.json().get('files'))
print(response.json().get('form')) # 如果有其他表单字段也会在这里
except requests.exceptions.RequestException as e:
print(f"文件上传失败: {e}")
finally:
import os
if os.path.exists(file_path):
os.remove(file_path) # 清理创建的测试文件files参数接受一个字典,键是表单中的字段名,值可以是文件对象、元组(文件名、文件内容、MIME类型、自定义头)等。
自定义请求头 (Headers)
有时候,我们需要自定义请求头来模拟浏览器行为、传递认证信息或指定内容类型。
import requests
url = 'https://httpbin.org/headers'
custom_headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36',
'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8',
'X-My-Custom-Header': 'Python-Requests-Demo'
}
try:
response = requests.get(url, headers=custom_headers)
response.raise_for_status()
print(f"自定义请求头状态码: {response.status_code}")
print("服务器接收到的头信息:")
print(response.json().get('headers'))
except requests.exceptions.RequestException as e:
print(f"自定义请求头失败: {e}")headers参数接受一个字典,requests会将其合并到默认的请求头中。
处理重定向 (Redirects)
HTTP请求经常会遇到3xx状态码的重定向。requests默认会自动处理重定向,但你也可以控制它的行为。
import requests
# 一个会重定向的URL
redirect_url = 'http://httpbin.org/redirect/3' # 会重定向3次
try:
# 默认情况下,requests会自动跟随重定向
response_auto = requests.get(redirect_url)
print(f"自动跟随重定向后的最终URL: {response_auto.url}")
print(f"自动跟随重定向后的状态码: {response_auto.status_code}")
print(f"重定向历史: {[r.url for r in response_auto.history]}")
print("\n--- 不跟随重定向 ---")
# 设置allow_redirects=False,requests就不会跟随重定向
response_no_redirect = requests.get(redirect_url, allow_redirects=False)
print(f"不跟随重定向时的URL: {response_no_redirect.url}")
print(f"不跟随重定向时的状态码: {response_no_redirect.status_code}")
print(f"不跟随重定向时的响应头: {response_no_redirect.headers.get('Location')}")
except requests.exceptions.RequestException as e:
print(f"重定向请求失败: {e}")response.history属性可以让你查看重定向的路径。allow_redirects=False在某些场景下非常有用,比如你需要手动处理重定向逻辑,或者只是想获取重定向前的状态。
超时设置 (Timeouts)
网络请求可能会因为各种原因卡住,设置超时是一个非常重要的实践,避免程序无限等待。
import requests
# 一个会延迟响应的URL
delay_url = 'https://httpbin.org/delay/5' # 延迟5秒响应
try:
# 设置1秒的连接超时和3秒的读取超时
response = requests.get(delay_url, timeout=(1, 3))
print(f"超时设置后的状态码: {response.status_code}")
except requests.exceptions.ConnectTimeout:
print("连接超时!服务器在指定时间内未建立连接。")
except requests.exceptions.ReadTimeout:
print("读取超时!服务器在指定时间内未发送数据。")
except requests.exceptions.RequestException as e:
print(f"其他请求错误: {e}")timeout参数可以是一个浮点数(表示总超时),也可以是一个元组(connect_timeout, read_timeout)。我通常会根据实际情况设置一个合理的超时时间,避免因为网络问题导致程序阻塞。
Python HTTP请求中常见的错误和调试技巧有哪些?
在发送HTTP请求时,遇到错误是家常便饭。理解这些错误类型并掌握调试技巧,能大大提高开发效率。
常见的错误类型
- 连接错误 (ConnectionError): 这通常意味着你的程序无法连接到目标服务器。可能是URL写错了,服务器没开,或者你的网络有问题。比如
requests.exceptions.ConnectionError: ('Connection aborted.', ConnectionResetError(104, 'Connection reset by peer'))。 - 超时错误 (Timeout): 请求在设定的时间内没有得到响应。分为
ConnectTimeout(连接服务器超时)和ReadTimeout(连接成功但读取数据超时)。 - HTTP错误 (HTTPError): 服务器返回了非2xx的状态码(如404 Not Found, 500 Internal Server Error)。
response.raise_for_status()会捕获这类错误并抛出异常。 - SSL/TLS错误 (SSLError): 当你访问HTTPS网站时,如果SSL证书有问题(比如自签名证书,或者证书过期),就会出现这类错误。
- JSON解析错误 (JSONDecodeError): 当你尝试使用
response.json()解析响应体时,如果响应体不是有效的JSON格式,就会抛出这个错误。
调试技巧
异常捕获 (Try-Except): 始终使用
try-except块来捕获requests.exceptions.RequestException,这是所有requests库相关异常的基类。这能让你的程序更健壮。import requests try: response = requests.get('http://nonexistent-domain.com') response.raise_for_status() except requests.exceptions.ConnectionError as e: print(f"连接错误: {e}") except requests.exceptions.Timeout as e: print(f"请求超时: {e}") except requests.exceptions.HTTPError as e: print(f"HTTP错误: {e.response.status_code} - {e.response.text}") except requests.exceptions.RequestException as e: print(f"未知请求错误: {e}")检查响应对象: 当请求返回时,
response对象包含了大量有用的信息,可以帮助你诊断问题:response.status_code: HTTP状态码,直接告诉你请求是否成功。response.url: 最终的请求URL,特别是处理重定向后。response.headers: 服务器返回的响应头。response.text: 响应体的文本内容,可以用来检查HTML、XML或非JSON的文本响应。response.json(): 如果响应是JSON格式,直接解析成Python对象。如果解析失败,会抛出JSONDecodeError。response.content: 响应体的原始字节内容,适用于处理图片、文件等二进制数据。
import requests response = requests.get('https://httpbin.org/status/404') print(f"状态码: {response.status_code}") print(f"URL: {response.url}") print(f"响应头: {response.headers}") print(f"响应文本: {response.text}")打印请求详情: 有时候需要知道
requests实际发送了什么。虽然requests没有直接提供打印请求的API,但你可以通过一些第三方库或者手动构造来查看。例如,使用curl_cffi或者http.client的调试模式可以更深入。对于requests本身,你可以在发送前打印url、params、data、headers等参数。日志记录 (Logging): 在生产环境中,使用Python的
logging模块记录请求和响应的关键信息,对于后期排查问题非常有帮助。import logging import requests logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s') try: response = requests.get('https://api.github.com/nonexistent-endpoint') response.raise_for_status() logging.info(f"请求成功: {response.status_code}") except requests.exceptions.HTTPError as e: logging.error(f"HTTP错误: {e.response.status_code} - {e.response.text}") except requests.exceptions.RequestException as e: logging.error(f"请求失败: {e}")禁用SSL验证 (Verify=False): 在开发或测试环境中,如果遇到SSL证书问题,可以暂时禁用SSL验证。但请注意,这会降低安全性,不建议在生产环境中使用。
import requests requests.packages.urllib3.disable_warnings(requests.packages.urllib3.exceptions.InsecureRequestWarning) # 禁用警告 try: response = requests.get('https://self-signed-cert.com', verify=False) # ... except requests.exceptions.RequestException as e: print(f"请求失败: {e}")
理解这些错误和调试技巧,能让你在面对各种网络请求问题时,不至于手足无措。通常,我都会从检查状态码和响应内容开始,如果还不行,再深入查看异常栈和请求参数。
理论要掌握,实操不能落!以上关于《Python发送HTTP请求方法详解》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
291 收藏
-
204 收藏
-
401 收藏
-
227 收藏
-
400 收藏
-
327 收藏
-
124 收藏
-
450 收藏
-
347 收藏
-
464 收藏
-
290 收藏
-
112 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习