千问支持流式输出,可通过 API 设置 stream=True 参数实现。
时间:2026-05-20 23:00:31 414浏览 收藏
通义千问模型原生支持流式输出,能让AI响应像打字一样实时逐字呈现,大幅提升交互沉浸感与响应感知速度;其实现核心是Server-Sent Events(SSE)协议,无论前端用EventSource或Fetch+ReadableStream,还是后端采用Spring Boot的SseEmitter、PHP的curl流式回调,甚至Ollama的缓冲穿透方案,都能灵活适配——只需在API请求中简单设置`stream=true`,再按对应技术栈配置服务端推送与客户端解析逻辑,即可轻松解锁丝滑、低延迟的流式AI体验。

如果您在调用通义千问模型时希望响应内容能实时逐字呈现,而非等待全部生成完毕再一次性返回,则需确认其流式输出能力并配置对应机制。千问系列模型普遍支持流式输出,实现依赖服务端协议适配与客户端接收逻辑协同。以下是具体实施路径:
一、启用 API 请求的 stream 参数
流式输出的基础是向服务端明确声明需以流式方式接收响应。通义千问兼容 OpenAI-style 接口,通过设置 stream 字段为 true 触发服务端分块推送行为。
1、构造 JSON 请求体,在顶层字段中添加 "stream": true;
2、确保请求 Header 中包含 Content-Type: application/json 与有效的 Authorization 凭据;
3、发起 POST 请求至 /v1/chat/completions 等支持 streaming 的端点;
4、验证服务端响应头中包含 Content-Type: text/event-stream;
二、使用 Server-Sent Events(SSE)协议接收
SSE 是浏览器原生支持的单向流协议,适用于服务器持续推送文本块的场景。它无需额外库即可解析 event: message 格式的数据帧,且具备自动重连机制。
1、在前端 JavaScript 中创建 new EventSource(url, { withCredentials: true }) 实例;
2、监听 message 事件,对 event.data 字段执行 data.replace(/^data:\s*/, '') 去除前缀;
3、跳过空行及注释行(以 : 开头的行);
4、对每条有效数据调用 JSON.parse() 解析,提取 content 字段并追加至显示区域;
5、监听 error 事件并在连接中断时执行清理操作;
三、使用 Fetch API + ReadableStream 手动处理
当需要精细控制流生命周期、中断逻辑或兼容不支持 EventSource 的环境时,Fetch 配合可读流是更灵活的选择。该方式绕过自动解析,直接操作原始字节流。
1、调用 fetch(url, { method: 'POST', body: JSON.stringify(payload), headers: { 'Content-Type': 'application/json' } });
2、检查 response.ok 并确认 response.headers.get('content-type') 为 text/event-stream;
3、获取 response.body.getReader();
4、使用 TextDecoder({ stream: true }) 对每次 reader.read() 返回的 chunk.value 进行增量解码;
5、按行分割解码结果,过滤 data: 行,提取 content 后渲染;
四、后端使用 SseEmitter(Spring Boot)
Java 生态中,Spring Boot 提供 SseEmitter 类封装 SSE 协议细节,使控制器可异步推送多段消息。该方式适合构建企业级响应式 AI 服务。
1、在 Controller 方法返回类型中声明 SseEmitter;
2、设置超时时间为 0(永不过期)或合理长值,避免连接被容器中断;
3、调用 emitter.send(SseEmitter.event().name("message").data(chunk)) 推送每个文本块;
4、在模型推理完成或异常发生时调用 emitter.complete() 或 emitter.completeExceptionally(e);
5、确保方法映射路径的 produces 属性为 MediaType.TEXT_EVENT_STREAM_VALUE;
五、PHP 使用 curl + WRITEFUNCTION 处理流
PHP 环境下无法原生监听 SSE 流,但可通过 curl 的 CURLOPT_WRITEFUNCTION 回调函数捕获服务端持续写入的响应体,实现等效流式解析。
1、初始化 curl 句柄并设置 CURLOPT_URL 与认证头;
2、启用 CURLOPT_POST 并传入含 stream: true 的 JSON 数据;
3、注册 WRITEFUNCTION 回调,对每次接收到的 $data 执行 processStreamedData($data);
4、在回调中识别 data: 前缀,提取 JSON 片段并解析 content 字段;
5、调用 echo 输出处理结果,并立即执行 ob_flush() 与 flush() 强制刷新缓冲区;
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
488 收藏
-
404 收藏
-
379 收藏
-
167 收藏
-
394 收藏
-
185 收藏
-
139 收藏
-
414 收藏
-
284 收藏
-
206 收藏
-
341 收藏
-
398 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习