登录
首页 >  科技周边 >  人工智能

千问支持流式输出,可通过 API 设置 stream=True 参数实现。

时间:2026-05-20 23:00:31 414浏览 收藏

通义千问模型原生支持流式输出,能让AI响应像打字一样实时逐字呈现,大幅提升交互沉浸感与响应感知速度;其实现核心是Server-Sent Events(SSE)协议,无论前端用EventSource或Fetch+ReadableStream,还是后端采用Spring Boot的SseEmitter、PHP的curl流式回调,甚至Ollama的缓冲穿透方案,都能灵活适配——只需在API请求中简单设置`stream=true`,再按对应技术栈配置服务端推送与客户端解析逻辑,即可轻松解锁丝滑、低延迟的流式AI体验。

千问支持流式输出吗,怎么实现?

如果您在调用通义千问模型时希望响应内容能实时逐字呈现,而非等待全部生成完毕再一次性返回,则需确认其流式输出能力并配置对应机制。千问系列模型普遍支持流式输出,实现依赖服务端协议适配与客户端接收逻辑协同。以下是具体实施路径:

一、启用 API 请求的 stream 参数

流式输出的基础是向服务端明确声明需以流式方式接收响应。通义千问兼容 OpenAI-style 接口,通过设置 stream 字段为 true 触发服务端分块推送行为。

1、构造 JSON 请求体,在顶层字段中添加 "stream": true

2、确保请求 Header 中包含 Content-Type: application/json 与有效的 Authorization 凭据;

3、发起 POST 请求至 /v1/chat/completions 等支持 streaming 的端点;

4、验证服务端响应头中包含 Content-Type: text/event-stream

二、使用 Server-Sent Events(SSE)协议接收

SSE 是浏览器原生支持的单向流协议,适用于服务器持续推送文本块的场景。它无需额外库即可解析 event: message 格式的数据帧,且具备自动重连机制。

1、在前端 JavaScript 中创建 new EventSource(url, { withCredentials: true }) 实例;

2、监听 message 事件,对 event.data 字段执行 data.replace(/^data:\s*/, '') 去除前缀;

3、跳过空行及注释行(以 : 开头的行);

4、对每条有效数据调用 JSON.parse() 解析,提取 content 字段并追加至显示区域;

5、监听 error 事件并在连接中断时执行清理操作;

三、使用 Fetch API + ReadableStream 手动处理

当需要精细控制流生命周期、中断逻辑或兼容不支持 EventSource 的环境时,Fetch 配合可读流是更灵活的选择。该方式绕过自动解析,直接操作原始字节流。

1、调用 fetch(url, { method: 'POST', body: JSON.stringify(payload), headers: { 'Content-Type': 'application/json' } })

2、检查 response.ok 并确认 response.headers.get('content-type') 为 text/event-stream

3、获取 response.body.getReader()

4、使用 TextDecoder({ stream: true }) 对每次 reader.read() 返回的 chunk.value 进行增量解码;

5、按行分割解码结果,过滤 data: 行,提取 content 后渲染;

四、后端使用 SseEmitter(Spring Boot)

Java 生态中,Spring Boot 提供 SseEmitter 类封装 SSE 协议细节,使控制器可异步推送多段消息。该方式适合构建企业级响应式 AI 服务。

1、在 Controller 方法返回类型中声明 SseEmitter

2、设置超时时间为 0(永不过期)或合理长值,避免连接被容器中断;

3、调用 emitter.send(SseEmitter.event().name("message").data(chunk)) 推送每个文本块;

4、在模型推理完成或异常发生时调用 emitter.complete() 或 emitter.completeExceptionally(e);

5、确保方法映射路径的 produces 属性为 MediaType.TEXT_EVENT_STREAM_VALUE

五、PHP 使用 curl + WRITEFUNCTION 处理流

PHP 环境下无法原生监听 SSE 流,但可通过 curl 的 CURLOPT_WRITEFUNCTION 回调函数捕获服务端持续写入的响应体,实现等效流式解析。

1、初始化 curl 句柄并设置 CURLOPT_URL 与认证头;

2、启用 CURLOPT_POST 并传入含 stream: true 的 JSON 数据;

3、注册 WRITEFUNCTION 回调,对每次接收到的 $data 执行 processStreamedData($data)

4、在回调中识别 data: 前缀,提取 JSON 片段并解析 content 字段;

5、调用 echo 输出处理结果,并立即执行 ob_flush()flush() 强制刷新缓冲区;

今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>