首页 > 文章 > 前端

语音识别JS搭建教程及实战指南

时间：2025-10-18 12:12:27 341浏览收藏

启用语音识别功能

现代浏览器中（特别是基于Chromium的，如Chrome和Edge），可以通过 window.SpeechRecognition 或 window.webkitSpeechRecognition 访问语音识别接口。

初始化识别对象的基本代码如下：

const recognition = new (window.SpeechRecognition || window.webkitSpeechRecognition)();
recognition.lang = 'zh-CN'; // 设置语言，中文可选 'zh-CN'
recognition.interimResults = false; // 是否返回中间结果
recognition.continuous = false; // 是否持续监听

启动识别并处理结果

通过监听事件来获取识别结果。最关键的事件是 result，当语音被识别后会触发。

recognition.onresult = (event) => {
  const transcript = event.results[0][0].transcript;
  console.log('识别结果:', transcript);
  document.getElementById('output').textContent = transcript;
};

recognition.onerror = (event) => {
  console.error('识别出错:', event.error);
};

调用 recognition.start() 开始录音，用户会收到浏览器的麦克风权限请求。

document.getElementById('start-btn').onclick = () => {
  recognition.start();
};

优化用户体验

为了让应用更实用，可以添加一些交互反馈：

按钮状态切换：开始识别后禁用按钮，识别结束后恢复
视觉提示：用动画或颜色变化表示正在收音
错误处理：提示用户网络问题或权限被拒
语言切换：支持多语言识别选项

例如，可以在识别结束时自动重启或提示完成：

recognition.onend = () => {
  console.log('录音结束');
  // 可选择自动重启：recognition.start();
};

兼容性与限制

目前 SpeechRecognition 在Chrome和Edge中支持较好，Firefox和Safari支持有限或需要手动开启。生产环境中建议做特性检测：

if (!('SpeechRecognition' in window || 'webkitSpeechRecognition' in window)) {
  alert('当前浏览器不支持语音识别，请使用Chrome或Edge。');
}

另外，该功能必须在安全上下文中运行（即HTTPS或localhost）。

基本上就这些。通过合理使用Web Speech API，你可以快速为网页添加语音输入能力，无需第三方SDK。

理论要掌握，实操不能落！以上关于《语音识别JS搭建教程及实战指南》的详细介绍，大家都掌握了吧！如果想要继续提升自己的能力，那么就来关注golang学习网公众号吧！