JavaScript操作音视频主要依赖HTML5的Audio和Video元素,结合相关API实现控制与交互。以下是常见方法和API:一、基本操作1.Audio和Video元素通过HTML标签直接引入音频或视频文件:<audioid="myAudio"src="audio.mp3"></audio><videoid="myVideo"src="video.mp4">
时间:2026-01-14 19:57:48 121浏览 收藏
来到golang学习网的大家,相信都是编程学习爱好者,希望在这里学习文章相关编程知识。下面本篇文章就来带大家聊聊《JavaScript如何操作音频视频?有哪些API?》,介绍一下,希望对大家的知识积累有所帮助,助力实战开发!
HTMLMediaElement 是音视频操作核心接口,提供播放、暂停等统一控制;需监听 loadedmetadata 确保就绪;play() 需用户手势触发;MediaSession 支持系统级控制;Web Audio 用于精细处理,AudioContext 需 resume();requestVideoFrameCallback 实现帧同步但仅 Chromium 支持。

HTMLMediaElement 是操作音视频的核心接口
所有 和 元素都继承自 HTMLMediaElement,它提供了统一的控制能力,比如播放、暂停、跳转、音量调节。直接操作 DOM 元素就能调用这些方法,不需要额外库。
常见错误是试图在未加载元数据时调用 duration 或 play() —— 此时值可能为 NaN 或抛出 NotAllowedError。应监听 loadedmetadata 或使用 canplay 事件确保就绪。
play()和pause():必须由用户手势(如 click)触发,否则现代浏览器会拒绝(DOMException: play() failed because the user didn't interact with the document first)currentTime:设为负数或超长值不会报错,但实际行为因浏览器而异(Chrome 会 clamp 到[0, duration],Safari 可能跳回 0)muted和volume:设置muted = true会覆盖volume;volume范围是0.0–1.0,超出会被截断
MediaSession API 用于系统级媒体控制
当页面播放音视频时,用户可能通过键盘媒体键、锁屏界面或通知栏控制播放。启用 MediaSession 可让这些操作映射到你的逻辑中。
不配置 MediaSession 时,系统通常只显示标题和图标,且无法响应播放/暂停等操作。必须显式设置 metadata 并添加事件监听器。
- 需先检查支持性:
'mediaSession' in navigator navigator.mediaSession.metadata至少要设title和src(图标),否则部分平台(如 Android)不显示控件- 事件监听必须在播放开始后注册,否则某些系统(如 Chrome on Windows)可能忽略首次操作
if ('mediaSession' in navigator) {
navigator.mediaSession.metadata = new MediaMetadata({
title: '示例音频',
artist: '作者名',
artwork: [{ src: '/icon.png', sizes: '96x96' }]
});
navigator.mediaSession.setActionHandler('play', () => audio.play());
navigator.mediaSession.setActionHandler('pause', () => audio.pause());
}
Web Audio API 适合精细音频处理
如果需求超出 的能力——比如实时滤波、音高变换、可视化频谱、多音轨混音——就得用 Web Audio API。它和 HTMLMediaElement 可桥接,但设计模型完全不同:基于节点图(AudioContext → MediaElementAudioSourceNode → BiquadFilterNode…)。
容易忽略的关键点是音频上下文默认处于 suspended 状态,首次播放前必须由用户手势恢复,否则后续所有节点无效。
- 创建
AudioContext后立即调用context.resume()(在 click 回调里) - 用
context.createMediaElementSource(audioEl)将接入 Web Audio 图,之后再修改audioEl.volume = 0防止双重输出 analyserNode.fftSize影响频谱精度和性能,常用值为256、512、1024;越大越准,但计算开销越高
Video 的帧处理与画布合成依赖 requestVideoFrameCallback
传统 requestAnimationFrame 不保证与视频帧同步,导致画面撕裂或丢帧。Chrome 110+ 支持 requestVideoFrameCallback,它在浏览器真正准备渲染下一帧时触发回调,是做逐帧分析、AR 贴图、实时滤镜的可靠入口。
该 API 目前仅 Chromium 系浏览器支持(Chrome、Edge、Opera),Firefox 和 Safari 尚未实现。降级方案只能用 timeupdate + videoEl.currentTime 估算,但误差明显。
- 必须传入一个
元素实例,不能是 - 回调参数含
mediaTime(精确时间戳)和presentedFrames(已呈现帧数),可用于检测卡顿 - 每次回调后需手动再次调用该方法,它是一次性的
let video = document.querySelector('video');
function onFrame(now, metadata) {
console.log(`视频时间:${metadata.mediaTime.toFixed(3)}s`);
// 在这里做 canvas 绘制或 WebGL 处理
video.requestVideoFrameCallback(onFrame);
}
video.requestVideoFrameCallback(onFrame);
有些功能看似简单(比如“静音”或“跳到 30 秒”),但实际涉及权限、时序、跨浏览器差异;Web Audio 和 requestVideoFrameCallback 这类高级能力则有明确的支持边界——别在没确认浏览器版本的情况下默认启用。今天关于《JavaScript操作音视频主要依赖HTML5的Audio和Video元素,结合相关API实现控制与交互。以下是常见方法和API:一、基本操作1.Audio和Video元素通过HTML标签直接引入音频或视频文件:
-
502 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
179 收藏
-
448 收藏
-
322 收藏
-
425 收藏
-
236 收藏
-
221 收藏
-
232 收藏
-
359 收藏
-
303 收藏
-
467 收藏
-
117 收藏
-
307 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习