Java如何截取音频片段?
时间:2026-05-31 21:10:38 314浏览 收藏
Java原生Sound API并不提供直接的音频剪辑功能,截取音频片段本质上是通过手动计算帧数定位、精确跳过起始部分、读取目标PCM数据并严格按原格式写入WAV文件的过程;该方法仅原生支持WAV/AIF等无损格式,处理MP3或FLAC需引入第三方库(如mp3spi或flac-java)进行解码,且无论输入格式如何,输出必须使用WAV容器和完全一致的AudioFormat参数,否则极易因格式不匹配导致静默失败或播放异常——掌握帧率换算、流定位可靠性及格式兼容性校验,才是实现稳定音频截取的关键。

Java Sound API 不能直接“剪辑”音频文件,只能读取+重写
Java 标准库的 javax.sound.sampled 没有内置的“剪切”或“导出片段”功能。它只提供音频数据的读取、处理和写入能力——所谓“截取”,本质是:打开原始音频 → 跳过开头不需要的部分 → 按时长读取目标数据 → 写入新文件。整个过程必须手动控制帧位置、缓冲区大小和格式兼容性。
用 AudioInputStream 定位起始帧再读取指定帧数
关键不是“时间秒数”,而是“帧数(frame)”。因为不同音频格式采样率、通道数、位深不同,1 秒对应的帧数也不同。必须先获取 AudioFormat,算出目标起始帧和结束帧,再用 skip() 和循环 read() 实现截取。
skip(long bytes)不可靠:它跳的是字节,而音频帧边界未必对齐字节,容易错位;应改用AudioInputStream.read()配合getFrameLength()和getFrameRate()算帧偏移- 起始时间
t0(秒)→ 起始帧 =(long)(t0 * format.getFrameRate()) - 持续时间
duration(秒)→ 总帧数 =(long)(duration * format.getFrameRate()) - 务必检查原始流是否支持 mark/reset,否则无法安全跳转;不支持时需重新打开流
写入新文件时必须复用原格式,否则播放失败
很多初学者直接用 AudioSystem.write(..., AudioFileFormat.Type.WAV, ...),却没注意:WAV 容器能装 PCM,但不能装 MP3 或 AAC 数据。如果原始文件是 MP3,AudioInputStream 解码后输出的是 PCM 格式,此时写入 WAV 是合法的;但如果强行指定 Type.MP3,Java 默认不支持 MP3 编码(AudioSystem.isFileTypeSupported(Type.MP3) 返回 false),会静默失败或抛 IllegalArgumentException。
- 写入前必须调用
AudioSystem.isFileTypeSupported(targetType, format)校验支持性 - 推荐统一用
AudioFileFormat.Type.WAV输出,兼容性最好 - 写入的
AudioFormat必须与读取时完全一致(包括encoding,sampleRate,channels,frameSize,frameRate,sampleSizeInBits,bigEndian)
AudioInputStream original = AudioSystem.getAudioInputStream(new File("input.wav"));
AudioFormat format = original.getFormat();
long startFrame = (long) (2.5 * format.getFrameRate()); // 从第 2.5 秒开始
long frameCount = (long) (3.0 * format.getFrameRate()); // 截取 3 秒
<p>// 跳过前面不需要的帧(注意:skip() 是跳字节,这里用 read() 模拟跳帧更稳)
byte[] skipBuffer = new byte[(int) (format.getFrameSize() * startFrame)];
original.read(skipBuffer);</p><p>// 准备输出流
ByteArrayOutputStream outBytes = new ByteArrayOutputStream();
byte[] buffer = new byte[8192];
int totalRead = 0;
while (totalRead < frameCount <em> format.getFrameSize()) {
int len = original.read(buffer, 0, Math.min(buffer.length, (int) (frameCount </em> format.getFrameSize() - totalRead)));
if (len == -1) break;
outBytes.write(buffer, 0, len);
totalRead += len;
}</p><p>AudioInputStream clipped = new AudioInputStream(
new ByteArrayInputStream(outBytes.toByteArray()),
format,
frameCount
);</p><p>AudioSystem.write(clipped, AudioFileFormat.Type.WAV, new File("output.wav"));</p>MP3/FLAC 等格式需额外依赖,纯 Java Sound API 仅支持 WAV/AIF/ULAW/ALAW
如果你的输入文件是 .mp3 或 .flac,AudioSystem.getAudioInputStream() 很可能直接抛 UnsupportedAudioFileException。这是因为 JDK 自带的 SPI 服务只注册了有限几种格式解码器。想支持更多格式,必须引入第三方库并注册自定义 AudioFileReader:
mp3spi(配合jlayer)可读 MP3flac-java或TarsosDSP可读 FLAC- 引入后仍要确保写入时用
AudioFileFormat.Type.WAV,不要试图写回 MP3(JDK 无 MP3 编码器)
最容易被忽略的一点:即使你成功读出了 MP3 的 PCM 数据,截取后的帧数计算仍必须基于解码后的 AudioFormat(即 PCM 参数),而不是原始 MP3 文件头里的信息——后者是压缩参数,不能用于定位。
理论要掌握,实操不能落!以上关于《Java如何截取音频片段?》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
427 收藏
-
493 收藏
-
348 收藏
-
235 收藏
-
212 收藏
-
216 收藏
-
243 收藏
-
298 收藏
-
355 收藏
-
394 收藏
-
373 收藏
-
314 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习