几秒钟从任意视频格式中提取音频(2026)
几秒钟从任意视频格式中提取音频
你录了一场 2 小时的会议演讲,只想要音频。或者你在 YouTube 上找到一段访谈,想通勤路上当播客听。或者你的手机录音 memo 因为点错图标,意外存成了视频文件。所有这些场景的工作流都是同一种:抽出音频,存成 MP3 或 WAV,搞定。
这件事听起来简单——用对工具确实如此。可 Google 首页那些"视频转音频"网站,要么转 3 次就开始收费、要么用劣质重编码把音频毁掉、要么悄悄把你的文件上传到陌生人服务器。本文会讲清楚音频提取真正是怎么工作的、为什么它应该 2 秒(不是 2 分钟)完成、以及如何用 Ai2Done 的 Extract Audio 工具 安全地完成。
TL;DR
- 音频提取本质是 demux——把音轨从视频容器里拉出来,不动两个流的任何字节。
- 音频编解码器已经是你想要的格式时,它是无损的(例如从 MP4 里抽 AAC 写成
.m4a)。 - 重编码到 MP3 时近乎无损——选 192 kbps 或更高即可。
- 用 Ai2Done Extract Audio 在浏览器里抽取,可选格式与画质。
- 隐私重要:会议录像、家庭视频、私人语音备忘录都含敏感内容,请在本地完成。
为什么这件事比看起来更难
一个视频文件是容器(.mp4、.mov、.mkv、.webm),里面包了两个或更多流——一条视频轨、一条或多条音轨,可能还有字幕。每条流有自己的编解码器:视频用 H.264 或 HEVC,音频用 AAC、MP3、Opus 或 Vorbis。
"提取音频"可能指两件颇为不同的事:
- Demux(无损、快):把音频流从容器里拉到新容器,不解码也不重编码。输出文件与视频内的音频数据字节相同。例如:从 MP4 里抽 AAC 轨写成
.m4a文件——约每 GB 1 秒、零画质损失。 - 解码 + 重编码(略有损、慢):把音频解码到 PCM 采样,再重新编码到另一格式(如 MP3、Opus)。例如:从 MP4 抽出转 MP3——约每小时 30-60 秒、一轮有损压缩。
多数用户想要的是方案 1(demux 到源使用的编解码器),但因为现有音频软件认 MP3,就会去选方案 2。现代手机、播放器、编辑应用都原生支持 .m4a(AAC),所以在 2026 年方案 1 越来越是正确默认——MP3 仍胜在"对老硬件最大兼容"(2010 年的车机、基础 USB MP3 播放器)。
好的提取器会让你选。多数在线工具强制 MP3,因为它们的商业模式假设你下个月还会回来为"更高画质"升级买单。
方法一:Ai2Done Extract Audio(浏览器端、编解码器感知)
Ai2Done Extract Audio 工具 用 FFmpeg.wasm 完全在你的浏览器里运行:
- 在任何现代浏览器中打开 /tools/extract_audio。
- 拖入你的视频(MP4、MOV、MKV、WebM、AVI——几乎任何格式)。
- 工具识别音频编解码器并展示:例如 "Audio: AAC, 256 kbps, stereo, 48 kHz"。
- 选输出格式:
- Native(推荐、无损):保留现有编解码器,只换容器——例如 AAC →
.m4a。约每 GB 1 秒。 - MP3(兼容性):按你选的比特率(128 / 192 / 320 kbps)重编码到 MP3。约每小时音频 30-60 秒。
- WAV(未压缩):输出巨大(约 10 MB/分钟),适合后续在 Audacity / Reaper 里编辑。
- Opus / FLAC:小众但可用——Opus 在播客画质下文件极小,FLAC 用于归档级无损存储。
- Native(推荐、无损):保留现有编解码器,只换容器——例如 AAC →
- 点击提取并下载。多音轨(部分视频有英文 + 西班牙文)会列为独立下载。
整件事在你的浏览器标签页内完成。源视频不会上传到任何服务器。无损提取下,操作甚至比把视频上传到网络还快。
实战小贴士:源是 YouTube 且你想要播客式 MP3 时,正确路径是:先 下载视频(MP4),再用 Extract Audio 选 MP3-192kbps。两步流水让两个工具各司其职、避开"全家桶下载器+提取器" SaaS 的陷阱。
方法二:VLC 媒体播放器(免费、跨平台桌面应用)
如果你已经装了 VLC,不必再装别的就能提取音频:
- VLC →
媒体 → 转换/保存… - 添加你的视频文件,点击
转换/保存。 - 在 "Profile" 下拉里选 "Audio - MP3" 或 "Audio - FLAC"。
- 选输出文件名,点击
开始。
VLC 的提取始终重编码(没有一键无损 demux),所以比浏览器工具慢。但它是离线桌面应用,很多人本来就装着。
方法三:FFmpeg 命令行
终端友好的人,一行 FFmpeg 就够:
# 无损 demux(保留原编解码器)
ffmpeg -i video.mp4 -vn -c:a copy audio.m4a
# 重编码到 MP3
ffmpeg -i video.mp4 -vn -c:a libmp3lame -b:a 192k audio.mp3
# 抽取特定音轨
ffmpeg -i video.mkv -map 0:a:1 -vn -c:a copy second_audio_track.m4a
-vn 表示"不输出视频"——丢弃视频流。-c:a copy 表示"原样复制音频流"——无损路径。重编码到 MP3 时,-b:a 192k 是标准播客比特率。
适合批处理(从 100 个视频的文件夹中提取音频)或需要精细控制时。对"我只有一段视频要拿音频"则属于过度工程。
浏览器提取器是怎么做的(技术细节)
- FFmpeg.wasm 0.12——和我们的视频转换器 / 视频裁剪器同款 WebAssembly FFmpeg 构建。所有转换都通过 Emscripten 虚拟文件系统在你的浏览器标签页里执行。
- MP4Box.js 做快速元数据探测——上传后 200ms 内告诉你音频编解码器、比特率、声道数,再排队任何提取。
- Web Worker + SharedArrayBuffer 做多线程编码。MP3 编码(libmp3lame)单线程;FLAC 和 Opus 在多核机器上受益于多线程。
- 内存 Blob 流式输出——大文件在 Chrome/Edge 上通过 File System Access API 把输出流式写盘,让峰值 RAM 维持合理。
值得说的设计选择:我们刻意不在本工具里加入"搜 YouTube 并提取音频"功能。这是大多数在线"MP4 转 MP3"站的商业模式核心,但它是隐私和版权雷区(你并不拥有大多数 YouTube 内容,下载它用于个人离线在很多司法辖区里都模糊)。我们把工作流拆开:YouTube 下载工具 取视频文件(版权责任在你),再用本工具提取音频。
常见问题
Q:抽出来的音频听起来会和视频里的音频完全一致吗? A:选 "Native"(无损 demux)会——字节相同。选 MP3 192 kbps 或更高,在消费级耳机上差异不可分。MP3 128 kbps 仔细听能在镲片和齿音上听出轻微压缩痕迹;播客式语音内容下 128 kbps 也够用。
Q:视频有多条音轨(英文 + 西班牙文),都能拿到吗? A:能——工具识别所有音轨并为每一条生成独立文件。也可以在音轨列表里点选某一条单独抽取。
Q:怎么只抽取某一段(比如第 10-15 分钟)? A:先用 Trim Video 工具 把视频剪到那一段,再过 Extract Audio。或直接在 Extract Audio 里使用"设置入/出点"开关,把两步合并。
Q:抽出来的音频在 iTunes / Apple Music / Spotify 里能用吗? A:三者都直接接受 M4A (AAC) 与 MP3。Spotify 上 M4A 更贴近其内部格式,导入时一般不会再重编码。
Q:我的视频格式很怪(.flv、.3gp、老摄像机的 .mts),工具能处理吗? A:大概率能——FFmpeg.wasm 支持与桌面 FFmpeg 相同的广泛格式,包括旧摄像机和手机格式。如果上传失败,请通过反馈链接告诉我们。
Q:为什么抽出来的 MP3 比原视频音轨比特率还小? A:MP3 编码是有损的——会丢弃听觉上不显著的音频数据。一条 256 kbps AAC 音轨通常会抽成 192 kbps MP3,人耳听起来一样、文件小约 25%。要严格保留原比特率,请选 Native (M4A)。
现在就试
几秒钟在浏览器内从任意视频提取音频:
拖入文件、选格式、点击提取。无上传、无注册、无水印。
相关阅读
- 在浏览器里把 MOV 转成 MP4(无需 Handbrake)——提取前先转换
- 在线无损裁剪视频(不重编码)——提取前先剪
- YouTube 转 MP3:合法且保画质的方法——完整 YouTube → 音频 工作流
- 浏览全部音频工具与视频工具
最后更新于 2026-06-14。Extract Audio 工具 100% 在你的浏览器内运行——你的视频永远不会离开设备。我们不收集、不记录、不分析你处理的任何文件。