tutorial 2026-06-14

任意のビデオフォーマットから音声を数秒で抽出（2026）

任意のビデオフォーマットから音声を数秒で抽出

2 時間のカンファレンストークを録音し、音声だけが重要です。または通勤中にポッドキャストとして聞きたい YouTube インタビューを見つけました。または電話のボイスメモが間違ったアイコンをタップしたためにビデオファイルとして偶発的に保存されました。すべてのこれらのケースでワークフローは同じです：音声を抽出、MP3 または WAV として保存、完了。

これは些細に聞こえます——そして正しいツールでは、本当にそうです。しかし Google の最初のページで見つけるすべての「ビデオから音声」ウェブサイトは、3 変換後に課金する、品質を殺す再エンコードで音声をマングルする、または静かにファイルを見知らぬ人のサーバーにアップロードします。このガイドは、音声抽出が実際にどう機能するか、なぜ 2 分ではなく 2 秒かかるべきか、Ai2Done の Extract Audio ツール で安全に行う方法を説明します。

TL;DR

音声抽出は単なるデマックス —— ストリームのどちらにも触れずにビデオコンテナから音声トラックを引き出す。
音声コーデックがすでに望むものであるときロスレス（例：MP4 から .m4a ファイルへの AAC 抽出）。
互換性のため MP3 への再エンコード時はほぼロスレス —— 192 kbps 以上を選んでください。
フォーマット選択と品質コントロールでブラウザサイド抽出に Ai2Done Extract Audio を使用。
プライバシーが重要：ミーティング録音、家族ビデオ、個人ボイスメモには機微なコンテンツが含まれます；ローカルで抽出してください。

なぜ見た目より難しいのか

ビデオファイルはコンテナ（.mp4、.mov、.mkv、.webm）で、2 つ以上のストリームをラップします——1 つのビデオトラック、1 つまたは複数の音声トラック、オプションで字幕。各ストリームには独自のコーデック：ビデオには H.264 または HEVC；音声には AAC、MP3、Opus、または Vorbis。

「音声を抽出」は 2 つのかなり異なる操作を意味する可能性があります：

デマックス（ロスレス、高速）：デコードや再エンコードなしで、音声ストリームをコンテナから新しいコンテナに引き出す。出力ファイルはビデオ内の音声データとバイト同一。例：MP4 から AAC トラックを .m4a ファイルに抽出 —— GB あたり〜1 秒、ゼロ品質損失。
デコード + 再エンコード（わずかにロッシー、遅い）：音声を PCM サンプルにデコードし、その後 MP3 や Opus のような異なるフォーマットに再エンコード。例：MP4 から抽出して MP3 に変換 —— 1 時間あたり 30〜60 秒、1 ラウンドのロッシー圧縮付き。

ほとんどのユーザーはオプション 1（ソースがすでに使うどんなコーデックでもデマックス）を望みますが、MP3 が既存の音声ソフトウェアが理解するフォーマットだからオプション 2（MP3 に再エンコード）に手を伸ばします。モダンな電話、プレーヤー、編集アプリはすべて .m4a（AAC）をネイティブにサポートするので、オプション 1 は 2026 年に正しいデフォルトになりつつあります——しかし MP3 は古いハードウェア（2010 年代の車載ステレオ、ベーシック USB MP3 プレーヤー）との最大互換性で依然として勝ちます。

良いエクストラクターはあなたに選ばせます。ほとんどのオンラインツールは MP3 を強制します。なぜなら彼らの価格モデルが、来月戻ってきて「より高品質」アップグレードに支払うと仮定しているからです。

方法 1：Ai2Done Extract Audio（ブラウザサイド、コーデック認識）

Ai2Done Extract Audio ツール は FFmpeg.wasm を使ってブラウザで完全に動作します：

任意のモダンブラウザで /tools/extract_audio を開く。
ビデオをドロップ（MP4、MOV、MKV、WebM、AVI —— ほとんど任意のフォーマット）。
ツールが音声コーデックを検出し表示：例：「音声：AAC、256 kbps、ステレオ、48 kHz。」
出力フォーマットを選ぶ：
- ネイティブ（推奨、ロスレス）：既存のコーデックを保ち、コンテナだけ変更 —— 例：AAC → .m4a。GB あたり 1 秒。
- MP3（互換性）：選んだビットレート（128/192/320 kbps）で MP3 に再エンコード。音声 1 時間あたり 30〜60 秒。
- WAV（非圧縮）：巨大なファイル（分あたり〜10 MB）を生成、Audacity/Reaper でのさらなる音声編集に適切。
- Opus / FLAC：ニッチだが利用可能 —— ポッドキャスト品質の小さなファイルには Opus、アーカイブロスレスストレージには FLAC。
抽出をクリックしてダウンロード。複数の音声トラック（一部のビデオには英語 + スペイン語）は別個のダウンロードとして表示。

すべてがブラウザタブで実行されます。ソースビデオはサーバーにアップロードされません。ロスレス抽出には、操作はネットワークがビデオをアップロードするよりも速く完了します。

プロのヒント：ソースが YouTube からで、ポッドキャストスタイル MP3 が欲しいなら、正しいパスは：最初にビデオをダウンロード（MP4 で）、それから MP3-192kbps オプションで Extract Audio を通してそれを実行。2 ステップフローは両ツールをシンプルに保ち、「オールインワンダウンローダー&エクストラクター」SaaS の罠を避けます。

方法 2：VLC メディアプレーヤー（無料、クロスプラットフォームデスクトップ）

すでに VLC を持っているなら、音声抽出は何もインストールせずに機能します：

VLC を開く → Media → Convert / Save...
ビデオファイルを追加、Convert / Save をクリック。
プロファイルドロップダウンから「Audio - MP3」または「Audio - FLAC」を選ぶ。
出力ファイル名を選び、Start をクリック。

VLC の抽出は常に再エンコードします（ワンクリックオプションとしてロスレスデマックスを行いません）、だからブラウザツールより遅いですが、多くの人がすでにインストールしている完全オフラインデスクトップアプリです。

方法 3：FFmpeg コマンドライン

ターミナルに慣れている人向けに、FFmpeg はこれを 1 行で行います：

# ロスレスデマックス（元のコーデックを保つ）
ffmpeg -i video.mp4 -vn -c:a copy audio.m4a

# MP3 に再エンコード
ffmpeg -i video.mp4 -vn -c:a libmp3lame -b:a 192k audio.mp3

# 特定のトラックの音声だけを抽出
ffmpeg -i video.mkv -map 0:a:1 -vn -c:a copy second_audio_track.m4a

-vn は「ビデオ出力なし」 —— ビデオストリームをドロップ。-c:a copy は「音声ストリームをそのままコピー」 —— ロスレスパス。MP3 へのロッシー再エンコードには、-b:a 192k が標準ポッドキャスト品質ビットレート。

これはバッチスクリプティング（100 ビデオのフォルダーから音声を抽出）や非常に特定のコントロールが必要なときの正しい答えです。「1 つのビデオがあり音声が欲しい」にはオーバーキル。

ブラウザエクストラクターをどう構築したか（技術的ディープダイブ）

Ai2Done Extract Audio ツールは以下に構築されています：

FFmpeg.wasm 0.12 —— 当社のビデオコンバーターとビデオトリマーを駆動する同じ WebAssembly FFmpeg ビルド。すべての変換は Emscripten の仮想ファイルシステムを介してブラウザタブで実行。
高速メタデータ probing のための MP4Box.js —— アップロード後 200ms 以内に音声コーデック、ビットレート、チャンネル数を伝え、抽出をキューに入れる前に。
マルチスレッドエンコーディングのための Web Workers + SharedArrayBuffer。libmp3lame 経由の MP3 エンコーディングはシングルスレッド；FLAC と Opus はマルチコアマシンでマルチスレッドから恩恵を受けます。
出力のためのインメモリ Blob ストリーミング —— 大きなファイルには Chrome/Edge で File System Access API を介して出力をディスクにストリーミングしてピーク RAM を正気に保ちます。

興味深いデザインの選択：このツールに「YouTube を検索して音声を抽出」機能を意図的に含めません。その種のオールインワン機能はほとんどのオンライン「MP4 to MP3」サイトがビジネスを構築する周りのものですが、プライバシーと著作権の地雷原です（ほとんどの YouTube コンテンツを所有していません；個人的なオフライン使用のためのダウンロードは多くの管轄区域で法的にあいまい）。ワークフローを分割します：ビデオファイルを取得するための YouTube Download ツール（権利についてあなたの責任の下で）、それから音声抽出のためのこのツール。

FAQ

Q: 抽出された音声はビデオの音声とまったく同じに聞こえますか？ A: 「ネイティブ」（ロスレスデマックス）を選ぶと、はい —— バイト同一。192 kbps 以上で MP3 を選ぶと、消費者ヘッドフォンで違いは知覚できません。MP3 128 kbps で注意深く聞くと、シンバルとシビラントで微妙な圧縮アーティファクトを聞くでしょう。ポッドキャストスタイルのスピーチには、128 kbps MP3 でも問題ありません。

Q: 私のビデオには複数の音声トラック（英語とスペイン語）があります。両方取得できますか？ A: はい —— ツールはすべてのトラックを検出し、それぞれに別個の音声ファイルを生成します。トラックリストの行をクリックして抽出する 1 つを選ぶこともできます。

Q: 音声の特定セグメントだけを抽出するには（例：10〜15 分）？ A: 最初に Trim Video ツールを使ってビデオをセグメントにカットし、そのクリップを Extract Audio で実行してください。または Extract Audio ツールで「入 / 出ポイントを設定」トグルを直接使って両ステップを組み合わせてください。

Q: 抽出された音声は iTunes / Apple Music / Spotify で機能しますか？ A: 3 つすべてが M4A（AAC）と MP3 を直接受け入れます。Spotify には特に、M4A が彼らの内部フォーマットへのより近いマッチで、インポート時に再エンコードなしで再生される傾向があります。

Q: 私のビデオは奇妙なフォーマット（.flv、.3gp、古いカムコーダーからの .mts）です。ツールは処理しますか？ A: おそらくはい —— FFmpeg.wasm は古いカムコーダーと電話フォーマットを含むデスクトップ FFmpeg と同じ広範囲のフォーマットをサポートします。アップロードが失敗したら、フィードバックリンクから知らせてください。

Q: なぜ抽出された MP3 は元のビデオの音声ビットレートより小さいのですか？ A: MP3 エンコーディングはロッシー —— 知覚的に重要でない音声データを破棄します。256 kbps AAC 音声トラックは通常、人間に同一に聞こえるが〜25% 小さい 192 kbps MP3 に抽出されます。元のビットレートを正確に保つには、代わりにネイティブ（M4A）オプションを使ってください。

今試す

任意のビデオから音声を数秒で抽出、完全にブラウザで：

Extract Audio ツールを開く →

ファイルをドロップ、フォーマットを選び、抽出をクリック。アップロードなし、サインアップなし、ウォーターマークなし。

JSONフォーマッター

Base64 エンコード

URL エンコード

YAMLフォーマッター

XMLフォーマッター

SQLフォーマッター

JWT デコーダー

PDF結合

PDF圧縮

PDF分割

PDF編集

PDFからWord

WordからPDF

PDFからJPG

AI画像生成

背景除去

Make Background Transparent

画像圧縮

画像リサイズ

超解像

顔修復

AI ディープ翻訳

段落ライター

スマートメールアシスタント

文章リライター

テキストサマライザー

文法フィクサー

コードコメンタ

テンセント動画VIPプレイヤー

iQIYI VIPプレイヤー

Youku VIPプレイヤー

芒果TV VIPプレイヤー

YouTube動画ダウンロード

Douyin動画ダウンロード

WeChat Video動画ダウンロード

CSVからExcel

ExcelからPDF

XMLからJSON

Excel分割

CSV分割

XMLからExcel

ExcelからXML