大きすぎる音は小さく、小さい音は大きく聞き取りやすい音量に変える音量ノーマライザフィルタ。雑談などの声中心なら聞こえやすくなるので効果的で、急に音量が変わって聞き取りにくい音声を修正するのにも使える。

音量を調べるには showwavespicebur128volumedetect などがある。

サンプリング波形を一枚画像で出力する showwavespic
適切な音量が調べられる ffmpeg の ebur128 の使い方

volumedetect の使い方
ffmpeg -i input -vn -af volumedetect -f null -

基本コマンド

ffmpeg -i input -af dynaudnorm output

差分を手軽に調べるには showwavespic を使う。
ffmpeg -i input -vn -filter_complex dynaudnorm,showwavespic dynaudnorm.png
ffmpeg -i input -vn -filter_complex showwavespic non-dynaudnorm.png

上下に画像比較(上が dynaudnorm フィルタを当てている)。
ffmpeg -i input -vn -filter_complex asplit[0][1];[0]dynaudnorm,showwavespic[top];[1]showwavespic[bot];[top][bot]vstack compared_dynaudnorm.png
公式ドキュメント:FFmpeg Filters Documentation : dynaudnorm

オプション

オプションの詳細は公式ドキュメントを参照。

  • framelen, f[int]
    ミリ秒当たりのフレームの長さ
    既定値:500
    範囲:10 から 8000 まで
  • gausssize, g[int]
    ガウスフィルタの適応幅
    既定値:31
    範囲:3 から 301 までの奇数
  • peak, p[double]
    ピーク音量の設定。
    既定値:.095(変えるのは非推奨)
    範囲:0 から 1 まで
  • maxgain, m[double]
    最大ゲインの設定
    既定値:10.0
    範囲:1.0 から 100.0 まで
  • targetrms, r[double]
    目標RMS(二乗平均平方根)の設定
    既定値:0.0
    範囲:0.0 から 1.0 まで
  • coupling, n[boolean]
    それぞれのチャンネルに同様のフィルタを当てる
    既定値:1
  • correctdc, c[boolean]
    DCバイアス補正
    既定値:0
  • altboundary, b[boolean]
    別の境界補正の設定
    既定値:0
  • compress, s[double]
    古典的な圧縮方法を使う
    既定値:0.0
    範囲:0.0 から 30.0 まで

One thought on “ffmpeg で聞き取りやすい音量に変える dynaudnorm”

コメントを残す

メールアドレスが公開されることはありません。

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)