音声データを読み込みサンプリング波形を一枚画像で出力するshowwavespicの使い方。音声のどの時間帯でどのくらいの音量があるのかがよくわかる。

読み込み開始時点や終了時点を変更する -ss, -t, -to などはエラーになるので使えない。出力フォーマットはグレースケール RGBA になるのでoverlayフィルタなどで別の映像と合わせるのにも使える。

リアルタイムに同様の波形を調べるにはshowwavesフィルタを使う。
音声波形を表示する showspectrum, showwaves の使い方

基本コマンド

既定値からチャンネル別に表示。
ffmpeg -i input -filter_complex "showwavespic=s=600x240:split_channels=1:colors=red|green:scale=0" showwavespic.png

waveform のサンプル画像

公式ドキュメント:FFmpeg Filters Documentation : showwavespic

オプション

  • size, s[image_size]
    画像の出力解像度
    既定値:600×240
  • split_channels[boolean]
    チャンネル別に表示するかどうか。0 にするとチャンネルの数だけ色がミックスされる
    既定値:0(しない)
  • colors[string]
    波形の色指定。チャンネル数毎に | で指定する
    既定値:”red|green|blue|yellow|orange|lime|pink|magenta|brown”
  • scale[int]
    振幅のサイズ指定
    • 0, lin:線形。一番小さい。既定値
    • 1, log:対数。一番大きい
    • 2, sqrt:平方根。2番目に小さい
    • 3, cbrt:立方根。3番目に小さい(2番目に大きい)
  • draw[int]
    描写方法の指定
    • 0, scale:ダウンサンプルして描写する。既定値
    • 1, full:そのまま描写する

関連記事

コメントを残す

メールアドレスが公開されることはありません。

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)