FFmpegのオーディオフィルタの本を頒布した技術書典9を振り返る

#技術書典 「刺され!技術書アワード」の最終候補作品に選ばれた。

前回参加記事
FFmpegの本を頒布した技術書典7を振り返る

告知記事
技術書典9でFFmpegのオーディオフィルタ本が出ます

サークルページ
ニコラボ | 技術書典

新刊。BOOTH版は目次の頭文字数字の項目を直している。どちらも同じ価格で決済手段が異なる。技術書典は差し替えに再審査が必要なので差し替えていない。

FFmpegのオーディオフィルタの本:ニコラボ | 技術書典
【PDF】FFmpegのオーディオフィルタの本 – ニコラボの本屋 – BOOTH

現在技術書典内では電子版と物理本は販売終了し、電子版は一時的に販売停止になっている

Continue reading “FFmpegのオーディオフィルタの本を頒布した技術書典9を振り返る”

視覚評価に重きを置いたxpsnr

既存のpsnrフィルタを拡張して、視覚的品質に対する評価に重きを置いた7.1以降から使えるxpsnrフィルタの使い方。従来のpsnr評価と同様の範囲で比較する動画は同じ解像度とfps、ピクセルフォーマットである必要がある。

参照できる論文。

  • C. R. Helmrich, M. Siekmann, S. Becker, S. Bosse, D. Marpe, and T. Wiegand, “XPSNR: A Low-Complexity Extension of the Perceptually Weighted Peak Signal-to-Noise Ratio for High-Resolution Video Quality Assessment,” in Proc. IEEE Int. Conf. Acoustics, Speech, Sig. Process. (ICASSP), virt./online, May 2020. http://www.ecodis.de/xpsnr.htm
  • C. R. Helmrich, S. Bosse, H. Schwarz, D. Marpe, and T. Wiegand, “A Study of the Extended Perceptually Weighted Peak Signal-to-Noise Ratio (XPSNR) for Video Compression with Different Resolutions and Bit Depths,” ITU Journal: ICT Discoveries, vol. 3, no. 1, pp. 65 – 72, May 2020. https://www.itu.int/pub/S-JOURNAL-ICTS.V3I1-2020-8

2つの映像の画質評価をする psnr

Continue reading “視覚評価に重きを置いたxpsnr”

ブロックノイズを数値化するblockdetect

Remco Muijs氏とIhor Kirenko氏の”A no-reference blocking artifact measure for adaptive video processing.”を基としたフレームのブロックノイズを数値化するblockdetectフィルタの使い方。フィルタを通しても映像は変化しない。メタデータに出力するのでffprobe連携できる。

ぼやけている映像を数値化するblurdetectフィルタもある。

フレームのぼやけ度を判定するblurdetect

Continue reading “ブロックノイズを数値化するblockdetect”

FFmpeg 7.0リリース

2024年8月3日にFFmpeg 7.0.2がリリースされた。アップデート内容は新機能追加より修正にとどまる。

2024年5月26日にFFmpeg 7.0.1がリリースされた。アップデート内容は新機能追加より修正にとどまる。

2024年4月5日にFFmpeg 7.0 Dijkstra(エドガー・ダイクストラ – Wikipedia)がリリースされた。6.1以降に追加されたフィルタやデコーダ、エンコーダなどが追加されている。

Download FFmpeg
Commits · FFmpeg/FFmpeg · GitHub

Continue reading “FFmpeg 7.0リリース”

FFmpeg 6.1リリース

2023年12月31日にffmpeg 6.1.1がリリースされた。アップデート内容はフィルタ周りの修正にとどまっている。

Commits · FFmpeg/FFmpeg : n6.1.1
Changelog: update · FFmpeg/FFmpeg@41f32f0

コマンドラインツールのマルチスレッド化については7.0に追加予定である
FFmpeg : December 12th, 2023, multi-threaded ffmpeg CLI tool
Scrapbox : fueruwakame

予定から伸びていたFFmpeg 6.1 Heaviside(オリヴァー・ヘヴィサイド – Wikipedia)が2023年11月11日にリリースされた。6.0以降に追加されたフィルタやデコーダ、エンコーダなどが追加されている。

Download FFmpeg

Continue reading “FFmpeg 6.1リリース”

処理速度に特化したAV1エンコーダSVT-AV1

ffmpegから使えるAV1ソフトウェアエンコーダにはAOM-AV1、SVT-AV1、rav1eがあり、このSVT-AV1は処理速度に特化していて保存用からライブ配信用までプリセットによる調整が可能。BlueSwordM氏の細部がぼやけるのを修正した派生版や、開発が現在盛んなgianni-rosato氏の派生版もある。こちらはハードコードされたパラメータを少し変えたり、実験的なオプションを追加したりしていて、公式の最新版にも追従している。

gitlabでは該当コミットのパイプラインのリンクに飛ぶとバイナリがダウンロードできる。

AV1ハードウェアエンコーダにはRTX 40シリーズのNVIDIA NVENC、RX 7000シリーズのAMD AMF、Intel Arc GraphicsのQuick Sync Videoなどがある。

Continue reading “処理速度に特化したAV1エンコーダSVT-AV1”

音声のPSNRを調べるapsnr、信号の歪み比を調べるasdr

ffmpeg 6.1以降から使える予定のフィルタ。

周波数の波形を見るにはshowspectrumpic、showspectrum、showwavesフィルタなどがある。
不可逆圧縮された音声のカットされた周波数が調べられる showspectrumpic
音声波形を表示する showspectrum, showwaves の使い方

Continue reading “音声のPSNRを調べるapsnr、信号の歪み比を調べるasdr”

D3D11経由でデスクトップ画面を取り込むddagrab

D3D11経由なので同じメモリ上からエンコードできるNVENC, AMFのエンコーダには処理が速くなる。Windowns向けのDesktop Duplication APIを使う。

Continue reading “D3D11経由でデスクトップ画面を取り込むddagrab”

ARIB字幕をdemuxするlibaribcaption

FFmpeg 6.1から使える予定のデコーダ。今まであったlibaribb24からDRCSに対応してきれいにレンダリングできるlibaribcaption。現時点ではgyan.dev、BtbNのFFmpegが対応している。

Continue reading “ARIB字幕をdemuxするlibaribcaption”