поясни мне смысл, что такое salt-and-paper noise, ...
Created on: November 6, 2025
Answered using GPT-5 Thinking by Chat01
Created on: November 6, 2025
Answered using GPT-5 Thinking by Chat01
поясни мне смысл, что такое salt-and-paper noise, quantization, ffmpeg и т.п. Vimeo denoising/deblocking benchmark. We select 91,701
frame septuplets from 38,990 video clips for the denoising task, using the first two criteria introduced for the interpolation benchmark. For video denoising, we consider
two types of noises: a Gaussian noise with a standard deviation of 0.1, and mixed noises including a 10% salt-andpepper noise in addition to the Gaussian noise. For video deblocking, we compress the original sequences using FFmpeg
with codec JPEG2000, format J2k, and quantization factor
q = {20,40,60}.
Вот что означает каждое слово и как это всё связано в вашем отрывке.
Salt-and-pepper noise (соль-и-перец)
Импульсный шум: случайная доля пикселей «ломается» и становится либо совсем чёрной (0), либо совсем белой (1). «10% salt-and-pepper» означает, что примерно у 10% пикселей значение насильно заменяют на 0 или 1 (обычно поровну). Такой шум моделирует «битые» пиксели/пакеты.
Gaussian noise (гауссов шум)
К каждому пикселю добавляют случайную величину из нормального распределения 𝒩(0, σ²). В тексте σ=0.1 — если яркости нормированы в [0,1], это заметный шум (примерно ±0.1 СКО).
Quantization (квантование)
«Округление» значений с потерей точности до дискретной сетки. В видео-кодеках сначала переходят к «коэффициентам» (ДКП/вейвлеты и т.п.), а затем делят их на шаг квантования и округляют. Чем крупнее шаг (или «выше q», если параметр так трактуется), тем сильнее потери, ниже битрейт и заметнее артефакты (блоки, ringing, размытие). Конкретное направление шкалы «q» зависит от кодека/реализации, но в бенчмарках это обычно просто три уровня ухудшения качества.
FFmpeg
Консольный «швейцарский нож» для аудио/видео (плеер, кодировщик, декодер, конвертер). Его используют, чтобы одинаково и воспроизводимо добавлять шум/сжимать видео для тестов.
Данные. Берут 91 701 «септуплет» (последовательности из 7 кадров) из 38 990 видеоклипов. Септуплеты нужны, чтобы методы могли использовать временной контекст (до/после).
Задача denoising (удаление шума).
Генерируют две версии испорченного видео:
Задача deblocking / deartifacting (удаление артефактов сжатия).
Исходные кадры сжимают в FFmpeg с кодеком JPEG2000 (формат J2K) и тремя степенями деградации q = {20, 40, 60}. Большие значения q в таком контексте обычно означают более сильное «урезание» деталей (меньше бит, больше артефактов).
Примечание: JPEG2000 — вейвлет-кодек, у него не классические «квадратики» как у JPEG/H.264, но при сильном квантовании появляются размытость и «звон» (ringing); в литературе это всё часто объединяют под «deblocking/deartifacting».
Конкретное имя параметра качества (например,bash# Преобразовать видео в последовательность кадров ffmpeg -i input.mp4 frames/%06d.png # Сжать каждый кадр в J2K с «уровнем» q (пример флага, названия могут отличаться по сборке) ffmpeg -i frames/%06d.png -c:v jpeg2000 -q:v 40 j2k/%06d.j2k
-q:v, -qscale:v или профиль) зависит от сборки FFmpeg/энкодера JPEG2000; идея в том, что вы получаете три набора с разной степенью артефактов (q=20/40/60).Если нужно, могу накидать небольшой скрипт генерации шума/сохранения последовательностей и сравнить PSNR/SSIM — скажите в каком формате у вас данные.