Звук. Дискретизация, сэмплирование, битрейт аудио. Аудиформаты без сжатия



Скачать 25.59 Kb.
страница1/2
Дата29.03.2018
Размер25.59 Kb.
  1   2

Звук. Дискретизация, сэмплирование, битрейт аудио. Аудиформаты без сжатия

Звук


Для большинства из нас звук является привычным явлением, мы постоянно его слышим. Однако, если попытаться дать точное определение звуку, то быстро выясниться, что сделать это можно с двух различных точек зрения.

Интуитивное определение: звук, это ощущения, воспринимаемые нашим ухом и интерпретируемые мозгом определенным образом.

Научное определение: звук это колебание среды. Он распространяется в среде с помощью волн давления посредством колебания атомов и молекул.

Звук можно считать волной, даже если ее частота может все время меняться. Эта волна является продольной; в ней направление возмущения совпадает с направлением распространения волны.

Как и любая волна, звук имеет три важных атрибута, а именно, скорость, амплитуду и период. Частота волны не является независимым атрибутом, она равна числу периодов волны за единицу времени (одну секунду). Единицей частоты служит герц (Гц). Скорость звука зависит от свойств среды, в которой он распространяется, а также от температуры. Скорость звука в сухом воздухе при 20 °C равен 343 м / с. Также чем выше температура звук распространяется быстрее. И чем выше от поверхности земли, тем распространение медленнее.

Человеческое ухо способно воспринимать звук в широком диапазоне частот, обычно, от 20 Гц до 22000 Гц, что зависит от возраста и состояния здоровья человека. Это, так называемый, диапазон слышимых частот. Колебания большей частоты называют ультразвуком, меньшей — инфразвуком.

Амплитуда звука также важна. Мы воспринимаем ее как громкость. Мы слышим звук, когда молекулы начинают ударять по барабанным перепонкам в ушах и оказывают на них определенное давление. Молекулы перемещаются вперед-назад на крошечное расстояние, которое соотносится с амплитудой.

Логарифм амплитуды измеряется в децибелах (дБ). Децибел — это относительная величина, показывающая насколько увеличилась или уменьшилась громкость звука.

Чувствительность уха человека к уровню звука зависит от его частоты. Из опытов известно, что люди более чувствительны к звукам высокой частоты (поэтому сирена воет высокими тонами).

Дискретизация и квантование

Преобразование аналогового сигнала в цифровой состоит из двух этапов: дискретизации по времени и квантования по амплитуде.

Квантова́ние — разбиение диапазона значений временных отсчётов сигнала на конечное число уровней и округление каждого отсчёта до одного из двух ближайших к нему уровней. При этом значение сигнала может округляться либо до ближайшего уровня, либо до меньшего или большего из ближайших уровней в зависимости от способа кодирования.

Дискретизация по времени означает, что сигнал представляется рядом отсчетов (сэмплов), взятых через равные промежутки времени. Основной вопрос на первом этапе преобразования аналогового сигнала в цифровой (оцифровки) состоит в выборе частоты дискретизации аналогового сигнала. Чем больше частота, тем точнее соответствует цифровой сигнал аналоговому.

Дискретизация - преобразование непрерывной функции в дискретную (прерывную).

Также стоит сказать про частоту дискретизации — частота взятия отсчётов непрерывного по времени сигнала при его дискретизации. Чем выше частота дискретизации, тем более широкий спектр сигнала может быть представлен в дискретном сигнале.

Не следует путать квантование с дискретизацией (и, соответственно, шаг квантования с частотой дискретизации). При дискретизации изменяющаяся во времени величина (сигнал) замеряется с заданной частотой (частотой дискретизации), таким образом, дискретизация разбивает сигнал по временной составляющей (на графике — по горизонтали). Квантование же приводит сигнал к заданным значениям, то есть округляет сигнал до ближайшего уровня (на графике — по вертикали). В АЦП округление может производится до ближайшего меньшего уровня. Сигнал, к которому применены дискретизация и квантование, называется цифровым.

При оцифровке сигнала количество битов, кодирующих один уровень квантования, называют глубиной квантования или разрядностью. Чем больше глубина квантования и чем больше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому.

Оцифрованный звук и сэмплирование

Как уже отмечалось, любое изображение можно оцифровать разбив его на пикселы, а каждому пикселу приписать некоторое число. Точно также звук можно оцифровать, разбив его на фрагменты и присвоив им некоторые числовые значения. Если записывать звук через микрофон, то он переводится в электрический сигнал, напряжение которого непрерывно зависит от времени. Это напряжение называется аналоговым представлением звука. Оцифровка звука делается с помощью измерения напряжения сигнала во многих точках оси времени, перевода каждого измерения в числовую форму и записи полученных чисел в файл. Этот процесс называется сэмплированием или отбором фрагментов. Звуковая волна сэмплируется, а сэмплы (звуковые фрагменты) становятся оцифрованным звуком. Устройство сэмплирования звука называется аналого-цифровым преобразователем

Поскольку звуковые сэмплы являются числами, их легко редактировать. Однако, основное назначение звуковых файлов состоит в их проигрывании и в прослушивании. Это делается с помощью перевода числовых сэмплов в электрическое напряжение, которое непрерывно подается на динамики. Устройство для выполнения этой процедуры называется цифро-аналоговым преобразователем (ЦАП или DAC, digital-to-analog converter). Очевидно, более высокая скорость сэмплирования дает лучшее представление звука, но это же приводит к увеличению числа сэмплов (звуковых фрагментов) и к росту объема звукового файла. Следовательно, основная проблема сэмплирования состоит в определении оптимальной скорости отбора сэмплов.

Из рис. 6.3а видно, что может случиться, если скорость сэмплирования низка. Звуковая волна сэмплировалась четыре раза и все сэмплы оказались равными друг другу. Если проиграть эти сэмплы, то получится равномерный звук, похожий на жужжание. На рис. 6.3b показано семь сэмплов; они больше похожи на исходную волну. К сожалению, если использовать их для воспроизведения звука, то получится пунктирная волна. Их также недостаточно для точного отображения исходного звука.

Решение задачи сэмплирования состоит в отборе звуковых фрагментов со скоростью чуть выше скорости Найквиста(Согласно известной теореме Найквиста, для того, чтобы аналоговый (непрерывный по времени) сигнал можно было точно восстановить по его отсчетам, частота дискретизации должна быть как минимум вдвое больше максимальной звуковой частоты. Звуковая частота, равная половине частоты дискретизации, называется частотой Найквиста и является максимальной частотой, которую данная цифровая система может правильно сохранить и воспроизвести.), которая равна удвоенному максимуму частоты волн данного звука. Такое сэмплирование гарантирует весьма близкое восстановление звуковой волны. Это проиллюстрировано на рис. 6.3с, на котором приведены 10 отсчетов, взятых через равные интервалы времени на четырех периодах волны.

Битрейт аудио

Битре́йт — количество бит, используемых для передачи/обработки данных в единицу времени. Битрейт принято использовать при измерении эффективной скорости передачи потока данных по каналу, то есть минимального размера канала, который сможет пропустить этот поток без задержек.

Битрейт выражается битами в секунду (бит/c, bps), а также производными величинами с приставками кило- (кбит/с, kbps), мега- (Мбит/с, Mbps) и т. д.

В форматах потокового аудио (например, MP3), использующих сжатие c потерей качества, параметр «битрейт» выражает степень сжатия потока и, тем самым, определяет размер канала, для которого сжат поток данных. Чаще всего битрейт звука измеряют в килобитах в секунду.

Существует три режима сжатия потоковых данных:


  • VBR (англ. Variable bitrate) — с переменным битрейтом;

  • ABR (англ. Average bitrate) — с усреднённым битрейтом.

При постоянном битрейте для кодирования всех участков звука используется одинаковое количество бит. Но структура звука обычно различна и, например, для кодирования тишины требуется значительно меньше бит, чем для кодирования насыщенного звука. Переменный битрейт, в отличии от постояннго, автоматически подстраивает качество кодирования, в зависимости от сложности звука на тех или иных его интервалах. То есть, для участков простых с точки зрения кодирования, будет использован более низкий битрейт, а для сложных будет применяться более высокая величина. Использование переменного битрейта позволяет добиться более высокого качества звучания при меньшем размере файла.

Усреднённый битрейт является гибридом постоянного и переменного битрейтов: значение в кбит/c задаётся пользователем, а программа варьирует его в некоторых пределах. Однако, в отличие от VBR, кодек с осторожностью использует максимально и минимально возможные значения, не рискуя выйти за заданную пользователем среднюю величину. Этот метод позволяет наиболее гибко задавать скорость обработки (для аудио это может быть любым числом между 8 и 320 кбит/с, против чисел, кратных 16 в методе CBR) и с гораздо большей (по сравнению с VBR) точностью предсказывать размер выходного файла.

Аудиоформаты без сжатия

Такие форматы хранят звук без сжатия, что означает, что они являются точными копиями исходного аудио. Поскольку они несжаты, они занимают много ненужного пространства. Если вы не редактируете аудио, вам не нужно хранить аудио в этих форматах.





Поделитесь с Вашими друзьями:
  1   2


База данных защищена авторским правом ©zodorov.ru 2017
обратиться к администрации

    Главная страница