Урок "Кодирование звуковой информации"

 

Аналоговый и дискретный способы представления звука   

Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме.

      При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно.

     При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.

Аналоговое и дискретное кодирование

Примером аналогового хранения звуковой информации является виниловая пластин­ка (звуковая дорожка изменяет свою форму непрерывно), а дискретного — аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью).

 

 

 Восприятие звука человеком 

 

Звуковые волны улавливаются слуховым органом и вызывают в нем раздражение, которое передается по нервной системе в головной мозг, создавая ощущение звука.

Колебания барабанной перепонки в свою очередь передаются во внутреннее ухо и раздражают слуховой нерв. Так образом человек воспринимает звук.

 

       В аналоговой форме звук представляет собой волну, которая характеризуется:
  • Высота звука определяется частотой колебаний вибрирующего тела.
  • Громкость звука определяется энергией колебательных движений, то есть амплитудой колебаний. 
  • Длительность звука - продолжительность колебаний.
  • Тембром звука называется окраска звука.

 

Герц (Гц или Hz) — единица измерения частоты колебаний.  1 Гц= 1/с

  Человеческое ухо может воспринимать звук с частотой от 20 колебаний в секунду (20 Герц, низкий звук) до 20 000 колебаний в секунду (20 КГц, высокий звук).
 

- аналоговый - непрерывный - звук

 

 

     Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой.

     Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон.

 

 

 

 

 Кодирование звуковой информации 

 

Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

 

 

 

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Т.о. при двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала.

 

 

 

Рис. Временная дискретизация звука

Таким образом, непрерывная зависимость амплитуды сигнала от времени А(t) заменяется на дискретную последовательность уровней громкости.

 

На графике это выглядит как замена гладкой кривой на последовательность «ступенек»:

 

 

 Каждой «ступеньке» присваивается значение уровня громкости звука, его код (1, 2, 3 и так далее).

 

        Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

 

Преобразование аналоговой формы представления звука в дискретную происходит в процессе аналогово-цифрового преобразования (АЦП).

 

 

Преобразование дискретной формы представления звука в аналоговую происходит в процессе цифро-аналогового преобразования (ЦАП)

 

 

Качество кодирования звуковой информации зависит от:

 

1) частотой дискретизации, т.е. количества измерений уровня сигнала в единицу времени. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

 

2) глубиной кодирования, т.е. количества уровней сигнала.

 

 

Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:  N = 2i = 216 = 65536,   где  i — глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.

 

 

Количество измерений в секунду может лежать в диапазоне от 8000 до 48 000, то есть частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц. При частоте 8 кГц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц — качеству звучания аудио-СD. Следует также учитывать, что возможны как моно-, так и стерео-режимы.

 

 

 

     ЗАДАЧА 1.

Можно оценить информационный объем стереоаудиофайла длительностью звучания 1 секунда при высоком качестве звука (16 битов, 48 кГц). Для этого количество битов, приходящихся на одну выборку, необходимо умножить на количество выборок в 1 секунду и умножить на 2 (стерео):

Решение:  16 бит • 48 000 • 2 = 1 536 000 бит = 192 000 байт = 187,5 Кбайт.

 

ЗАДАЧА 2.

Оценить информационный объем цифрового стерео звукового файла длительностью звучания 1 минута при среднем качестве звука (16 битов, 24  кГц).

     Решение: 16 бит × 24 000 × 2 × 60 = 46 080 000 бит = 5 760 000 байт = 5 625 Кбайт ≈ 5,5 Мбайт
 

 

 

 

 

Стандартное приложение Звукозапись играет роль цифрового магнитофона и позволяет записывать звук, то есть дискретизировать звуковые сигналы, и сохранять их в звуковых файлах в формате WАV. Эта программа позволяет редактировать звуковые файлы, микшировать их (накладывать друг на друга), а также воспроизводить.

 

 

     Качество двоичного кодирования изображения или звука определяется частотой дискретизации и глубиной кодирования.

 Домашнее задание - решить задачи:

1.Определить количество уровней сигнала 24-битной звуковой карты .
 
2.Уместиться ли песня на дискету размером 1,44 Мбайта, если она имеет следующие параметры: стерео длительностью звучания 3 минуты при качестве звука - 16 битов, 16  кГц.