Демистифициране на аудио при заснемане на видео и стрийминг на събития на живо

Като хора от AV, ние постоянно говорим за аудио кодиране и кодеци, но какво точно представлява аудио кодекът? Аудио кодекът по същество е устройство или алгоритъм, способен да кодира и декодира цифров аудио поток.

видео

На практика звуковите вълни под налягане, които се предават по въздуха до ушите ни, са непрекъснати, аналогови сигнали. Сигналите се пренасят в цифровия свят от устройство, наречено аналогово-цифров преобразувател (ADC), и обратно, за наше удоволствие, от цифрово-аналогов преобразувател (ЦАП). Кодекът се намира между тези две функции и именно тук могат да бъдат коригирани редица важни опции за успешно заснемане, поточно предаване и запис на качествено аудио: кодек алгоритъм, на честота на извадката, на битова дълбочина и битрейт.

Аудио кодеци

Трите най-често срещани аудио кодека са: Модулация с импулсен код (PCM), MP3, и усъвършенствано аудио кодиране (AAC). Избраният кодек определя компресията и качеството на записа.

PCM е кодек, използван в компютри, компакт-дискове, цифрови телефони и необичайно използваните супер-аудио дискове. Изходният сигнал за PCM се взема на равни интервали и всяка проба представлява амплитудата на аналоговата форма на вълната като цифрова стойност. PCM е най-основната форма на кодиране и обикновено е само суровият изход от процеса на аналогово-цифрово преобразуване.

Като се имат предвид правилните параметри, тази дигитализирана форма на вълната може да бъде перфектно реконструирана обратно в аналогова в далечния край, следователно е „без загуби“. Този кодек без загуби осигурява висока точност на оригиналния звук, но за съжаление не е много икономичен и води до много големи файлове, които не са изпълними за предаване на живо. Препоръчвам да използвате PCM, когато записвате цифрови ISO за вашите източници или когато правите тежка аудио постпродукция.

За щастие имаме избор от няколко други алгоритми за кодеци, които могат да компресират цифровите данни (в сравнение с PCM), използвайки някои умни наблюдения за това как се държат аудиоформите. Компромисът е, че тези алгоритми се считат за „загубени“, тъй като не е възможно да се възстанови перфектно оригиналния сигнал, но резултатите все още са достатъчно добри, така че повечето хора да не могат да различат разликата.

MP3 е формат за аудио кодиране, използващ алгоритъм със загуби, който компресира същия вид извадка от цифрова информация в много по-малък файл. MP3 е най-често използваният кодек, когато се отнася до потребителски аудио за музика и съхранение. Препоръчвам да използвате MP3 само за поточно съдържание, тъй като използва по-малка честотна лента.

AAC е по-нов стандарт за цифрово аудио кодиране със загуби. Той е проектиран да бъде наследник на MP3 компресия. AAC се превърна в стандарт за спецификации MPEG-2 и MPEG-4. По същество това е компресионен кодек, който осигурява по-добро качество на звука от MP3, като същевременно поддържа подобни битрейтове. Препоръчвам да използвате този кодек при поточно предаване на живо.

Честоти на проби (kHz)

Честотата на дискретизация е броят пъти, когато се прави проба от аудио в секунда. Честотите на вземане на проби се измерват в Hertz (Hz) или Kilohertz (kHz,) един kHz, равен на 1000 Hz. Като пример, 44 100 проби в секунда могат да бъдат представени като 44 100 Hz или 44,1 kHz. Избраната честота на вземане на проби ще определи максималната честота, която може да бъде възпроизведена, а шведски инженер на име Nyquist показа в началото на 1900 г., че честотата на вземане на проби трябва да бъде приблизително двойно най-високата честота, за да свърши работата.

Като пример, средното човешко ухо може да интерпретира честоти между 20 Hz и 20 kHz. Използвайки този диапазон на човешкия слух и таблицата по-долу, можем да видим защо 44,1 kHz е избрана като честота на дискретизация за аудио компактдискове и все още се счита за много добра скорост за възпроизвеждане на изходния материал.

По-долу има справка, показваща максималната честота на дадени честоти на пробата:

Има редица причини да изберете по-висока честота на вземане на проби, въпреки че бихте си помислили, че би било загуба да се възпроизвеждат честоти над обхвата на човешкия слух. Но средният слушател ще счита, че 44,1 - 48 kHz са повече от достатъчно добри за повечето цели.

Дълбочина на бита

Наред с честотата на вземане на проби, има и малко дълбочина, която трябва да се вземе предвид. Дълбочината на битовете е броят на цифровите битове информация, използвани за кодиране на всяка проба. С прости думи, дълбочината на битовете измерва „прецизността“. Колкото по-голяма е битовата дълбочина, толкова по-точно сигнал може да съобщи амплитудата на действителния аналогов източник на звук. С възможно най-ниската битова дълбочина имаме само два варианта за измерване на прецизността на звука: 0 за пълна тишина и 1 за пълна сила на звука. Колкото по-висока е битовата дълбочина, толкова по-голяма е прецизността на кодирания им звук. Като пример: Аудиото с качество на CD е стандартен 16-битов, който дава 216 (или 65 536) обема за избор.

Дълбочината на битовете е фиксирана за PCM кодиране, но за кодеци за компресиране със загуба (като MP3 и AAC) тя се изчислява по време на кодирането и може да варира от проба до проба.

Битрейт

Битрейт е броят на битовете, които се обработват или предават за единица време. Обикновено това се изразява като брой битове (или килобита) в секунда (често kbps или kbits/секунда). За линейния PCM, скоростта на предаване е просто изчисление.

битрейт = честота на дискретизация × битова дълбочина × канали

За системи като Pearl, които кодират линеен PCM при 16-битова (битова дълбочина 16), това изчисление може да се използва, за да се определи колко допълнителна честотна лента е необходима за PCM аудио. Например за стерео (двуканален) сигнал, дискретизиран при 44,1 kHz в 16 бита, скоростта на предаване се изчислява, както следва (не забравяйте, че 1 Hz е 1/секунда, така че единиците завършват като kbits в секунда).

44,1 kHz × 16 бита × 2 = 1,411,2 kbits/секунда

Междувременно механизмите за компресиране на аудио със загуби, като AAC и MP3, имат по-малко битове за прехвърляне (това е цялата им цел), така че те използват много по-малки битрейтове. Обикновено те използват стойности от 96 kbps до 320 kbps. За тези кодеци, колкото по-висока битрейт изберете, толкова повече място ще имате за аудио битове на взета проба, така че по-доброто качество ще чуете в аудио кодирането си.

Аудио примерни кодеци, честота на дискретизация и битрейт в реалния свят

Аудио компактдисковете, един от първите популярни потребителски механизми за съхраняване на цифрово аудио, използват честота на дискретизация от 44,1 kHz (20 Hz - 20 kHz, обхват на човешкия слух) и битова дълбочина от 16 бита. Стойностите бяха избрани, за да могат да получат възможно най-много аудио на компактдиска, като същевременно запазват добра аудио верност.

Когато видеото беше добавено към аудио чрез DVD и по-късно Blu-Ray дискове, беше създаден нов стандарт. DVD и Blu-Rays обикновено използват линеен PCM формат с честота на дискретизация от 48 kHz (стерео) или 96 kHz (5.1 съраунд звук) и битова дълбочина 24. Тези стойности са избрани като идеален избор за поддържане на синхронизирането на звука с видео и да получите възможно най-доброто качество, използвайки допълнителното дисково пространство, налично в тези носители.

Моите препоръки

С аудио CD, DVD и Blu-Ray целта е да ви представим висококачествена програма по фиксиран начин за повторно възпроизвеждане. Целта на опита е да осигури висококачествено аудио (и видео), без много да се тревожи за размера на получената медия (стига да се побере на диска). Тези формати използват Linear PCM поради качеството, което предоставя.

За разлика от тях, мобилните медии и поточните медии имат различна цел - да използват възможно най-ниска скорост на предаване, като същевременно поддържат звук, който е достатъчно „добър“ за слушателя. За това приложение алгоритмите с компресия са по-добър избор.

Можете да използвате същите принципи в собствените си записи.

Когато записвате аудио с вашето видео ...

Когато е възможно, за a запис, който ще се използва за постпродукция или като ISO на вашата програма, използвайте PCM кодиране с честота на дискретизация 48 kHz и възможно най-голямата битова дълбочина (16 или 24), за да постигнете най-доброто качество на звука. В случая с Pearl препоръчвам PCM кодиране с 48 kHz, за да се постигне най-високо качество на звука.