Prehľad zvukových kodekov a formátov

Ako koncový používateľ poznáte jeden typ programu: programy na prehrávanie (alebo „prehrávače“). Prehrávajú zvukové alebo obrazové súbory, a preto sú softvérovým ekvivalentom kazetových prehrávačov, videorekordérov alebo zariadení na prehrávanie diskov CD/DVD. Rozhranie programu je väčšinou podobné diaľkovému ovládaniu stereofónneho systému: sú tu tlačidlá na prehrávanie, rýchle pretáčanie dopredu, dozadu, pozastavenie atď. Známi zástupcovia sú napr. B. Windows Media Player, Quicktime Player alebo Apple iTunes. Namiesto vloženia CD do zásuvky na CD musia byť súbory otvorené v softvérových prehrávačoch. Prehrávač môže zvukové a obrazové súbory otvoriť, iba ak dokáže niečo s použitým formátom súboru.
Digitálne údaje, ktorými sú analógové zvukové alebo obrazové signály reprezentované, môžu byť usporiadané v rôznych formátoch. Najlepším spôsobom, ako to vysvetliť, je jediný obrázok: Existujú rôzne možnosti ukladania jednotlivých pixelov do súboru. Napríklad to, či sú obrazové body ukladané jeden po druhom zľava doprava alebo najskôr zhora nadol v súbore, je samozrejme konvencia, ktorú treba určiť. Musí byť tiež jasne definovaný spôsob ukladania farebnej hodnoty. Tieto a mnohé ďalšie definície sú určené špecifikáciou, ktorá sa potom implementuje v príslušnom formáte súboru. Pri ukladaní údajov sa vždy dodržiava preddefinované pravidlo kódovania, ktoré je v konečnom dôsledku rozhodujúce pre zaistenie správnej interpretácie údajov. Jednotlivé formáty si môžete predstaviť ako rôzne dátové nosiče: CD, veľké a malé videokazety, zvukové pásky atď. Môžu všetky obsahovať zvukové dáta - stále však nemôžete vložiť kazetu do prehrávača CD. Formáty súborov WAV, MP4, WMA alebo MP3 sú rovnako odlišné.
Veľa formátov súborov je v skutočnosti Formáty kontajnerov. Tento pojem má objasniť, že v rámci dohovoru je možné použiť rôzne formáty. Napríklad súbor MP4 môže obsahovať rôzne zvukové a obrazové formáty, ktoré sa môžu súčasne zobraziť v rovnakom súbore.
Ak chcete do súborov uložiť rôzne formáty, potrebujete kontajner. Kontajnery prenášajú zvukový materiál do súborov s príponami ako „.mp3“, „.wav“, „.m4a“, „.ogg“ alebo „.wma“ a poskytujú mu metadáta. Tu je niekoľko dôležitých kontajnerov na ukladanie zvukových súborov:
MÁVAŤ
Kontajner s koncovkou „.wav“ zvyčajne obsahuje nekomprimované digitálne údaje, ktoré boli kódované metódou PCM. Ak ich chcete neskôr spracovať (vystrihnúť, upraviť), použite súbory WAVE.
MP3
Kontejner MP3 (.mp3) sa používa na záznam dátových tokov zvukovej vrstvy 3 MPEG-1 alebo zvukovej vrstvy MPEG-2. Hovorovo sa tieto dátové toky nazývajú aj MP3.
MP4/M4A
Kontajner MP4 je odvodený od formátu súboru Apple Quicktime. Na rozdiel od súborov MP3 alebo WAVE, kde si môžete byť relatívne istí, aký druh údajov sa v súboroch skrýva, môžete len ťažko vyvodiť akékoľvek závery o kodekoch použitých so súbormi MP4. Súbory MP4 môžu obsahovať rôzne video a zvukové formáty, obrázky a dokonca aj grafiku a text. Preto sa odporúča používať v audio sektore príponu súboru „.m4a“ a používať iba metódu kódovania AAC.
OGG/OGA
Kontajner OGG je voľný formát pre multimediálny obsah, ktorý nie je obmedzený softvérovými patentmi. Rovnako ako v prípade MP4, prípona súboru neuvádza, akým spôsobom boli v nej obsiahnuté údaje zakódované. V audio sektore sa na kódovanie zvyčajne používa zvukový kodek Vorbis a prípona súboru „.oga“.
ASF/WMA
Okrem bezplatného formátu OGG a MP4 od spoločnosti Apple určil Microsoft aj formát kontajnera pre multimediálne súbory. Súbory ASF môžu obsahovať aj metadáta, zvukové a obrazové stopy. Pre lepšiu diferenciáciu sú súbory, ktoré obsahujú zvukové dáta, označené rovnakou značkou s koncovkou „.wma“.
Podľa toho, či chcete zvukový súbor napáliť na disk CD, sprístupniť ho na internete alebo upraviť pomocou zvukového editora, sú možné rôzne zvukové formáty. Kodeky sú zodpovedné za konverziu za do rôznych formátov:
PCM (modulácia pulzného kódu)
Pulzná kódová modulácia je metóda kódovania, pri ktorej je možné digitalizovať analógový signál takmer bez strát. Takto zakódovaný zvukový materiál je ideálne vhodný na ďalšie spracovanie, pretože je nekomprimovaný. Dáta generované touto metódou sa zvyčajne ukladajú ako vlnové súbory s príponou „.wav“.
MP3 (zvuková vrstva MPEG-1 3)
Proces kódovania sa v skutočnosti nazýva MPEG-1 Audio Layer 3 alebo MPEG-2 Audio Layer 3 a vyvinul ho Fraunhoferov inštitút pre integrované obvody. Názov je odvodený z príslušnej prípony súboru MP3 vo formáte. Je to jedna z prvých stratových kompresných metód, ktoré sa pri znižovaní množstva údajov spoliehajú na psychoakustické účinky pri vnímaní. Okrem pôvodného kodeku od Fraunhoferovho inštitútu existuje aj otvorený zdrojový kódovač LAME. Súbory, ktoré obsahujú dátové toky kódované týmto spôsobom, sa zvyčajne končia príponou „.mp3“. Existujú aj ďalšie formáty kontajnerov, ktoré môžu obsahovať dátové toky MP3, napríklad AVI alebo MP4.
AAC (Advanced Audio Coding)
AAC je stratová metóda kódovania, ktorá umožňuje komprimovať zvukové údaje (z CD) na šestnástinu ich pôvodnej veľkosti. V porovnaní s MP3 môže proces preukázať väčšiu kompresiu a lepšiu kvalitu zvuku. Preto sa na tento formát spoliehajú rôzne hudobné obchody online a rozhlasové stanice online. MP4 je určený ako formát kontajnera na ukladanie komprimovaných zvukových signálov. Súbory, ktoré obsahujú takúto zvukovú stopu, sa zvyčajne končia príponou „.mp4“ alebo „.m4a“.
Vorbis
Tento formát otvoreného zdroja nie je patentovaný, a preto ho môžu vývojári softvéru používať bez licenčných poplatkov. Formát je vhodný aj na streamovanie prenosov. Kompresia je stratová a lepšia ako MP3. Aj keď teraz tento formát podporuje množstvo hardvérových prehrávacích zariadení, nie je tak rozšírený ako MP3. Dátový tok je zvyčajne zabudovaný do kontajnera OGG. Priradené súbory končia príponou .ogg alebo .oga.
WMA (Windows Media Audio)
WMA je metóda kódovania vyvinutá spoločnosťou Microsoft a ponúka tiež stratovú kompresiu. Mnoho hardvérových prehrávacích zariadení teraz podporuje tento formát, pretože je v hudobnom priemysle veľmi populárny vďaka svojej vstavanej ochrane proti kopírovaniu (Digital Rights Management (DRM)). Ak súbor obsahuje iba zvukové údaje, končí sa príponou „.wma“. Ako formát kontajnera sa používa ASF.
Ak si chcete byť istí, že je možné prehrať všetky mediálne súbory, mali by ste mať pre svoj prehrávač pripravených čo najviac kodekov. Väčšina kodekov - alebo aspoň dekodérov - je našťastie k dispozícii zadarmo. Súčasné prehrávače médií zvyčajne prinášajú požadované kodeky. Pomáha vždy vyhľadať a nainštalovať najnovší kodek na internete, pretože tie sú zvyčajne spätne kompatibilné, t. J. Môžu interpretovať aj staršie formáty.
Všetky formáty majú spoločné to, že zvukové a obrazové údaje sa do súborov zapisujú v komprimovanej podobe. Množstvo dát, ktoré vzniká, je veľmi veľké, preto sa kodeky snažia pri kódovaní znížiť množstvo dát. Kodek vytvoreného slova sa preto často používa ako krátka forma pre kompresor/dekompresor. Metódy kompresie údajov sú veľmi rozmanité. Všeobecne sa rozlišuje medzi bezstratovou a stratovou kompresiou.

Bezstratová kompresia
Pri bezstratovej kompresii sa pôvodné údaje zachovajú, zapíšu sa do súboru iba kompaktnejšie. Napríklad v prípade obrázkov je možné namiesto uloženia jednotlivých pixelov do súboru zohľadniť iba zmeny. Ak je napríklad zobrazené modré more, súbor nemusí obsahovať „modro-modro-modrý. -modrá-modrá, ale postačuje údaj „123 modrých pixelov“ - informačný obsah sa nemení. Aj pri videodátach sa často neukladajú jednotlivé obrázky, iba rozdiely medzi nimi. Pokiaľ teda fotoaparát zobrazuje na pár sekúnd nehybnú krajinu, potom je potrebné tento obrázok na šírku zapísať do súboru iba raz. V prípade zvukových údajov možno podobnosti medzi rôznymi kanálmi (ľavý a pravý stereofónny kanál sú často identické) použiť na kompaktnejšie uloženie údajov. Vo všetkých troch príkladoch sú nevyhnutnými predpokladmi pre kompresiu údajov rovnaké alebo iba malé zmeny. Pretože tieto podobnosti nie sú vždy obsiahnuté vo zvukových a obrazových dátach, bezstratová kompresia nie je taká účinná ako stratová kompresia.

Stratová kompresia pomocou kodeku AAC podľa štandardu MPEG-4 do formátu MP4/M4a.