Jak vytvořit vlastní MP3 - MP3 kódování

Po článcích zaměřených na ukládání hudebních nahrávek do počítače se zaměříme na vlastní proces kódování MP3 souborů.
V počítači máme uložený digitalizovaný zvuk (hudbu) ve formě souborů WAV, které jsme získali digitalizací z analogových zdrojů zvukového signálu (nahráním zvuku do počítače) nebo digitální extrakcí ze zvukových CD. Nyní můžeme přikročit k vrcholné fázi tvorby MP3 - k MP3 kódování. Komprimaci zvukových souborů provádí zvláštní program označovaný jako kodér (encoder). Existují i hardwarové kodéry, se kterými se však pravděpodobně nesetkáte. Standardním zařízením pro tvorbu MP3 zůstává počítač vybavený softwarovým kodérem. Na kvalitě programu závisí kvalita výsledných MP3 souborů. Je nutno upozornit, že dostatečnou kvalitou se musí vyznačovat původní záznam uložený v souborech WAV. Z nekvalitních nahrávek těžko vytvoříte kvalitní hudební soubor formátu MP3.

MP3 kodérů existuje celá řada. Jejich jádro (kodek, čili algoritmus podle něhož se soubory kódují a dekódují) většinou vychází z volně využitelných zdrojových kódů schváleného mezinárodního standardu ISO. Za nejkvalitnější bývá považován kodek vyvinutý Fraunhoferovým institutem (FIIS) a programy od něj odvozené.

Zmíníme se o několika nejpoužívanějších kodérech:
MP3Enc v.3.1 je program Fraunhoferova institutu, který vznikl jako nástupce původního kodéru pro MS-DOS (L3enc 2.72). Jeho demo si můžete na stránkách institutu stáhnout. Demo verze je omezena na třicet sekund zvukových dat. V plné verzi je obsažen i program na zpětné dekódování MP3 do WAV souborů. Kodér umožňuje vytvářet soubory až do datového toku 256 kbit/s. Příkazy se zadávají pro dnešního uživatele velmi nepohodlně a komplikovaně z příkazové řádky. Proto vznikly programy fungující jako tzv. front-end, který tvoří rozhraní pro jednoduché ovládání kodéru ve Windows. Řada grabberů, jako např. Audiograbber, umožňuje přímo převádět extrahované WAV soubory do MP3 prostřednictvím tohoto externího kodéru.

.mp3 Producer 2.0 firmy Opticom je jedním z programů, které vycházejí z kodeku FIIS. Vytvořené soubory mohou mít datový tok v rozmezí 8-256 kbit/s. Ovládání je velice prosté, pro větší množství souborů je nutné použít příkazové dávky (batch). K programu neexistuje demo.

.mp3 Producer

Nejlepším programem na základě kodeku FIIS je Audioactive Production Studio 1.54e firmy Telos. Ke stažení je k dispozici Lite demo verze s omezenou kvalitou kódování. Kodér umožňuje lehké řazení souborů určených ke komprimaci.

Audioactive Production Studio

Kodek od FIIS využívá také jeden z nejoblíbenějších programů kategorie "All in one" MusicMatch Jukebox. Kromě kódování dokáže i grabovat a zároveň funguje jako multimediální přehrávač.

AudioCatalyst 2.1 je program, který kombinuje CD grabber s kodérem firmy Xing Technology. Na jetích stránkách je možné stáhnout demo. Xing MP3 Encoder využívá vlastní velmi rychlý kodek a zavedl možnost kódování s proměnným datovým tokem (VBR).

AudioCatalyst

BladeEnc 0.92 je nejznámějším freewarovým kodérem. Bývá často součástí jiných programů pro tvorbu MP3. Ovládá se z příkazové řádky podobně jako MP3Enc. Je možno vytvářet soubory v rozmezí 32 až 320 kbit/s. MP3 s běžným datovým tokem 128 kbit/s lze vytvořit jednoduše (bez zadání parametrů) přetáhnutím souboru WAV na ikonu kodéru. Pro jednodušší práci opět existují front-end programy (např. Razor Blade).

Razor Blade FrontEnd

LAME 3.62 je kódovací program, který si poslední dobou získal značnou oblibu. Používá vlastní psychoakustický model kódování (Gpsycho). Umožňuje kódovat v rozmezí 32-320 kbit/s a pracuje i s proměnným datovým tokem. Program se ovládá z příkazové řádky.

LAME

Při výběru programu samozřejmě berte v úvahu kromě maximální kvality i další kritéria. Pokud dáváte přednost rychlé práci, je nejlepším programem Xing MP3 Encoder (resp. AudioCatalyst). Programy, které spojují kvalitní kodek FIIS s praktickým ovládáním jsou Audioactive Production Studio a MusicMatch Jukebox. Pokud nechcete vydávat za programy žádné peníze, vyzkoušejte BladeEnc či LAME.

Ve všech kodérech narazíte na množství parametrů, jež je možné nastavit. Věnujte jim pozornost, protože mohou značně ovlivnit kvalitu kódování.

  • Bitrate (rychlost datového toku) je základní parametr ovlivňující výslednou zvukovou kvalitu MP3 souboru. Obecně platí, že čím vyšší je rychlost dat, tím je soubor kvalitnější, ale také větší. V předchozích částech seriálu o základních otázkách práce s MP3 jsme již zmínili, že obecně přijatou hodnotou považovanou za kvalitu blížící se kvalitě CD je rychlost datového toku 128 kbit/s. Tato hodnota odpovídá kompresnímu poměru 1:12 a je tak komprimována většina souborů s nimiž se setkáváme např. na Internetu. Změna této hodnoty závisí na individuálních potřebách každého, kdo se zabývá tvorbou a poslechem MP3. Vyšší hodnoty (160, 192 kbit/s) použijeme v případě, že zkreslení je u 128 kbit/s stále značné a posluchači vadí. Typickým příkladem jsou nahrávky klasické hudby. S 256 kbit/s již nikdo rozdíl proti původní nahrávce nepozná, ale kompresní poměr již není tak výhodný. Pokud se jedná nahrávky méně kvalitní nebo méně náročné (mluvené slovo) můžeme použít nižší bitrate a ušetřit tak místo na disku. Kodéry podporují datový tok v různém rozmezí (8 až 256, resp. až 320 kbit/s).

    Xing - bitrate

  • VBR (Variable Bit Rate) - proměnný datový tok, který se prosadil poslední dobou zásluhou firmy Xing. Na rozdíl od stálého datového toku se hodnota mění s průběhem signálu v závislosti na zvukové obtížnosti. V kritických částech se zvyšuje, aby bylo dosaženo maximální kvality, v nenáročných klesá, aby bylo dosaženo co nejmenší velikosti souboru. VBR podporují jen některé kodéry (samozřejmě Xing MP3 encoder). Nastavuje se v rozmezí nízká, normální, vysoká. Nastavení "normal" odpovídá kvalitě 128 kbit/s a výsledné soubory jsou o něco menší.

    Xing - VBR

  • Samplerate (kmitočet vzorkování) umožňuje změnit frekvenci vzorkování zvukových dat na kvalitu odpovídající proudu dat tvořených kodérem. Pokud chcete zachovat kvalitu blížící se CD musíte zachovat vzorkování 44.1 kHz. Jinak získáte menší, ale méně kvalitní soubor. Některé kodéry k nižší bitrate přiřazují automaticky nižší samplerate.

  • HQ (High Quality) - pokud kodér umožňuje tuto volbu, je lepší ji vždy používat. Kódování s "vysokou kvalitou" je pomalejší, ale kvalita vytvořených souborů je znatelně vyšší.

  • Stereo mód - kodéry rozeznávají několik druhů kódování stereo signálu. V nastavení stereo je lepší ponechat výchozí nastavení odpovídající různým bitrate. Pro datový tok do rychlosti 192 kbit/s se používá Joint-stereo, pro vyšší normální stereo. Joint stereo využívá podobností mezi oběma kanály a vytváří součtový (mid) kanál a rozdílový (side) kanál. Dosahuje vyšší kvality zvuku s určitou ztrátou sterea. Stereo mód korelací mezi kanály nevyužívá, ale může přidat jednomu kanálu více bitů než druhému (např. když je v jednom kanálu ticho. Dual channel (též dual mono) vytváří dva nezávislé kanály. Mono nahrávkám je samozřejmě zbytečné přiřazovat jakýkoliv druh sterea.

Pokud máme hodnoty nastavené, můžeme spustit kódování vybraných WAV souborů. Zvláště při větším množství souborů jde o časové náročnou činnost. Rychlost kódování závisí na použitém programu, nastavené kvalitě souborů, rychlosti procesoru a zatížení počítače současným během dalších programů. Přejeme vám hodně kvalitních vlastnoručně vytvořených "empétrojek".