A nagy hangmítosz: miért nincs szüksége erre a 32 bites DAC-ra

Szerző: Randy Alexander
A Teremtés Dátuma: 1 Április 2021
Frissítés Dátuma: 1 Július 2024
Anonim
A nagy hangmítosz: miért nincs szüksége erre a 32 bites DAC-ra - Technológiák
A nagy hangmítosz: miért nincs szüksége erre a 32 bites DAC-ra - Technológiák

Tartalom


Mint valószínűleg észrevetted, az okostelefon-iparban egy új tendencia van, hogy a „stúdióminőségű” audio chipeket beillesztik a modern zászlóshajó okostelefonokba. Bár a 32 bites DAC (digitális-analóg konverter) 192 kHz-es audio támogatással minden bizonnyal jól néz ki a műszaki adatlapon, egyszerűen nincs haszna a hanggyűjtemények méretének növelésére.

Itt akarom megmagyarázni, hogy miért ez a bitmélység és a mintavételi arány dicsekedése az audioiparnak csak egy újabb példája, kihasználva a fogyasztói és akár az audiofil ismeretek hiányát is. Ne felejtsd el a majom sapkádat, néhány komoly technikai kérdésbe megyünk, hogy megmagyarázzuk a pro audio hangjait és bínjait. És remélhetőleg megmutatom neked is, hogy miért kellene figyelmen kívül hagyni a marketing hype nagy részét.


Hallod ezt?

Mielőtt belemerülnénk, ez az első szegmens néhány szükséges háttérinformációt nyújt a digitális hang, a bitmélység és a mintavételi sebesség két fő fogalmáról.

A mintavételi sebesség arra utal, hogy milyen gyakran fogjuk rögzíteni vagy reprodukálni egy jel amplitúdóját. Lényegében egy hullámformát apró részekre bontunk, hogy egy adott időpontban többet megtudhassunk róla. A Nyquist-tétel kijelenti, hogy a lehető legmagasabb frekvencia, amely rögzíthető vagy reprodukálható, pontosan a mintavételi frekvencia felének fele. Ezt nagyon egyszerű elképzelni, mivel a hullámforma felső és alsó részének amplitúdói szükségesek (amelyek két mintát igényelnének) annak frekvenciájának pontos megismerése érdekében.


A mintavételi sebesség (felső) növelése másodpercenként további mintákat eredményez, míg a nagyobb bitmélység (alsó) több lehetséges értéket biztosít a minta rögzítéséhez.

Az audio szempontból csak arra gondolunk, amit hallunk, és az emberek nagy többségének hallása közvetlenül a 20 kHz-es frekvencia elé kerül. Most, hogy tudjuk a Nyquist tételt, megérthetjük, hogy a 44,1 kHz és a 48 kHz miért gyakori mintavételi frekvencia, mivel alig több mint kétszerese a hallható maximális frekvenciának. A stúdióminőségű 96kHz és 192kHz szabványok elfogadása semmi köze ahhoz, hogy a magasabb frekvenciájú adatokat rögzítsék, ami értelmetlen lenne. De egy perc alatt többet belevetünk bele.

Ahogyan az amplitúdókat nézzük az idő múlásával, a bitmélység egyszerűen arra a felbontásra vagy pontok számára utal, amely rendelkezésre áll ezen amplitúdóadatok tárolására. Például a 8 bites 256 különböző pontot kínál nekünk, a 16 bites eredményt 65 534 pontra, a 32 bites adat pedig 4 294 967 294 adatpontot eredményez. Bár nyilvánvalóan, ez jelentősen megnöveli a fájlok méretét.

Lehet, hogy könnyű azonnali gondolkodni a bitmélységről az amplitúdó pontossága szempontjából, de a megértés szempontjából fontosabb fogalmak a zaj és a torzítás fogalma. Nagyon alacsony felbontással valószínűleg kimaradunk az alacsonyabb amplitúdójú információk darabból, vagy levágjuk a hullámformák tetejét, ami pontatlanságot és torzítást (kvantitatív hibákat) vezet be. Érdekes, hogy ez gyakran zajnak hangzik, ha alacsony felbontású fájlt akar lejátszani, mert hatékonyan növeljük a lehető legkisebb jel méretét, amelyet rögzíteni és reprodukálni lehet. Ez pontosan ugyanaz, mint a zajforrás hozzáadása a hullámformához. Más szavakkal: a bitmélység csökkentése szintén csökkenti a zajpadlót. Ez szintén segíthet ezen gondolkodni egy bináris mintában, ahol a legkevésbé jelentős bit a zajszint jelöli.

Ezért a nagyobb bitmélység nagyobb zajszinttel jár, de korlátozottan korlátozhatjuk, mennyire praktikus ez a valós világban. Sajnos mindenhol van háttérzaj, és nem értem a buszt, amely elhalad az utcán. A kábelektől a fejhallgatóig, az erősítő tranzisztoráig és akár a fej belsejében lévő fülig is a maximális jel-zaj arány a valós világban körülbelül 124 dB, ami körülbelül 21 bites adatot eredményez.Zsargon Buster:

DAC- A digitális-analóg átalakító digitális audio adatokat vesz, és analóg jellé alakítja, hogy fejhallgatóra vagy hangszóróra továbbítsa.

Mintavételi ráta- Hertzben (Hz) mérve ez a másodpercenként rögzített digitális adatminták száma.

SNR- A jel-zaj arány a kívánt jel és a háttérrendszer zaja közötti különbség. Digitális rendszerben ez közvetlenül kapcsolódik a bit mélységéhez.

Összehasonlításképpen, a 16 bites rögzítés 96,33dB jel / zaj arányt (a jel és a háttérzaj közötti különbséget) kínál, míg a 24 bites 144,49 dB-et kínál, amely meghaladja a hardveres rögzítés és az emberi észlelés határait. Tehát a 32 bites DAC valójában csak valaha lesz képes legfeljebb 21 bites hasznos adatot kiadni, és a többi bitet az áramkör zaja takarja el. Valójában azonban a legkedvezőtlenebb árú berendezések 100–110 dB SNR értékkel bírnak, mivel a legtöbb más áramköri elem saját zajt bocsát ki. Nyilvánvaló, hogy a 32 bites fájlok már meglehetősen redundánsnak tűnnek.

Most, hogy megértettük a digitális audio alapjait, menjünk tovább néhány technikai ponthoz.

Lépcső a menybe

A hang megértésével és téves elképzelésével kapcsolatos kérdések többsége azzal kapcsolatos, hogy az oktatási források és a vállalatok hogyan próbálják megmagyarázni az előnyöket a vizuális útmutatók használatával. Valószínűleg mind látta a hangot, mint lépcsősor sorozatát a bitmélység és téglalap alakú vonalak számára a mintavételi sebességhez. Ez természetesen nem tűnik túl jónak, ha összehasonlítjuk egy sima megjelenésű analóg hullámformával, így könnyű kivitelezni finomabb, „simább” lépcsőket, hogy pontosabb kimeneti hullámforma legyen.

Noha ez könnyen eladható a nagyközönség számára, ez a közös „lépcsőház” pontossági analógia hatalmas téves irányt mutat, és nem értékeli, hogy a digitális hang valóban hogyan működik. Ignoráld.

Ez a vizuális ábrázolás azonban hamisan mutatja be, hogyan működik az audio. Noha rendetlennek tűnik, matematikailag a Nyquist frekvencia alatti, a mintavételi gyakoriság felének megfelelő adatokat tökéletesen rögzítették és tökéletesen reprodukálhatók. Képpel ez még a Nyquist frekvencián is, amelyet gyakran négyszöghullámként, nem pedig sima szinuszhullámként ábrázolunk, pontos adatokkal rendelkezünk az amplitúdóval kapcsolatban egy adott időpontban, ami minden, amire szükségünk van. Mi, emberek, gyakran tévesen nézünk a minták közötti térre, de a digitális rendszer nem működik ugyanolyan módon.

A bitmélység gyakran kapcsolódik a pontossághoz, de valójában meghatározza a rendszer zajteljesítményét. Más szavakkal, a legkisebb detektálható vagy reprodukálható jel.

A lejátszás során ez kissé trükkösebbé válhat, mivel könnyen érthető a „zérórendű tartás” DAC-ok fogalma, amely egyszerűen átvált az értékek között egy meghatározott mintavételi gyakoriságon, és lépcsőzetes lépést eredményez. Ez valójában nem valós ábrázolása az audio DAC-ok működéséről, de amíg itt vagyunk, ezt a példát felhasználhatjuk annak bizonyítására, hogy egyébként nem kell aggódnia ezen lépcsők miatt.

Fontos tény, hogy meg kell jegyezni, hogy az összes hullámforma több szinuszos hullám, az alapvető frekvencia és a kiegészítő komponensek összegével fejezhető ki a harmonikus szorzókban. Egy háromszöghullám (vagy lépcsőfok) páratlan harmonikusokból áll, a csökkenő amplitúdó mellett. Tehát, ha sok nagyon kis lépés fordul elő mintavételi frekvenciánkkal, akkor azt mondhatjuk, hogy van még valamilyen extra harmonikus tartalom hozzáadva, de kétszeres hallható (Nyquist) frekvencián és valószínűleg néhány harmonikusnál is előfordul, tehát nyertünk egyébként nem hallhatom őket. Ezenkívül nagyon egyszerű lenne kiszűrni néhány összetevő felhasználásával.

Ha elkülönítjük a DAC mintákat, könnyen beláthatjuk, hogy a kívánt jel tökéletesen ábrázolódik, egy kiegészítő hullámformával együtt a DAC mintavételi sebességénél.

Ha ez igaz, akkor ezt gyors kísérlettel kell megfigyelnünk. Vegyünk egy kimenetet közvetlenül az alapvető nulla sorrendű hold DAC-ból, és továbbítsuk a jelet egy nagyon egyszerű 2-en keresztülnd rendeljen aluláteresztő szűrőt a mintavételi arány felére. Valójában csak egy 6 bites jelet használtam itt, csak azért, hogy valóban láthatjuk az oszcilloszkóp kimenetét. A 16 bites vagy 24 bites audiofájlok sokkal kevesebb zajt jelentenek a jelnél a szűrés előtt és után.

Meglehetősen durva példa, de ez bizonyítja azt a tényt, hogy az audioadatok tökéletesen újratervezhetők a rendetlen kinézetű lépcsőn.

És mintha varázslatos lenne, a lépcsőfok szinte teljesen eltűnt, és a kimenet „ki lett simítva”, csak egy aluláteresztő szűrő használatával, amely nem zavarja a szinuszhullámot. A valóságban minden, amit tettünk, kiszűrjük a jel azon részeit, amelyeket egyébként nem hallottál volna. Ez tényleg nem rossz eredmény egy további négy kiegészítő elem esetében, amelyek alapvetően szabadok (két kondenzátor és két ellenállás kevesebb, mint 5 pennybe kerül), de valójában vannak kifinomultabb technikák, amelyek segítségével ezt a zajt még tovább csökkenthetjük. Sőt, még ennél is jobb, hogy ezeket a legtöbb jó minőségű DAC-ban alapkivitelben szerepeltetjük.

Valósághűbb példával foglalkozva, az audio használatához használt DAC-k interpolációs szűrővel is rendelkeznek, amelyet ún. Az interpoláció egyszerűen a két minta közötti közbenső pontok kiszámításának módja, tehát a DAC valójában sokat csinál ezen a „simításon” egyedül, és még ennél is sokkal inkább, mint a mintavételi arány megduplázása vagy megnégyszerezése. Sőt, még jobb, ha az nem foglal fel semmilyen extra fájlterületet.

Az interpolációs szűrők, amelyek minden DAC-ban általában megtalálhatók, megéri a sóját, sokkal jobb megoldás, mint a magasabb mintavételi gyakoriságú fájlok körbevitele.

Az ehhez szükséges módszerek meglehetősen bonyolultak, de alapvetően a DAC sokkal gyakrabban változtatja meg a kimeneti értéket, mint az audiofájl mintavételi frekvenciája sugall. Ez a hallhatatlan lépcsőharmonikákat messze túlmutatja a mintavételi frekvencián, lehetővé téve lassabb, könnyebben elérhető szűrők használatát, amelyek kevésbé fodrozódnak, megőrizve ezáltal azokat a biteket, amelyeket valójában hallani akarunk.

Ha kíváncsi vagy arra, hogy miért akarjuk eltávolítani ezt a hallhatatlan tartalmat, az egyszerű ok az, hogy ezen extra adatok továbbadása a jel lánca mentén, mondjuk az erősítőben, energiát pazarol. Ezenkívül a rendszer többi alkatrészétől függően ez a magasabb frekvenciájú „ultrahangos” tartalom valóban nagyobb mennyiségű intermodulációs torzulást eredményezhet a korlátozott sávszélességű komponensekben. Ezért a 192 kHz-es fájlja valószínűleg több kárt okoz majd, mint ha jót tesz, ha a fájlokban valóban létezik ultrahangos tartalom.

Ha további bizonyítékokra lenne szükség, megmutatom egy kiváló minőségű DAC-kimenetet is a Circus Logic CS4272 használatával (a felső képen). A CS4272 interpolációs szekcióval és meredek beépített kimeneti szűrővel rendelkezik. Csak annyit teszünk, hogy a teszt során egy mikrovezérlőt használjunk a DAC két 16 bites magas és alacsony mintájának 48 kHz-en történő betáplálására, így a lehető legnagyobb kimeneti hullámformát kapjuk 24 kHz-en. Nincsenek más szűrőkomponensek, ez a kimenet közvetlenül a DAC-ból származik.

A stúdió minőségű DAC komponens 24 kHz-es kimenő jele (felső) minden bizonnyal nem olyan, mint a szokásos marketing anyaghoz társított téglalap alakú hullámforma. A mintavételi frekvencia (Fs) az oszcilloszkóp alján jelenik meg.

Vegye figyelembe, hogy a kimeneti szinuszhullám (felső) pontosan a frekvenciaóra (alsó) sebességének fele legyen. Nincsenek észrevehető lépcsőfokok, és ez a nagyon magas frekvenciájú hullámforma szinte tökéletes szinuszhullámnak tűnik, nem pedig olyan tömör négyzethullámnak, amit a marketing anyag, vagy akár a kimeneti adatok véletlen pillantása sugall. Ez azt mutatja, hogy még csak két mintával is a Nyquist-elmélet tökéletesen működik a gyakorlatban, és tiszta szinuszhullámot állíthatunk elő, bármiféle kiegészítő harmonikus tartalom nélkül, hatalmas bitmélység vagy mintavételezési sebesség nélkül.

Az igazság a 32 bites és 192 kHz frekvencián

Mint a legtöbb dologban, az összes zsargon és a 32 bites, 192 kHz-es hang mögött rejlik valami igazság, amely gyakorlatilag használható, csak nem a tenyerében. Ezek a digitális attribútumok valóban hasznosak, ha stúdiókörnyezetben tartózkodik, így állítások szerint „stúdióminőségű hangot hoznak mobilra”, ám ezek a szabályok egyszerűen nem vonatkoznak, ha a kész zeneszámot zsebébe akarja tenni.

Először kezdjük a mintavételi gyakorisággal. A nagyobb felbontású hangzás egyik gyakran ismert előnye az olyan ultrahangos adatok megtartása, amelyeket nem hall, de befolyásolja a zenét. Szemét, a legtöbb hangszer jóval a lehallgatás előtt esik le, a mikrofon legfeljebb 20 kHz körüli tekercselés rögzítésére szolgál, és a használt fejhallgatója semmi esetre sem fogja kiterjeszteni. Még ha meg is tudnák, a füled egyszerűen nem tudja észlelni.

A tipikus emberi hallásérzékenység 3 kHz-nél csúcspontú, és 16 kHz után gyorsan elindul.

A 192 kHz-es mintavétel azonban nagyon hasznos a zaj csökkentésekor (ez a kulcsszó ismét) az adatok mintavételekor, lehetővé teszi az alapvető bemeneti szűrők egyszerűbb felépítését, és a nagysebességű digitális hatás szempontjából is fontos. A hallható spektrum feletti túlmintavétel lehetővé teszi számunkra, hogy a jelet átlagoljuk, hogy lenyomjuk a zajpadlót. Azt tapasztalhatja, hogy a legtöbb jó ADC (analóg a digitális konverterekhez) manapság beépített 64 bites vagy annál több mintavételezéssel érkezik.

Minden ADC-nek el kell távolítania a Nyquist-határ feletti frekvenciákat, különben szörnyű hangzású álnévvel fog végezni, mivel a magasabb frekvenciákat „lehajtják” a hallható spektrumba. Ha nagyobb rés van a 20 kHz-es szűrő sarokfrekvencia és a maximális mintavételi frekvencia között, akkor jobban igazodik a valós szűrőkhöz, amelyek egyszerűen nem lehetnek olyan meredek és stabilak, mint a szükséges elméleti szűrők. Ugyanez igaz a DAC végére is, de amint az intermodulációról beszéltünk, ez a zaj nagyon hatékonyan képes magasabb frekvenciákra emelni a könnyebb szűrés érdekében.

Minél meredekebb a szűrő, annál több hulláma van a jelszalagban. A mintavételi gyakoriság növelése lehetővé teszi a „lassabb” szűrők használatát, amely elősegíti a sík frekvenciatartomány megőrzését a hallható átviteli sávban.

A digitális tartományban hasonló szabályok vonatkoznak a szűrőkre, amelyeket gyakran használnak a stúdió-keverési folyamatban. A magasabb mintavételi arány lehetővé teszi a meredekebb, gyorsabb működésű szűrőket, amelyekhez további adatokra van szükség a megfelelő működéshez. Ehhez a lejátszáshoz és a DAC-okhoz nincs szükség, mivel csak az érdekel, mi valójában hallható.

A 32 bites továbblépéshez bárki, aki valaha távoli komplex matematikát próbált kódolni, megérti a bitmélység fontosságát, mind egész szám, mind lebegőpontos adatokkal. Amint már tárgyaltuk, minél több bittel kevesebb a zaj, és ez annál fontosabb lesz, amikor a digitális tartományban kezdjük el osztani vagy kivonni a jeleket a kerekítési hibák miatt, és elkerüljük a vágási hibákat szorzás vagy összeadás során.

A további bitmélység fontos a jel integritásának megőrzése érdekében, amikor matematikai műveleteket hajtanak végre, például a stúdióban lévő audio szoftverben. De el is dobhatjuk ezeket az extra adatokat, miután a masztrálás befejeződött.

Íme egy példa, mondjuk, hogy 4 bites mintát veszünk, és jelenlegi mintánk 13, azaz bináris bináris 1101. Most próbáljuk ezt négyre osztani, és 0011-re vagy egyszerűen 3-ra hagyjuk magunkat. Elveszítettük az extra 0,25-et, és ez hibát jelent, ha megpróbálunk további matematikát elvégezni, vagy a jeleinket vissza analóg hullámformává alakítjuk.

Ezek a kerekítési hibák nagyon kis torzulások vagy zajok formájában nyilvánulnak meg, amelyek felhalmozódhatnak számos matematikai függvénynél. Ha azonban ezt a 4 bites mintát további információs bittel kibővítettük, hogy frakcióként vagy tizedes pontként felhasználhassuk, akkor az extra adatpontoknak köszönhetően sokkal hosszabb ideig folytathatjuk az osztást, összeadást és többszörösét. Tehát a való világban a 16 vagy 24 bites mintavétel, majd az adatok 32 bites formátumú konvertálása a feldolgozáshoz elősegíti a zaj és a torzítás megtakarítását. Mint már említettük, a 32 bites szörnyű sok pontosságot jelent.

Ugyanakkor ugyanolyan fontos felismerni, hogy nincs szükségünk erre a további helyiségre, amikor visszatérünk az analóg tartományba. Mint már tárgyaltuk, körülbelül 20 bites adat (-120 dB zaj) az abszolút maximum, amelyet esetleg észlelhet, így visszaállíthatunk ésszerűbb fájlméretre az audio minőségének befolyásolása nélkül, annak ellenére, hogy az „audiofilek” valószínűleg sajnálom ezt az elveszett adatot.

Az alacsonyabb bitmélységre való elmozduláskor azonban elkerülhetetlenül bevezetünk néhány kerekítési hibát, így mindig nagyon kevés extra torzulással jár, mivel ezek a hibák nem mindig véletlenszerűen fordulnak elő. Bár ez nem jelent problémát a 24 bites audió számára, mivel az már jóval meghaladja az analóg zajküszöböt, a „ditering” elnevezésű módszer gondosan megoldja ezt a problémát a 16 bites fájlok esetében.

Példa az összehasonlításra a torzítás által, amellyel a csonkítás és a szóródás vezethető be.

Ezt úgy végezzük, hogy az audiominta legkisebb jelentőségű részét véletlenszerűen kiválasztjuk, elkerüljük a torzítási hibákat, de bevezetünk egy nagyon csendes véletlenszerű háttérzajt, amely a frekvenciák között oszlik meg. Noha a zaj bevezetése intuitív módon láthatja a számlálót, ez valójában csökkenti a hallható torzítás mértékét a véletlenszerűség miatt. Ezen túlmenően, az emberi fül frekvenciaválaszát visszaélő speciális zaj alakú szórási minták felhasználásával a 16-bites elferdített hang a megfigyelt zajszinttel nagyon közel 120 dB-re képes megőrizni, közvetlenül észlelésünk határain.

A 32 bites adat és a 192 kHz mintavételi sebesség jelentős előnyeket jelent a stúdióban, ám ugyanezek a szabályok nem vonatkoznak a lejátszásra.

Egyszerűen fogalmazva: hagyjuk, hogy a stúdiók becsavarják a merevlemezüket ezzel a nagy felbontású tartalommal, egyszerűen nincs szükségünk mindazokra a felesleges adatokra, amikor a kiváló minőségű lejátszásról van szó.

Tekerje fel

Ha még mindig velem vagy, akkor ne értelmezze ezt a cikket az okostelefon audiokomponenseinek fejlesztésére irányuló erőfeszítések teljes elutasításának. Noha a számok átszervezése haszontalan lehet, a jobb minőségű alkatrészek és a jobb áramkör-tervezés továbbra is kiváló fejlődés a mobil piacon, csak azt kell biztosítanunk, hogy a gyártók a megfelelő dolgokra összpontosítsák figyelmüket. Például az LG V10 32 bites DAC-ja csodálatosnak hangzik, ám kihasználásához nem kell különféle hangfájlokkal foglalkoznia.

Az alacsony impedanciájú fejhallgató vezetésének képessége, az alacsony zajszint megőrzése a DAC-tól a jackig, és minimális torzítás nyújtása az okostelefonok hangjának sokkal fontosabb tulajdonságai, mint az elméletileg támogatott bitmélység vagy mintavételi sebesség, és remélhetőleg képesek leszünk rá a jövőben részletesebben belemerülni ezekbe a pontokba.

A Dell nagyon elfoglalt volt a Computex 2019-en, é bejelentette zámo hűvö új laptopot, amelyeket irodai, játék- é alkalmi haználatra terveztek. A táraá...

Izgatott vagy a Pokémon: Pikachu nyomozó, aki a helyi zínházban landol? Ha nem, akkor a Niantic kézen áll arra, hogy pumpáljon, amikor néhány új croov...

Népszerű A Portálon