Świetny mit audio: dlaczego nie potrzebujesz tego 32-bitowego przetwornika cyfrowo-analogowego

Autor: Randy Alexander
Data Utworzenia: 1 Kwiecień 2021
Data Aktualizacji: 1 Lipiec 2024
Anonim
Dilvpoetry DAC DT-1: стационарный ЦАП с отключаемым блоком ламп и усилителем для наушников
Wideo: Dilvpoetry DAC DT-1: стационарный ЦАП с отключаемым блоком ламп и усилителем для наушников

Zawartość


Jak zapewne zauważyłeś, w branży smartfonów pojawił się nowy trend polegający na włączaniu chipów audio „studyjnej jakości” do nowoczesnych flagowych smartfonów. Podczas gdy 32-bitowy przetwornik cyfrowo-analogowy (cyfrowo-analogowy) z obsługą dźwięku 192 kHz z pewnością dobrze wygląda na karcie specyfikacji, po prostu nie ma żadnej korzyści z powiększania naszych kolekcji audio.

Jestem tutaj, aby wyjaśnić, dlaczego ta głębia bitowa i częstotliwość próbkowania to tylko kolejny przypadek branży audio wykorzystującej brak wiedzy konsumentów, a nawet audiofilów na ten temat. Załóż czapki nerdowe, zajmiemy się poważnymi kwestiami technicznymi, aby wyjaśnić tajniki profesjonalnego audio. Mam nadzieję, że udowodnię ci również, dlaczego powinieneś ignorować większość szumu marketingowego.

Słyszysz to?

Zanim się zagłębimy, ten pierwszy segment zawiera pewne wymagane informacje na temat dwóch głównych pojęć cyfrowego dźwięku, głębi bitów i częstotliwości próbkowania.


Częstotliwość próbkowania odnosi się do tego, jak często będziemy przechwytywać lub odtwarzać informacje o amplitudzie sygnału. Zasadniczo dzielimy kształt fali na wiele małych części, aby dowiedzieć się więcej o nim w określonym momencie. Twierdzenie Nyquista stwierdza, że ​​najwyższą możliwą częstotliwością, którą można uchwycić lub odtworzyć, jest dokładnie połowa częstotliwości próbkowania. Jest to dość proste do wyobrażenia, ponieważ potrzebujemy amplitud dla górnej i dolnej części fali (co wymagałoby dwóch próbek), aby dokładnie poznać jego częstotliwość.

Zwiększenie częstotliwości próbkowania (u góry) powoduje uzyskanie dodatkowych próbek na sekundę, natomiast większa głębokość bitów (u dołu) zapewnia więcej możliwych wartości do zarejestrowania próbki.

Jeśli chodzi o audio, interesuje nas tylko to, co słyszymy, a znaczna większość ludzi słyszy ogony tuż przed 20kHz. Teraz, gdy wiemy o twierdzeniu Nyquista, możemy zrozumieć, dlaczego 44,1 kHz i 48 kHz są powszechnymi częstotliwościami próbkowania, ponieważ są one nieco ponad dwukrotnie wyższe niż maksymalna częstotliwość, którą słyszymy. Przyjęcie studyjnej jakości 96 kHz i 192 kHz nie ma nic wspólnego z przechwytywaniem danych o wyższej częstotliwości, co byłoby bezcelowe. Ale zajmiemy się tym więcej za minutę.


Gdy patrzymy na amplitudy w czasie, głębia bitowa po prostu odnosi się do rozdzielczości lub liczby dostępnych punktów w celu przechowywania danych amplitudy. Na przykład 8-bitów oferuje nam 256 różnych punktów do zaokrąglenia, 16-bitowe wyniki w 65 534 punktach, a 32-bitowe dane dają nam 4 294 967 294 punkty danych. Chociaż oczywiście znacznie zwiększa to rozmiar każdego pliku.

Może być łatwo od razu pomyśleć o głębokości bitów w kategoriach dokładności amplitudy, ale ważniejsze pojęcia, które należy zrozumieć, to szum i zniekształcenie. Przy bardzo niskiej rozdzielczości prawdopodobnie pominiemy fragmenty informacji o niższej amplitudzie lub odetniemy szczyty fal, co wprowadza niedokładność i zniekształcenie (błędy kwantyzacji). Co ciekawe, często będzie to brzmieć jak szum, jeśli chcesz odtworzyć plik o niskiej rozdzielczości, ponieważ skutecznie zwiększyliśmy rozmiar najmniejszego możliwego sygnału, który można uchwycić i odtworzyć. Jest to dokładnie to samo, co dodanie źródła szumu do naszej fali. Innymi słowy, obniżenie głębokości bitowej zmniejsza również poziom szumu. Pomóc może również myśleć o tym w kategoriach próbki binarnej, w której najmniej znaczący bit reprezentuje poziom szumu.

Dlatego większa głębia bitowa daje nam większy poziom szumu, ale istnieje skończona granica tego, jak praktyczne jest to w świecie rzeczywistym. Niestety wszędzie jest hałas i nie mam na myśli przejeżdżającego autobusu na ulicy. Od kabli po słuchawki, tranzystory we wzmacniaczu, a nawet uszy w głowie - maksymalny stosunek sygnału do szumu w świecie rzeczywistym wynosi około 124 dB, co daje około 21 bitów danych.Jargon Buster:

DAC- Konwerter cyfrowo-analogowy pobiera cyfrowe dane audio i przekształca je w sygnał analogowy w celu przesłania do słuchawek lub głośników.

Próbna stawka- Mierzona w hercach (Hz) jest to liczba próbek danych cyfrowych rejestrowanych w każdej sekundzie.

SNR- Stosunek sygnału do szumu to różnica między pożądanym sygnałem a szumem w tle. W systemie cyfrowym jest to bezpośrednio powiązane z głębią bitów.

Dla porównania 16-bitowe przechwytywanie oferuje stosunek sygnału do szumu (różnica między sygnałem a szumem tła) wynoszący 96,33 dB, a 24-bitowe oferuje 144,49 dB, co przekracza ograniczenia przechwytywania sprzętowego i postrzegania przez człowieka. Tak więc twój 32-bitowy przetwornik cyfrowo-analogowy będzie w stanie wyprowadzić maksymalnie 21-bitowych przydatnych danych, a pozostałe bity będą maskowane przez szumy obwodu. W rzeczywistości jednak najbardziej niedrogie urządzenia mają SNR od 100 do 110dB, ponieważ większość innych elementów obwodu wprowadzi własny szum. Najwyraźniej pliki 32-bitowe wydają się już raczej zbędne.

Teraz, gdy zrozumiemy podstawy cyfrowego audio, przejdźmy do niektórych bardziej technicznych kwestii.

Schody do nieba

Większość problemów związanych ze zrozumieniem i nieporozumieniem audio jest związana ze sposobem, w jaki zasoby edukacyjne i firmy próbują wyjaśnić korzyści za pomocą wskazówek wizualnych. Prawdopodobnie wszyscy widzieliście audio reprezentowane jako seria stopni schodów dla głębokości bitów i prostokątnych linii dla częstotliwości próbkowania. Z pewnością nie wygląda to dobrze, gdy porównasz go z gładko wyglądającym analogowym przebiegiem, więc łatwo jest wypróbować lepiej wyglądające, „gładsze” schody, aby przedstawić dokładniejszy przebieg wyjściowy.

Chociaż może to być łatwa sprzedaż publiczna, ta powszechna analogia dokładności „schodów” jest ogromnym błędem i nie docenia, jak faktycznie działa cyfrowy dźwięk. Zignoruj ​​to.

Jednak ta wizualna reprezentacja wprowadza w błąd, jak działa dźwięk. Chociaż może wyglądać niechlujnie, matematycznie dane poniżej częstotliwości Nyquista, czyli o połowę częstotliwości próbkowania, zostały idealnie uchwycone i można je doskonale odtworzyć. Wyobraź to sobie, nawet przy częstotliwości Nyquista, która często może być reprezentowana jako fala prostokątna zamiast gładkiej fali sinusoidalnej, mamy dokładne dane dla amplitudy w określonym punkcie czasu, co jest wszystkim, czego potrzebujemy. My, ludzie, często mylnie patrzymy na przestrzeń między próbkami, ale system cyfrowy nie działa w ten sam sposób.

Głębia bitowa jest często powiązana z dokładnością, ale tak naprawdę określa wydajność systemu w zakresie hałasu. Innymi słowy, najmniejszy wykrywalny lub odtwarzalny sygnał.

Jeśli chodzi o odtwarzanie, może to być nieco trudniejsze, ze względu na łatwą do zrozumienia koncepcję przetworników DAC „zerowego rzędu”, które będą po prostu przełączać się między wartościami z ustaloną częstotliwością próbkowania, dając schodkowy wynik. W rzeczywistości nie jest to uczciwa reprezentacja działania przetworników DAC, ale skoro już tu jesteśmy, możemy użyć tego przykładu, aby udowodnić, że i tak nie powinieneś się martwić o te schody.

Ważnym faktem, na który należy zwrócić uwagę, jest to, że wszystkie przebiegi mogą być wyrażone jako suma wielu fal sinusoidalnych, częstotliwości podstawowej i dodatkowych składników przy wielokrotnościach harmonicznych. Fala trójkątna (lub stopień schodowy) składa się z nieparzystych harmonicznych o malejących amplitudach. Tak więc, jeśli mamy wiele bardzo małych kroków występujących przy naszej częstotliwości próbkowania, możemy powiedzieć, że dodana jest dodatkowa zawartość harmonicznych, ale występuje ona przy podwójnej częstotliwości słyszalnej (Nyquista) i prawdopodobnie kilku wyższych harmonicznych, więc wygraliśmy i tak ich nie usłyszy. Co więcej, byłoby to dość proste do odfiltrowania za pomocą kilku komponentów.

Jeśli oddzielimy próbki DAC, możemy łatwo zobaczyć, że nasz pożądany sygnał jest doskonale reprezentowany wraz z dodatkowym przebiegiem przy częstotliwości próbkowania DAC.

Jeśli to prawda, powinniśmy być w stanie to zaobserwować za pomocą szybkiego eksperymentu. Weźmy wyjście prosto z podstawowego przetwornika DAC z zerowym rzędem, a także poprowadź sygnał przez bardzo prostą 2nd zamów filtr dolnoprzepustowy ustawiony na połowę naszej częstotliwości próbkowania. Użyłem tutaj tylko 6-bitowego sygnału, abyśmy mogli zobaczyć wyjście na oscyloskopie. 16-bitowy lub 24-bitowy plik audio miałby znacznie mniej szumów na sygnale zarówno przed, jak i po filtrowaniu.

Dość prymitywny przykład, ale świadczy to o tym, że dane audio są doskonale odtwarzane w tych bałaganiarskich schodach.

I jakby magicznie, schody prawie całkowicie zniknęły, a sygnał wyjściowy jest „wygładzony”, po prostu za pomocą filtra dolnoprzepustowego, który nie zakłóca naszego sygnału sinusoidalnego. W rzeczywistości wszystko, co zrobiliśmy, to odfiltrowanie części sygnału, której i tak byś nie słyszał. To naprawdę nie jest zły wynik dla dodatkowych czterech komponentów, które są w zasadzie wolne (dwa kondensatory i dwa oporniki kosztują mniej niż 5 pensów), ale w rzeczywistości istnieją bardziej wyrafinowane techniki, których możemy użyć, aby jeszcze bardziej zmniejszyć ten szum. Co więcej, są one zawarte w standardzie w większości przetworników DAC dobrej jakości.

W bardziej realistycznym przykładzie każdy przetwornik cyfrowo-analogowy do użytku z dźwiękiem będzie również wyposażony w filtr interpolacyjny, znany również jako upsampling. Interpolacja jest po prostu sposobem obliczania punktów pośrednich między dwiema próbkami, więc DAC faktycznie wykonuje wiele tego „wygładzania” samodzielnie, a znacznie więcej niż podwojenie lub czterokrotność częstotliwości próbkowania. Co więcej, nie zajmuje dodatkowego miejsca na pliki.

Filtry interpolacyjne powszechnie spotykane w dowolnym przetworniku cyfrowo-cyfrowym wartym jego soli są znacznie lepszym rozwiązaniem niż przenoszenie plików o wyższych częstotliwościach próbkowania.

Metody tego mogą być dość złożone, ale zasadniczo twój DAC zmienia swoją wartość wyjściową znacznie częściej niż sugerowałaby częstotliwość próbkowania pliku audio. To wypycha niesłyszalne harmoniczne stopnia schodkowego daleko poza częstotliwość próbkowania, pozwalając na użycie wolniejszych, łatwiej osiągalnych filtrów, które mają mniej tętnień, zachowując w ten sposób bity, które naprawdę chcemy usłyszeć.

Jeśli zastanawiasz się, dlaczego chcemy usunąć te treści, których nie słyszymy, prostym powodem jest to, że odtwarzanie tych dodatkowych danych w dalszej części łańcucha sygnału, powiedzmy we wzmacniaczu, marnuje energię. Co więcej, w zależności od innych komponentów systemu, ta „ultradźwiękowa” zawartość o wyższej częstotliwości może faktycznie prowadzić do większych zniekształceń intermodulacji w komponentach o ograniczonej przepustowości. Dlatego plik 192 kHz prawdopodobnie wyrządziłby więcej szkody niż pożytku, gdyby w tych plikach była jakakolwiek treść ultradźwiękowa.

Jeśli potrzebny będzie jakikolwiek dowód, pokażę również wyjście z wysokiej jakości przetwornika cyfrowo-analogowego za pomocą Circus Logic CS4272 (na zdjęciu u góry). CS4272 ma sekcję interpolacji i stromy wbudowany filtr wyjściowy. Jedyne, co robimy w tym teście, to użycie mikrokontrolera do zasilania przetwornika cyfrowo-analogowego dwoma 16-bitowymi próbkami o wysokiej i niskiej częstotliwości przy 48 kHz, co daje nam maksymalny możliwy przebieg wyjściowy przy 24 kHz. Nie stosuje się żadnych innych elementów filtrujących, wyjście to pochodzi bezpośrednio z przetwornika.

Sygnał wyjściowy 24 kHz (górny) z tego studyjnego przetwornika cyfrowo-analogowego z pewnością nie przypomina prostokątnej fali związanej ze zwykłym materiałem marketingowym. Częstotliwość próbkowania (Fs) jest wyświetlana na dole oscyloskopu.

Zwróć uwagę, że wyjściowa fala sinusoidalna (góra) stanowi dokładnie połowę prędkości zegara częstotliwości (dół). Nie ma zauważalnych stopni schodów, a ta fala o bardzo wysokiej częstotliwości wygląda prawie jak idealna fala sinusoidalna, a nie prostokątna fala kwadratowa, którą sugerowałby materiał marketingowy, a nawet przypadkowe spojrzenie na dane wyjściowe. To pokazuje, że nawet przy tylko dwóch próbach teoria Nyquista działa doskonale w praktyce i możemy odtworzyć czystą falę sinusoidalną, bez jakiejkolwiek dodatkowej zawartości harmonicznych, bez dużej głębi bitowej lub częstotliwości próbkowania.

Prawda o 32-bitach i 192 kHz

Jak w przypadku większości rzeczy, za całym żargonem kryje się prawda, a 32-bitowy dźwięk 192 kHz ma praktyczne zastosowanie, ale nie w zasięgu ręki. Te cyfrowe atrybuty przydają się, gdy jesteś w środowisku studyjnym, stąd twierdzenia, że ​​„mobilny dźwięk jakości studyjnej”, ale te zasady po prostu nie mają zastosowania, gdy chcesz schować gotowy utwór do kieszeni.

Po pierwsze, zacznijmy od częstotliwości próbkowania. Jedną z często reklamowanych zalet dźwięku o wyższej rozdzielczości jest zatrzymywanie danych ultradźwiękowych, których nie słyszysz, ale wpływają na muzykę. Śmieci, większość instrumentów wypadnie na długo przed granicami częstotliwości naszego słuchu, mikrofon uchwyci spływ przestrzenny co najwyżej około 20 kHz, a słuchawki, których używasz, na pewno też nie sięgną tak daleko. Nawet gdyby mogli, twoje uszy po prostu nie mogą tego wykryć.

Typowa ludzka wrażliwość słuchu osiąga wartość szczytową przy 3 kHz i szybko zaczyna opadać po 16 kHz.

Jednak próbkowanie 192 kHz jest bardzo przydatne w zmniejszaniu szumu (to słowo kluczowe jeszcze raz) podczas próbkowania danych, pozwala na prostszą budowę niezbędnych filtrów wejściowych, a także jest ważne dla szybkiego efektu cyfrowego. Nadpróbkowanie powyżej widma słyszalnego pozwala nam uśrednić sygnał, aby zepchnąć poziom szumu. Przekonasz się, że większość dobrych przetworników ADC (konwertery analogowo-cyfrowe) ma obecnie wbudowane 64-bitowe nadpróbkowanie lub więcej.

Każdy ADC musi również usunąć częstotliwości powyżej swojego limitu Nyquista, w przeciwnym razie skończy się to okropnie brzmiącym aliasingiem, ponieważ wyższe częstotliwości są „składane” w spektrum słyszalnym. Większy odstęp między naszą częstotliwością narożną filtra 20 kHz a maksymalną częstotliwością próbkowania lepiej dostosowuje się do filtrów w świecie rzeczywistym, które po prostu nie mogą być tak strome i stabilne, jak wymagane są filtry teoretyczne. To samo dotyczy końca przetwornika cyfrowo-analogowego, ale jak już mówiliśmy, intermodulacja może bardzo skutecznie podnieść ten szum do wyższych częstotliwości w celu łatwiejszego filtrowania.

Im bardziej stromy filtr, tym więcej tętnień w paśmie przepustowym. Zwiększenie częstotliwości próbkowania pozwala na zastosowanie „wolniejszych” filtrów, co pomaga zachować płaską charakterystykę częstotliwościową w słyszalnym paśmie przenoszenia.

W domenie cyfrowej obowiązują podobne zasady dla filtrów, które są często używane w procesie miksowania w studiu. Wyższe częstotliwości próbkowania pozwalają na bardziej strome, szybsze filtry, które wymagają dodatkowych danych w celu prawidłowego działania. Nie jest to wymagane, jeśli chodzi o odtwarzanie i przetworniki cyfrowo-analogowe, ponieważ interesuje nas tylko to, co można usłyszeć.

Przechodząc do wersji 32-bitowej, każdy, kto kiedykolwiek próbował kodować jakąkolwiek zdalnie złożoną matematykę, zrozumie znaczenie głębi bitowej, zarówno w przypadku liczb całkowitych, jak i danych zmiennoprzecinkowych. Jak już mówiliśmy, im więcej bitów, tym mniej szumów, a staje się to ważniejsze, gdy zaczynamy dzielić lub odejmować sygnały w domenie cyfrowej z powodu błędów zaokrąglania i aby uniknąć błędów przycinania podczas mnożenia lub dodawania.

Dodatkowa głębia bitowa jest ważna dla zachowania integralności sygnału podczas wykonywania operacji matematycznych, takich jak wewnętrzne oprogramowanie audio studia. Ale możemy wyrzucić te dodatkowe dane po zakończeniu masteringu.

Oto przykład, powiedzmy, że bierzemy próbkę 4-bitową, a nasza bieżąca próbka to 13, czyli dwójkowo 1101. Teraz spróbuj podzielić to przez cztery i zostajemy z 0011, lub po prostu 3. Straciliśmy dodatkowe 0,25, a to będzie błąd, jeśli spróbujemy wykonać dodatkową matematykę lub zmienić nasz sygnał z powrotem w postać fali analogowej.

Te błędy zaokrąglania objawiają się jako bardzo małe zniekształcenia lub szumy, które mogą się kumulować w wyniku wielu funkcji matematycznych. Jeśli jednak rozszerzymy tę 4-bitową próbkę o dodatkowe bity informacji do wykorzystania jako frakcja lub przecinek dziesiętny, możemy nadal dzielić, dodawać i zwielokrotniać znacznie dłużej dzięki dodatkowym punktom danych. Tak więc w prawdziwym świecie próbkowanie w 16 lub 24 bitach, a następnie konwersja tych danych do formatu 32-bitowego do ponownego przetwarzania pomaga zaoszczędzić na szumach i zniekształceniach. Jak już powiedzieliśmy, 32-bity to bardzo dużo punktów dokładności.

Równie ważne jest, aby rozpoznać, że nie potrzebujemy dodatkowego rezerwy, gdy wrócimy do dziedziny analogowej. Jak już omówiliśmy, około 20-bitowych danych (-120 dB szumu) absolutne maksimum, które może wykryć, dzięki czemu możemy przekonwertować z powrotem na bardziej rozsądny rozmiar pliku bez wpływu na jakość dźwięku, mimo że „audiofile” są prawdopodobnie lamentując nad tymi utraconymi danymi.

Jednak nieuchronnie wprowadzimy pewne błędy zaokrąglania podczas przechodzenia na niższą głębokość bitu, więc zawsze będzie występować niewielka dodatkowa deformacja, ponieważ błędy te nie zawsze występują losowo. Chociaż nie jest to problem z dźwiękiem 24-bitowym, ponieważ już wykracza daleko poza podłogę szumów analogowych, technika zwana „ditheringiem” rozwiązuje ten problem w przypadku plików 16-bitowych.

Przykładowe porównanie zniekształceń wprowadzonych przez obcinanie i dithering.

Odbywa się to przez randomizację najmniej znaczącego fragmentu próbki audio, eliminując błędy zniekształceń, ale wprowadzając bardzo cichy losowy szum tła rozłożony na częstotliwości. Chociaż wprowadzanie szumu może wydawać się sprzeczne z intuicją, to w rzeczywistości zmniejsza ilość słyszalnych zniekształceń z powodu losowości. Co więcej, stosując specjalne wzorce ditheringu w kształcie szumu, które nadużywają odpowiedź częstotliwościową ludzkiego ucha, 16-bitowy wygaszony dźwięk może faktycznie zatrzymać odbierany poziom szumu bardzo blisko 120dB, dokładnie na granicy naszej percepcji.

Dane 32-bitowe i częstotliwość próbkowania 192 kHz mają znaczące zalety w studiu, ale te same zasady nie mają zastosowania do odtwarzania.

Mówiąc prosto, pozwól studiom zatkać dyski twarde dzięki zawartości o wysokiej rozdzielczości, po prostu nie potrzebujemy wszystkich tych zbędnych danych, jeśli chodzi o odtwarzanie w wysokiej jakości.

Zakończyć

Jeśli nadal jesteś ze mną, nie traktuj tego artykułu jako całkowitego odrzucenia wysiłków na rzecz ulepszenia komponentów audio smartfona. Chociaż reklamowanie liczb może być bezużyteczne, komponenty wyższej jakości i lepsza konstrukcja obwodów nadal stanowią doskonały rozwój na rynku telefonii komórkowej, musimy tylko upewnić się, że producenci skupiają uwagę na właściwych rzeczach. Na przykład 32-bitowy przetwornik cyfrowo-analogowy w LG V10 brzmi niesamowicie, ale nie musisz przejmować się ogromnymi rozmiarami plików audio, aby z niego skorzystać.

Zdolność do prowadzenia słuchawek o niskiej impedancji, zachowania niskiej szumów od przetwornika cyfrowo-analogowego do gniazda i oferowania minimalnych zniekształceń to znacznie ważniejsze cechy dźwięku smartfona niż teoretycznie obsługiwana głębokość bitów lub częstotliwość próbkowania, i mamy nadzieję, że będziemy w stanie zagłębić się w te punkty bardziej szczegółowo w przyszłości.

EE była wiodącym operatorem komórkowym w Wielkiej Brytanii podcza wdrażania krajowych ieci 4G LTE i od tego czau pozotaje najwiękzą iecią komórkową w Wielkiej Brytanii. Zotał przejęty przez ...

Jeśli nie podoba Ci ię kupowanie telefonów na podtawie umów, odblokowane telefony z Androidem ą dla Ciebie. ą dotępne u różnych przedawców detalicznych i mogą być używane z wybrany...

Fascynujące Publikacje