PCM (ang. pulse-code modulation) – metoda reprezentacji sygnału analogowego w systemach cyfrowych, używana w telekomunikacji, w cyfrowej obróbce sygnału (np. w procesorach dźwięku), do przetwarzania obrazu[1], do zapisu muzyki na płytach CD (CD-Audio) i w wielu zastosowaniach przemysłowych.

Przebieg analogowy (linia czerwona) i odpowiadający mu przebieg (punkty niebieskie) odtworzony przy pomocy 4-bitowego kodowania PCM

LPCM (ang. linear pulse-code modulation) – specyficzny typ kodowania PCM, w którym poziomy kwantyzacji są równomierne liniowo[2]. Jest on przeciwieństwem tych odmian metody PCM, w których poziomy kwantyzacji zmieniają się w funkcji amplitudy. Choć PCM jest bardziej ogólnym pojęciem, to często jest właśnie stosowany do opisywania danych zakodowanych jako LPCM.

Opis działania edytuj

Metoda ta polega na rejestrowaniu wartości chwilowej sygnału analogowego (próbkowaniu) w określonych, najczęściej równych odstępach czasu, czyli z określoną częstością, zwaną częstotliwością próbkowania. Wartość chwilowa sygnału jest przedstawiana za pomocą słowa kodowego. Cały zakres wartości wejściowego sygnału jest dzielony na przedziały zwane przedziałami kwantyzacji. Przypisanie danego zakresu (przedziału) wartości analogowych sygnału wejściowego do jednej wartości cyfrowej nazywane jest kwantyzacją sygnału. Kwantyzacja jest procesem stratnym, a niedokładność odwzorowania nosi nazwę błędu kwantyzacji. Liczba poziomów kwantyzacji jest zazwyczaj potęgą liczby 2 (ponieważ do zapisu próbek używane są słowa binarne) i wyraża się wzorem 2n, gdzie n to liczba bitów przeznaczona na pojedynczą próbkę (rozdzielczość bitowa). Wraz ze wzrostem częstotliwości próbkowania i liczby bitów słowa kodowego, rośnie dokładność reprezentacji sygnału analogowego, a tak zapisany sygnał dyskretny jest wierniejszy oryginałowi. W celu uzyskania bezstratnej informacyjnie (bez aliasingu) zamiany sygnału ciągłego na dyskretny, połowa częstotliwości próbkowania (częstotliwość Nyquista) musi być większa od najwyższej częstotliwości spośród składowych harmonicznych próbkowanego sygnału[3][4].

Standardowe parametry edytuj

Dźwięk w formacie PCM może być zapisywany z różną częstotliwością próbkowania, najczęściej jest to 8 kHz (niektóre standardy telefonii)[5][6] lub 44,1 kHz (płyty CD-Audio), oraz różną rozdzielczością, najczęściej 8, 16, 20 lub 24 bitów na próbkę[7][8][9], może reprezentować 1 kanał (dźwięk monofoniczny), 2 kanały (stereofonia dwukanałowa) lub więcej (dźwięk dookólny)[8]. Reprezentacja dźwięku próbkowana z częstotliwością 44,1 kHz i rozdzielczością 16 bitów na próbkę (216 = 65.536 możliwych wartości amplitudy fali dźwiękowej na próbkę) jest uważana za bardzo wierną swemu oryginałowi, ponieważ pokrywa cały zakres pasma częstotliwości słyszalnych przez człowieka oraz prawie cały zakres rozpiętości dynamicznej słyszalnych dźwięków[10].

Zobacz też edytuj

Przypisy edytuj

  1. Recommendation ITU-R BT.601-7. Studio encoding parameters of digital television for standard 4:3 and wide-screen 16:9 aspect ratios. Międzynarodowy Związek Telekomunikacyjny. [dostęp 2022-09-04]. (ang.).
  2. Linear Pulse Code Modulated Audio (LPCM). Biblioteka Kongresu. [dostęp 2022-09-04]. (ang.).
  3. D. H. Whalen, E. R. Wiley, Philip E. Rubin, Franklin S. Cooper. The Haskins Laboratories’ pulse code modulation (PCM) system. „Behavior research methods, instruments, & computers”. 22, s. 550–559, 1990. DOI: 10.3758/BF03204440. (ang.). 
  4. Ken C. Pohlmann: Principles of Digital Audio. Indianapolis, Indiana, USA: Howard W. Sams & Company, 1989, s. 73-76, 133-137. ISBN 0-672-22634-0.
  5. PCM, Pulse Code Modulated Audio. Biblioteka Kongresu. [dostęp 2022-09-04]. (ang.).
  6. Recommendation G.711. Pulse code modulation (PCM) of voice frequencies. Międzynarodowy Związek Telekomunikacyjny, 1988-11. [dostęp 2022-09-04]. (ang.).
  7. Rajesh Kumar, Mohamed Mostafa: RFC 3108. Conventions for the use of the Session Description Protocol (SDP) for ATM Bearer Connections. Internet Society, 2001-05. s. 62-63. [dostęp 2022-09-04]. (ang.).
  8. a b James Salsman, Harald Tveit Alvestrand: RFC 2586. The Audio/L16 MIME content type. Internet Society, 1999-05. [dostęp 2022-09-04]. (ang.).
  9. RFC 3190. RTP Payload Format for 12-bit DAT Audio and 20- and 24-bit Linear Sampled Audio. Internet Society, 2002-01. [dostęp 2022-09-04]. (ang.).
  10. 24/192 Music Downloads ...and why they make no sense. Xiph.Org Foundation. [dostęp 2022-09-04]. (ang.).