ضبط های صوتی دیجیتال [ ویرایش ]
مقالات اصلی: صدای دیجیتال و ضبط دیجیتال
در سال 1967 ، اولین ضبط کننده PCM توسط امکانات تحقیقاتی NHK در ژاپن ساخته شد. [18] دستگاه 12 بیتی 30 کیلوهرتز برای افزایش دامنه دینامیکی از یک فشرده ساز (شبیه به کاهش نویز DBX ) استفاده کرده و سیگنالها را در یک ضبط کننده ویدئو ذخیره می کند . در سال 1969 ، NHK قابلیت های سیستم را به استریو 2 کاناله و وضوح 13 بیتی 32 کیلوهرتز گسترش داد . در ژانویه 1971 ، مهندسان Denon با استفاده از سیستم ضبط PCM NHK ، اولین ضبط های دیجیتال تجاری را ضبط کردند. [یادداشت 1] [18]
در سال 1972 ، Denon از اولین ضبط کننده دیجیتال 8 کاناله ، DN-023R رونمایی کرد که از یک ضبط کننده ضبط فیلم ویدئویی پخش شده با حلقه باز 4 سر برای ضبط در 47.25 کیلوهرتز ، صدای 13 بیتی PCM استفاده می کرد. [یادداشت 2] در سال 1977 ، Denon سیستم ضبط PCM قابل حمل ، DN-034R را توسعه داد. مانند DN-023R ، 8 کانال در 47.25 کیلوهرتز ضبط کرده است ، اما از 14 بیت "با تأکید ، معادل 15.5 بیت" استفاده کرده است. [18]
در سال 1979 ، اولین آلبوم دیجیتالی پاپ ، Bop till You Drop ، ضبط شد. با استفاده از ضبط صوت دیجیتال 3M در PCM خطی 50 کیلوهرتز ، 16 بیتی ضبط شد. [19]
لوح فشرده (CD) PCM به برنامه های کاربردی مصرف کننده های صوتی با معرفی آن در سال 1982. سی دی را آورده با استفاده از یک 44100 هرتز فرکانس نمونه برداری و رزولوشن 16 بیت و فروشگاه های تا 80 دقیقه از صدای استریو در هر دیسک.
تلفن دیجیتال [ ویرایش ]
مقاله اصلی: تلفن دیجیتال
توسعه سریع و پذیرش گسترده تلفن دیجیتال PCM توسط فناوری مدار خازن سوییچ شده با اکسید فلز - نیمه هادی (MOS) ، که در اوایل دهه 1970 توسعه یافته بود ، امکان پذیر شد. [20] این امر منجر به توسعه تراشه های فیلتر کدک PCM در اواخر دهه 1970 شد. [20] [21] سیلیکون دروازه CMOS (مکمل MOS) PCM کدک فیلتر تراشه، توسط توسعه دیوید هاجز و WC سیاه در سال 1980، [20] از آن زمان استاندارد صنعت برای تلفن دیجیتال بوده است. [20] [21] در دهه 1990 ، شبکه های مخابراتی مانند شبکه تلفن سوئیچ عمومی (PSTN) با فیلترهای رمزگذار CMOS PCM بسیار گسترده در مقیاس بزرگ (VLSI) دیجیتالی شده است ، که به طور گسترده در سیستم های الکترونیکی سوئیچینگ برای مبادلات تلفنی ، مودم های کاربر و طیف گسترده ای از برنامه های انتقال دیجیتال مانند به عنوان شبکه دیجیتال خدمات یکپارچه (ISDN) ، تلفن های بی سیم و تلفن های همراه . [21]
پیاده سازی ها [ ویرایش ]
PCM روش رمزگذاری است که به طور معمول برای صدای دیجیتال فشرده نشده استفاده می شود. [نکته 3]
- 4ESS سوئیچ معرفی سوئیچینگ تقسیم زمانی به سیستم تلفن ایالات متحده در سال 1976، بر اساس مقیاس متوسط تکنولوژی مدار یکپارچه شده است. [22]
- LPCM برای رمزگذاری بدون تلفات داده های صوتی در استاندارد کتاب قرمز ( CD ) (که به طور غیر رسمی به عنوان Audio CD نیز شناخته می شود ) ، که در سال 1982 معرفی شد ، استفاده می شود.
- AES3 (مشخص شده در سال 1985 که S / PDIF بر اساس آن بنا شده است) یک قالب خاص با استفاده از LPCM است.
- دیسک های لیزری با صدای دیجیتال دارای یک مسیر LPCM در کانال دیجیتال هستند.
- در رایانه های شخصی ، PCM و LPCM اغلب به قالب استفاده شده در قالب های ظرف صوتی WAV (تعریف شده در سال 1991) و AIFF (تعریف شده در سال 1988) اشاره دارند. داده های LPCM همچنین ممکن است در قالب های دیگر مانند AU ، قالب صوتی خام (پرونده بدون سربرگ) و قالب های مختلف ظرف چندرسانه ای ذخیره شوند .
- LPCM به عنوان بخشی از استانداردهای DVD (از سال 1995) و Blu-ray (از سال 2006) تعریف شده است. [23] [24] [25] همچنین به عنوان بخشی از قالب های مختلف ذخیره سازی فیلم و صدا دیجیتال (به عنوان مثال DV از سال 1995 ، [26] AVCHD از سال 2006 [27] ) تعریف می شود.
- LPCM توسط HDMI (تعریف شده در سال 2002) ، رابط اتصال صوتی / تصویری دیجیتال تک کابل برای انتقال داده های دیجیتالی فشرده نشده استفاده می شود.
- قالب کانتینر RF64 (تعریف شده در سال 2007) از LPCM استفاده می کند و همچنین امکان ذخیره سازی بیتی جریان غیر PCM را فراهم می کند: انواع مختلف فشرده سازی موجود در پرونده RF64 به صورت انفجار داده (Dolby E، Dolby AC3، DTS، MPEG-1 / MPEG-2 Audio) می تواند "مبدل" به عنوان خطی PCM. [28]
مدولاسیون [ ویرایش ]
نمونه برداری و تعیین مقدار سیگنال (قرمز) برای LPCM 4 بیتی
در نمودار ، یک موج سینوسی (منحنی قرمز) برای PCM نمونه برداری و کوانتی شده است. از موج سینوسی در فواصل منظم نمونه برداری می شود که به صورت خطوط عمودی نشان داده می شود. برای هر نمونه ، یکی از مقادیر موجود (در محور y) انتخاب شده است. فرآیند PCM معمولاً در یک مدار مجتمع به نام مبدل آنالوگ به دیجیتال (ADC) پیاده سازی می شود . این یک نمایش کاملا گسسته از سیگنال ورودی (نقاط آبی) را تولید می کند که می تواند به راحتی به عنوان داده های دیجیتال برای ذخیره سازی یا دستکاری رمزگذاری شود. چندین stream PCM نیز می تواند به تسهیم را به یک بزرگتر مجموع جریان داده ها ، به طور کلی برای انتقال جریانهای چندگانه بیش از یک پیوند فیزیکی است. یک تکنیک ، مالتی پلکسینگ تقسیم زمان نامیده می شود (TDM) و به طور گسترده ای مورد استفاده قرار می گیرد ، به ویژه در سیستم تلفن مدرن عمومی.
مدولاسیون [ ویرایش ]
الکترونیکی که در تولید یک سیگنال آنالوگ دقیق از داده های گسسته دخیل است ، همان مواردی است که برای تولید سیگنال دیجیتال استفاده می شود. این دستگاه ها مبدل های دیجیتال به آنالوگ (DAC) هستند. آنها ولتاژ یا جریانی را تولید می کنند (بسته به نوع آن) که نمایانگر مقدار ارائه شده روی ورودی های دیجیتالی آنها است. این خروجی به طور کلی فیلتر می شود و برای استفاده تقویت می شود.
برای بازیابی سیگنال اصلی از داده های نمونه ، یک مدولاتور می تواند روش مدولاسیون را به صورت معکوس اعمال کند. بعد از هر دوره نمونه گیری ، دمولاتور مقدار بعدی را می خواند و سیگنال خروجی را به مقدار جدید انتقال می دهد. در نتیجه این انتقال ها ، سیگنال به دلیل اثرات نامشخص مقدار قابل توجهی انرژی با فرکانس بالا به دست می آورد . برای از بین بردن این فرکانسهای نامطلوب ، دمولاتور سیگنال را از طریق فیلتر بازسازی عبور می دهد که انرژی خارج از محدوده فرکانس مورد انتظار را سرکوب می کند (بیشتر از فرکانس Nyquist {\ displaystyle f_ {s} / 2}) [یادداشت 4]
دقت و نرخ نمونه گیری استاندارد [ ویرایش ]
عمق معمول نمونه برای LPCM 8 ، 16 ، 20 یا 24 بیت در هر نمونه است . [1] [2] [3] [29]
LPCM یک کانال صدا را رمزگذاری می کند. پشتیبانی از صدای چند کاناله به قالب پرونده بستگی دارد و به همگام سازی چندین جریان LPCM بستگی دارد. [5] [30] در حالی که دو کانال (استریو) رایج ترین قالب است ، سیستم ها می توانند تا 8 کانال صوتی (7.1 فراگیر) [2] [3] یا بیشتر را پشتیبانی کنند.
فرکانس های معمول نمونه برداری 48 کیلوهرتز است که در فیلم های با فرمت DVD استفاده می شود یا 44.1 کیلوهرتز است که در دیسک های فشرده استفاده می شود . از فرکانس های نمونه برداری 96 کیلوهرتز یا 192 کیلوهرتز می توان در برخی تجهیزات استفاده کرد ، اما در مورد مزایا بحث شده است. [31]
محدودیتها [ ویرایش ]
نایکوئیست-شانون تئوری و دستگاه های نشان می دهد PCM می تواند بدون ارائه تحریف در باند فرکانس طراحی شده خود را به کار گیرند اگر آنها ارائه یک فرکانس نمونه برداری حداقل دو بار که از بالاترین فرکانس موجود در سیگنال ورودی است. به عنوان مثال ، در تلفن ، باند فرکانس صدای قابل استفاده از حدود 300 هرتز تا 3400 هرتز است. [32] بنابراین برای بازسازی م ofثر سیگنال صوتی ، برنامه های تلفنی معمولاً از فرکانس نمونه برداری 8000 هرتز استفاده می کنند که بیش از دو برابر بالاترین فرکانس صدای قابل استفاده است.
صرف نظر از این ، منابع بالقوه اختلال در هر سیستم PCM وجود دارد:
- انتخاب مقداری گسسته که نزدیک باشد اما دقیقاً در سطح سیگنال آنالوگ برای هر نمونه قرار ندارد منجر به خطای کوانتیزه شدن می شود . [یادداشت 5]
- بین نمونه ها اندازه گیری سیگنال انجام نمی شود. قضیه نمونه برداری نمایش و بازیابی غیر مبهم سیگنال را فقط درصورتیکه انرژی در فرکانس f s / 2 یا بالاتر نداشته باشد تضمین می کند (نیمی از فرکانس نمونه برداری ، معروف به فرکانس Nyquist ). فرکانس های بالاتر به درستی نشان داده یا بازیابی نمی شوند و اعوجاج نامشخص را به سیگنال زیر فرکانس Nyquist اضافه می کنند.
- از آنجا که نمونه ها به زمان وابسته هستند ، برای تولید مثل دقیق به یک ساعت دقیق نیاز است. اگر ساعت رمزگذاری یا رمزگشایی پایدار نباشد ، این نقایص مستقیماً بر کیفیت خروجی دستگاه تأثیر می گذارد. [یادداشت 6]
پردازش و کدگذاری [ ویرایش ]
برخی از اشکال PCM پردازش سیگنال را با کدگذاری ترکیب می کنند. نسخه های قدیمی این سیستم ها پردازش را در حوزه آنالوگ به عنوان بخشی از فرایند آنالوگ به دیجیتال اعمال می کردند. پیاده سازی های جدیدتر این کار را در حوزه دیجیتال انجام می دهند. این تکنیک های ساده توسط تکنیک های فشرده سازی صوتی مبتنی بر تبدیل تا حد زیادی منسوخ شده اند .
- PCM خطی (LPCM) PCM با کمی سازی خطی است. [33]
- PCM دیفرانسیل (DPCM) مقادیر PCM را به عنوان تفاوت بین مقدار فعلی و پیش بینی شده رمزگذاری می کند. یک الگوریتم بر اساس نمونه های قبلی نمونه بعدی را پیش بینی می کند و رمزگذار فقط تفاوت این پیش بینی و مقدار واقعی را ذخیره می کند. اگر پیش بینی منطقی باشد ، می توان از بیت های کمتری برای نمایش همان اطلاعات استفاده کرد. برای صدا ، این نوع رمزگذاری در مقایسه با PCM ، تعداد بیت های مورد نیاز در هر نمونه را حدود 25٪ کاهش می دهد.
- DPCM تطبیقی (ADPCM) نوعی DPCM است که اندازه مرحله کوانتیزاسیون را تغییر می دهد تا امکان کاهش بیشتر پهنای باند مورد نیاز برای نسبت سیگنال به نویز داده شده را فراهم کند.
- دلتا مدولاسیون نوعی DPCM است که از یک بیت در هر نمونه برای نشان دادن افزایش یا کاهش سیگنال نسبت به نمونه قبلی استفاده می کند.
در تلفن ، یک سیگنال صوتی استاندارد برای یک تماس تلفنی بصورت 8000 نمونه در ثانیه کدگذاری می شود که هر کدام 8 بیت است و یک سیگنال دیجیتال 64 کیلوبیت بر ثانیه را می دهد که به DS0 معروف است . فشرده سازی سیگنال پیش فرض رمزگذاری شده بر روی DS0 یا قانون μ (law-law) PCM (آمریکای شمالی و ژاپن) یا A-law PCM (اروپا و بیشتر بقیه جهان) است. اینها سیستمهای فشرده سازی لگاریتمی هستند که در آنها یک عدد خطی PCM 12 یا 13 بیتی به یک مقدار 8 بیتی ترسیم می شود. این سیستم توسط استاندارد بین المللی G.711 توصیف شده است .
در مواردی که هزینه مدار زیاد است و افت کیفیت صدا قابل قبول است ، گاهی فشرده سازی بیشتر سیگنال صوتی منطقی است. از الگوریتم ADPCM برای نقشه برداری از یک سری نمونه های 8-bit μ-law یا A-law PCM در یک سری از نمونه های 4-bit ADPCM استفاده می شود. به این ترتیب ظرفیت خط دو برابر می شود. این روش در استاندارد G.726 شرح داده شده است.
کدک های صوتی برای دستیابی به فشرده سازی بیشتر ساخته شده اند. برخی از این تکنیک ها استاندارد و ثبت شده اند. تکنیک های پیشرفته فشرده سازی اکنون به طور گسترده ای در تلفن های همراه ، صدا از طریق IP و رسانه های جریانی استفاده می شود .
رمزگذاری برای انتقال سریال [ ویرایش ]
مقاله اصلی: کد خط
همچنین ببینید: T-حامل و E-حامل
PCM می تواند به حالت بازگشت به صفر (RZ) یا غیر بازگشت به صفر (NRZ) باشد. برای همگام سازی یک سیستم NRZ با استفاده از اطلاعات درون باند ، نباید دنباله های طولانی از نمادهای یکسان ، مانند یک یا صفر وجود داشته باشد. برای سیستم های باینری PCM ، تراکم نمادها را 1 -دانسیته می گویند . [34]
تراکم آن اغلب با استفاده از تکنیک های پیش رمزگذاری مانند رمزگذاری محدود در طول اجرا کنترل می شود ، جایی که کد PCM به یک کد کمی طولانی تر و با تضمین شده با تراکم یکسان قبل از مدولاسیون در کانال گسترش می یابد. در موارد دیگر ، بیت های فریم اضافی به جریان اضافه می شوند ، که حداقل انتقال گاه به گاه نماد را تضمین می کند.
تکنیک دیگری که برای کنترل تراکم یکسان استفاده می شود ، استفاده از تقویم کننده بر روی داده است که تمایل دارد جریان داده را به جریانی تبدیل کند که تصادفی شبه به نظر برسد ، اما در آنجا داده ها دقیقاً توسط یک دستگاه رمزگشایی مکمل قابل بازیابی هستند. در این حالت ، طولانی بودن صفرها یا یکها هنوز روی خروجی امکان پذیر است ، اما بعید به نظر می رسد که امکان هماهنگی قابل اعتماد را داشته باشد.
در موارد دیگر ، مقدار دراز مدت DC سیگنال مدوله شده مهم است ، زیرا ایجاد یک بایاس DC تمایل دارد مدارهای ارتباطی را از محدوده عملکرد خود خارج کند. در این حالت اقدامات خاصی برای محاسبه شمارش تعصب تجمعی DC و اصلاح کدها در صورت لزوم انجام می شود تا تعصب DC همیشه به صفر برسد.
بسیاری از این کدها کدهای دو قطبی هستند که در آن پالس ها می توانند مثبت ، منفی یا غایب باشند. در کد معکوس علامت جایگزین معمولی ، پالس های غیر صفر بین مثبت و منفی قرار دارند. این قوانین ممکن است برای تولید نمادهای خاص مورد استفاده برای قاب بندی یا سایر اهداف خاص نقض شود.
نامگذاری [ ویرایش ]
کلمه پالس در اصطلاح تعدیل کد پالس به "پالس های" موجود در خط انتقال اشاره دارد. این شاید نتیجه طبیعی این تکنیک باشد که در کنار دو روش آنالوگ ، مدولاسیون عرض پالس و مدولاسیون موقعیت پالس ، تکامل یافته است که در آن اطلاعات رمزگذاری شده به ترتیب توسط پالس های سیگنال گسسته با عرض یا موقعیت متفاوت نمایش داده می شوند. [ نیازمند منبع ] از این نظر ، PCM شباهت چندانی به سایر اشکال رمزگذاری سیگنال ندارد ، با این تفاوت که همه می توانند در مالتی پلکسینگ تقسیم زمان استفاده شوند و تعداد کدهای PCM به صورت پالس های الکتریکی نشان داده می شوند.
همچنین به [ ویرایش ] مراجعه کنید
- رمزگذار بتا
- نویز مدولاسیون کد پالس معادل
- نسبت سیگنال به میزان و نویز (SQNR) ، یکی از روش های اندازه گیری خطای کوانتیزاسیون
منبع
https://en.wikipedia.org/wiki/Pulse-code_modulation
در این وبلاگ به ریاضیات و کاربردهای آن و تحقیقات در آنها پرداخته می شود. مطالب در این وبلاگ ترجمه سطحی و اولیه است و کامل نیست.در صورتی سوال یا نظری در زمینه ریاضیات دارید مطرح نمایید .در صورت امکان به آن می پردازم. من دوست دارم برای یافتن پاسخ به سوالات و حل پروژه های علمی با دیگران همکاری نمایم.در صورتی که شما هم بامن هم عقیده هستید با من تماس بگیرید.