بواسطه ارتباط صوتي بين تجهيزات مختلف درون يك استوديو، لازمست كه يك استاندارد يكسان بين آن دستگاهها حاكم باشد. اين استاندارد علاوه بر بيان حوزه صداي ديجيتال، ‌امكان استفاده از داده‌هاي كمكي در قالب صداي ديجيتال را نيز فراهم مي‌كند. مبناي اين استاندارد بر ارسال دو صداي مونو يا يك صداي استريو، همزمان روي يك خط (مثلا كابل رشته صدا) است. پيش از بيان صداي ديجيتال بعضي مفاهيم و اصطلاحات بكار برده ‌شده را توضيح مي‌دهيم:

نرخ یا فرکانس نمونه برداری (Sample Rate)

فركانس نمونه‌برداري بيانگر تعداد نمونه‌هايي است كه در هر ثانيه از سيگنال صداي آنالوگ برداشته مي‌شود. با اين تعريف هر چه ‌اين تعداد بيشتر باشد، سيگنال نمونه‌برداري شده به سيگنال اصلي شبيه‌تر است. از طرف ديگر افزايش زياد اين فركانس بسته به كاربرد، محدوديتهاي فني و مالي دارد. مقادير شناخته شده براي فركانس نمونه‌برداري عبارتند از:

KHz ۳۲، KHz ۴۴.۱ ، KHz ۴۸، KHz ۸۸.۲، KHz ۹۶ و KHz ۱۹۲

ولي براي كاربردهاي عادي فركانس KHz 48 عمومي‌ترين فركانس نمونه‌برداري است.

كلمه نمونه صدا یا تعداد بيت اختصاص داده‌شده به هر نمونه (Audio sample word)

كه نشانگر دامنه يك نمونه صداي ديجيتال است. اعداد مثبت معادل ولتاژهاي مثبت در ورودي مبدل آنالوگ به ديجيتال است. تعداد بيتهاي هر كلمه از 16 تا 24 ميتواند باشد. دو محدوده براي تعداد بيتهاي در نظر گرفته شده‌است كه كمتر يا مساوي 20 بيت و يا كمتر يا مساوي 24 بيت مي‌باشد.

بيتهاي نمونه كمكي (Auxillary sample bits)

بيت با ارزش كمتر بعنوان بيتهاي نمونه كمكي شناخته مي‌شوند و هنگامي كه تعداد بيتهاي نمونه صدا كمتر يا مساوي 20 باشد براي اطلاعات كمكي بكار مي‌روند. (مثلاً براي كاربرد اينتركام)

بيت صحت (Validity bit)

اين بيت نشان مي‌دهد كه ‌آيا بيتهاي نمونه صدا در زير فريم، بسته به طول كلمة صداي تعريف شده براي تبديل به سيگنال صداي آنالوگ، مناسب هستند.

وضعيت كانال (Channel status)

وضعيت كانال در يك فرمت فيكس حاصل از بلوك، اطلاعاتي را حمل مي‌كند كه با هر كانال صدايي كه بوسيله هر كاربر واسطي قابل آشكارسازي است، سروكار دارد.

داده كاربر (User data)

كانال داده كاربر براي حمل هرنوع اطلاعاتي بكار مي‌رود.

بيت پريتي (Parity bit)

بيت پريتي امكان آشكارسازي تعداد فردي از خطاها (odd parity) ناشي از خرابي (عملكرد خطاي) واسط را فراهم مي‌كند.

مقدمه زيرفريم و فريم (preamble)

preamble ها الگوهاي مشخصي هستند كه براي همزماني بكار مي‌روند. سه نوع پريمبل وجود دارد.

زيرفريم (Subframe)

زيرفريم يك ساختار ثابت است كه جهت حمل پاره‌اي از اطلاعات كه بعداً تشريح مي‌شوند بكار مي‌رود.

فريم (Frame)

فريم متشكل از دو زيرفريم متوالي و مرتبط به هم مي‌باشد.

بلوك (Block)

بلوك گروهي از 192 فريم متوالي است. شروع يك گروه با يك پريمبل خاص مشخص مي‌شود.

كدينگ كانال (Channel coding)

كدينگ كانال شيوه‌اي است كه ارقام دودويي (‌باينري) براي عبور از واسط بدانوسيله نمايش داده مي‌شوند.

ساختار زيرفريم

براي راحت‌تر شدن شناخت ساختار زيرفريم به شكل‌هاي زير توجه فرمائيد:

V: ‌بيت صحت (validity)
U: بيت داده كاربر (user data bit)
C: بيت وضعيت كانال (channel status)
P: بيت پريتي (parity bit)

مطابق شكل فوق هر زيرفريم به بازه‌هاي زماني 32 بيتي تقسيم مي‌شوند (‌0 تا 31)


همانطور كه در دو شكل فوق ديده مي‌شود 4 بيت اول جهت preamble استفاده مي‌شود. در ساختار تا 24 بيتي بيتهاي 4 تا 27 جهت كلمه نمونه صدا در هر زيرفريم، و در ساختار تا 20 بيتي پهناي 8 تا 27 جهت كلمه نمونه صدا در هر زيرفريم استفاده مي‌شود. در ساختار تا 20 بيتي، بيتهاي 4 تا 7 جهت اطلاعات كمكي استفاده مي‌شود. يكي از كاربردهاي بيتهاي كمكي جهت هماهنگي براي تنظيم و اصلاح كيفيت صداي اصلي است.

براي اين كار صداي لازم براي هماهنگي را با فركانس KHz 16 (يك سوم فركانس نمونه‌برداري) و تعداد بيت 12 براي هر نمونه، نمونه‌برداري و كوانتايز كرده و سپس از 12 بيت هر نمونه 4 بيت LSB را بهمراه زيرفريم اولين فريم و 4 بيت دوم را با زيرفريم فريم دوم و 4 بيت سوم را با زيرفريم فريم سوم ارسال مي‌كنند و اين كار همينطور ادامه مي يابد. با اين روش امكان برقراري دو كانال هماهنگي بطور همزمان وجود دارد (چون هر فريم داراي دو زيرفريم است).

بيتهاي 28، 29، 30 و 31 نيز همانطور كه ديديم براي كاربردهاي ذكرشده استفاده مي‌شود.
در مورد پريتي لازم بذكر است كه پريتي از نوع زوج براي بازه زماني 4 تا 31 مي‌باشد (هنگامي كه هم تعداد 1ها و هم صفرها زوج است). پريمبل بطور پيش‌فرض داراي پريتي زوج مي‌باشد.
منظور از پريتي زوج اين است كه تعداد صفرها يا يك‌ها در نمونه اصلي زوج باشد.

ساختار فريم

هر فريم از صداي AES از دو زيرفريم كه در بالا توضيح داده‌شد، تشكيل شده‌است. نرخ فريم‌ها ارتباط مستقيم با فركانس نمونه‌برداري دارد. هر 192 فريم رويهم يك بلوك صداي AES را تشكيل مي‌دهد. از آنجا كه‌اين بلوك بايد داراي ابتدا (نشانگر ابتدا) باشد از خاصيت پريمبل براي اين‌كار استفاده مي‌شود. بطور معمول در هر فريم كه از دو زيرفريم تشكيل شده‌است، زيرفريم اول با پريمبل X و زيرفريم دوم با پريمبل Y شروع مي‌شود. ولي در اولين فريم از بلوك، زيرفريم اول بجاي شروع با پريمبل X با پريمبل Z شروع مي‌شود. پريمبل X بيانگر شروع زيرفريم اول و پريمبل Y بيانگر شروع زيرفريم دوم در هر فريم هستند. پريمبل Z بيانگر شروع زيرفريم اول در فريم اول (‌فريم صفر) از بلوك 192 فريمي است. بنابراين مي‌توان از آنها در همزماني و تشخيص بلوكها و زيرفريمها استفاده كرد.



جهت عدم امكان ايجاد تشابه بين پريمبل‌ها و داده‌هاي نمونه‌هاي صدا، پريمبل‌ها بگونه‌اي خاص انتخاب شده‌اند. اين امر علاوه بر عدم تشابه، امكان دستيابي قابل اعتماد به همزماني در يك دوره تناوب نمونه‌برداري را بخوبي فراهم مي‌كند.

كدينگ كانال براي رشته ديجيتال از نوع Biphase Mark است. اين نوع كدينگ با خود سهولت استخراج پالس‌ساعت رشته ورودي و جلوگيري از ايجاد مؤلفه DC را بهمراه دارد. در اين روش هر "1" با يك پريود از پالس‌ساعت كدگذار جايگزين شده و صفرها بطور متوالي با مقدار صفر و يك جايگزين مي‌شوند:


ساختار داده كاربر

ساختارهاي ممكن براي كانال داده كاربر بوسيله بيتهاي 4 تا 7 از بايت اول مجموعه بايتهاي كانال وضعيت نشان داده مي‌شود. اين چهار بيت در مجموع 16 حالت را ايجاد مي‌كنند كه در جدول زير نشان داده شده‌است:


HDLC براي ارسال داده‌هاي فرعي كه ممكن است ربطي به سيگنال صداي در حال حمل نداشته باشد مي‌تواند مورد استفاده قرار گيرد. نرخ داده ثابت بوده و در محدوده 5/12± درصد فركانس نمونه‌برداري KHz 48 است. جزئيات نحوه استفاده از اين بيتها در استاندارد AES-18 بيان شده‌است.

در مجموعه 192 فريمي از يك بلوك صداي AES، 192 بيت وضعيت بازاء هر كانال صداي ديجيتال، مجموعاً 24 بايت 8 بيتي را تشكيل مي‌دهند. اين بايتها شامل اطلاعاتي نظير طول كلمات نمونه صدا، ‌تعداد كانالهاي صدا، ‌فركانس نمونه‌برداري، ‌كد زماني (تايم‌كد)، منبع عددي رقمي (alphanumeric source) و كدهاي مقصد و پيش تاكيد. نوع صداي ديجيتال (حرفه‌اي يا خانگي)‌، حالت كانال‌هاي صدا (استريو، ‌مونو)، مديريت بيتهاي كاربر، كاربرد بيتهاي فرعي (ancillary)، كاربردهاي چند كانالي آينده، كلمه كنترل بايتهاي 0 تا 22 (در بايت 23) است. اولين بيت هر بلوك در فريمي با پريمبل Z وارد مي‌شود.

(CRCC : Cyclic Redundancy Check Character) اطلاعاتي را حمل مي‌كند كه دريافت صحيح كلاً بلوك داده وضعيت كانال را تست مي‌كند (‌بايتهاي صفر تا 22).

اجراي فرمت واسط

 فرستنده: بايد تمام قواعد فرمت سيگنال و كدگذاري كانال را براساس استاندارد رعايت كند. اين امر براي تمامي اجزاي فرمت سيگنال صادق است. در مورد ساختار بيت وضعيت كانال سه نوع "حداقل"، " استاندارد" و "بهبود يافته" وجود دارد. در اجراي "حداقل" تنها بيت صفر از بايت صفر كه در مورد نوع سيگنال ديجيتال از جهت حرفه‌اي و خانگي‌بودن است مقدار "1" (حرفه‌اي) قرار داده شده و ساير بيتها مقدار صفر قرار داده مي‌شود. در اجراي استاندارد، ‌مبنا يك سطح پايه‌اي است كه صدا را براي كاربردهاي عمومي در محيطهاي استوديويي و پخش مناسب مي‌سازد. در اجراي "بهبوديافته" توانايي‌هاي بيشتري را فراهم مي‌كند.

گيرنده: ‌بسيار وابسته به كاربرد است بنابراين مستندات كافي جهت تشخيص امكان انطباق كار گيرنده به كارهاي مورد نظر و تجهيزات جانبي مورد استفاده، ‌بايد با كارت گيرنده مورد استفاده وجود داشته باشد.

ملزومات الكتريكي

مشخصات عمومي: مبناي مشخصات الكتريكي واسط بر اساس CCITT V. 11 مي‌باشد كه ملزومات ارسال سيگنال ديجيتال بالانس تا چند صد متر را بيان مي‌كند. محدوده فركانسي مورد استفاده جهت تعيين پارامترهاي الكتريكي واسط به حداكثر نرخ داده پشتيباني شده بر مي گردد. حد بالاي فركانس معادل 128 برابر حداكثر نرخ فريم است.
براي بهبود اين مشخصات، مدار زير توجيه شده‌است، كه در زير مي‌بينيم:

خازنهاي C2 و C3 جهت ايزولاسيون ترانس و همچنين جلوگيري از اشكال در هنگام اتصال به يك منبع داراي ولتاژ DC است. ترانسها علاوه بر دستيابي به امكان حذف بيشتر سيگنال‌هاي مود مشترك، ‌مشكلات ناشي از اتصال زمين و تداخلهاي الكترومغناطيسي را كاهش مي‌دهد. گرچه در گيرنده ممكن است از متعادل كننده (Eq) استفاده شود، پيش از ارسال نبايد متعادل كننده‌اي وجود داشته باشد. كابل شيلددار به امپدانس Ω110 و در فركانس KHz 100 تا 128 برابر حداكثر نرخ فريم وصل مي‌شود.

در مورد مشخصات درايور خط بايد موارد مربوط به امپدانس خروجي (20% + Ω 110)، دامنه سيگنال (2 تا 7 ولت پيك تا پيك روي بار مقاومتي Ω 110 روي خروجي)، ‌بالانس‌بودن (لول مدهاي مشترك dB 30 زير سيگنال)، زمانهاي صعود و نزول (بين ns 5 تا ns30 روي بار Ω110 بين 10 تا 90 درصد دامنه)، جيتر خروجي واسط (‌مجموع جيتر ذاتي و جيتر مرجع زماني دستگاه)، جيتر ذاتي (زير ۰.۰۲۵ UI با فيلتر) و بهره جيتر، لحاظ شود.

درمورد مشخصات گيرنده خط بايد موارد مربوط به امپدانس ورودي (20 % + Ω 110) و توجه به موازي نكردن ورودي دو دستگاه بواسطه ايجاد مشكل تطبيق امپدانس و در نتيجه خطا روي سيگنال، حداكثر سيگنال ورودي (‌7 ولت پيك تا پيك که‌اين مقدار در استانداردهاي قبل بيشتر بوده است)، حداقل سيگنال ورودي (‌mV 200 نمودار چشمي با زماني معادل 2/1 زمان كلي)، متعادل‌سازي گيرنده (‌براي طول كابلهاي بيشتر از 100 متر و با توجه به حداقل و حداكثر سطح مجاز سيگنال ورودي)، ‌حذف حالت مشترك (‌بدون خطا با وجود 7 ولت پيك از فركانس تا KHz 20) و تلرانس جيتر گيرنده (از 10 تا Hz 200 حدود، UI 10، از 200 تا 8000 هرتز بطورخطي به ۰.۰۲۵ UI و از آن به بعد ثابت باقي ماند) ‌لحاظ شود.

كانكتور استاندارد مورد استفاده بايد ازنوع (‌كانن يا XLR سه پين)، براي خروجي از نوع نر و براي ورودي از نوع ماده بوده و در آنها پين 1 زمين يا شيلد كابل و پين 2و 3 سيگنال خواهد بود كه پلاريته سيگنال (مثبت يا منفي بودن) پينهاي 2 و 3 اهميتي ندارد.
استاندارد فوق، استاندارد فراگير در محيطهاي توليد و پخش صداي ديجيتال است. با اين وجود استانداردهاي ديگر نيز وجود دارد كه بواسطه عدم استفاده فراگير (حداقل در محيطهاي كاري ما) مورد بررسي قرار نگرفته‌اند.