همه چیز درباره ی Normalization

۷ مهر, ۱۴۰۱

خیلی از افراد به ظاهر متخصصی که در فروم های آنلاین فعالیت می کنند به شما خواهند گفت که انجام normalization حرکتی آماتوری است و شما هیچگاه نباید آن را انجام دهید. عده ای دیگر به شما می گویند normalization ابزاری با ارزش و کارآمد است. کدام حرف درست است؟

مانند هر بُعد دیگری در دنیای صدا – هر دو گفته درست هستند. در ادامه سعی می کنیم ابهاماتی که در این رابطه وجود دارد را برطرف کنیم.

Normalization چیست؟

دو نوع normalization وجود دارد – پیک (peak) و میانگین (average). Peak normalization لِول ماکسیمم (پیک) فایل صوتی را شناسایی می کند و سپس آن را بر حسب لِول پیک هدف بالا یا پایین می برد. لِول پیک هدف معمولا 0dBFS است (ماکسیمم مقدار موجود) اما می تواند لِول متفاوتی هم داشته باشد، مانند 6dB پایین تر از مقدار ماکسیمم. Average normalization لِول میانگین فایل صوتی را شناسایی می کند و مشابه Peak normalization لِول آن را بر حسب لِول پیک هدف بالا یا پایین می برد.

تفاوت بین لِول پیک و میانگین چیست؟

کمپانی Shure مقایسه ی جالبی انجام داده است: ارتفاع میانگین رشته کوه های هیمالیا 5,486,40 متر است اما قله ی کوه اورست 8,848,04 متر می باشد. مترهای VU میانگین لِول سیگنال را نشان می دهند و به همین خاطر است که برخی صداهای کوبه ای در این نوع متر شدت بالایی را نشان نمی دهند، حتی اگر این سیگنال دیستورت شود.

گوش انسان تمایل دارد به این که شدت صدا را بر اساس لِول میانگین سیگنال و نه لِول پیک درک کند. برای مثال، یک صدای کوبه ای که سریع محو می شود لِول پیک بالایی خواهد داشت، اما لِول میانگین آن کم خواهد بود، پس در کل صدای آن برای گوش ما چندان بلند نخواهد بود. در طرف دیگر، یک پاور کورد دیستورت شده ی گیتار 0 که تقریبا همیشه لِول آن در حد ماکسیمم است – شاید پیک لِول مشابهی با صدای کوبه ای ما داشته باشد، اما به دلیل این که لِول میانگین بالاتری دارد، صدای بلندتری خواهد داشت. بسیاری از نرم افزارهای آهنگسازی مترهایی را به کاربران ارائه می دهند که هم لِول پیک و هم لِول میانگین را نمایش می دهند (تصویر 1). این مطلب روی peak normalization تمرکز خواهد داشت.

تصویر 1: مترهای لِول نرم افزار Magix Samplitude حالت میانگین را به شکل میله های پهن و پیک ها را به شکل میله های باریکی در قسمت خارجی نمایش می دهند. دو خط زردی که با رنگ آبی دورشان خط کشیده شده است، پیک ماکسیممی که سیگنال از خود به جای گذاشته است را نمایش می دهند.

آیا normalization کیفیت صدا را کاهش می دهد؟

افرادی هستند که می گویند normalization می تواند کیفیت صدا را کاهش دهد؛ بله، حقیقتا امکان چنین چیزی وجود دارد – اگر یک ماشین زمان بسازید و به اواسط دهه ی 1980 سفر کنید و پردازش هایتان را با Sound Designer روی یک Mac Plus انجام دهید چنین اتفاقی خواهد افتاد. در آن دوران که موتورهای صوتی 16 بیتی بودند، عملا هر نوع پردازشی می توانست منجر به کاهش کیفیت صدا شود، چرا که برخی عملیات، اعداد دیجیتالی که نمایشگر صدا بودند را گرد می کردند. اگر پردازش های زیادی انجام می دادید، این خطاها می توانستند روی هم انباشته شوند و در نهایت صدا را تغییر دهند. با موتورهای صوتی رزولوشن-بالای امروزی (برای مثال 32-bit floating point) دیگر چنین مشکلی وجود ندارد. این موتورها به راحتی می توانند اعداد بزرگ را محاسبه کنند.

آیا normalization نسبت سیگنال به نویز فایل صوتی را تغییر نمی دهد؟

خیر. Normalization متفاوت از بالا بردن کنترل ولوم نیست. اگر کمینه ی نویز (نویز فلور) یک فایل صوتی ‑88dB و پیک آن -12dB باشد، اعمال peak normalizing به -6dB باعث می شود همه چیز 6dB بلندتر شود؛ نویز فلور به -82dB و پیک به -6dB خواهد رسید. پس اگرچه نویز فلور به مقدار 6dB بالاتر آمده است، اما نسبت سیگنال به نویز تغییری نکرده است.

آیا می توان ترک ها را در پروژه های مالتی ترک normalize کرد؟

این موضوع پیچیده تر می شود، چرا که مواقعی خواهد بود که این کار مفید است و در مواقع دیگر این کار مناسب نخواهد بود. بزرگ ترین معضل زمانی پیدا می شود که شما gain staging را به شکل مناسبی انجام ندهید – که مشکلات خودش را نیز به همراه خواهد داشت – چون به حد ماکسیمم رساندن صدا می تواند پیامدهای موج داری در زنجیره ی پلاگین ها ایجاد کند.

اما از طرفی normalization می تواند برای تغذیه کردن پلاگین ها با یک لِول ورودی پایدار مفید باشد. برای مثال شاید در فروم ها ببینید که افرادی می گویند اگر قرار است از پلاگین های داینامیک استفاده کنید، هیچ وقت نباید از normalization استفاده کنید و در عوض باید کنترل ورودی افکت را بالا ببرید. اما حقیقت این است که بین این دو کار هیچ تفاوتی وجود ندارد – هر دو لِول ورودیکه به پردازنده ی داینامیک می رسد را افزایش می دهند.

در حالت ایده آلی شما باید طوری صداها را ضبط کنید که لِول پایداری داشته باشند، پس استفاده از normalization برای این کار قابل بحث است. اما با این حال شاید خیلی وقت ها چنین شرایط ایده آلی وجود نداشته باشد.

Normalize کردن وکال به صورت بخش به بخش – آیا موثر است؟

شما قرار نیست همیشه 0Db را هدق قرار دهید، بلکه هر لِولی می تواند هدف normalize شما باشد. معمولا در وکال ها برخی عبارات لِول کمتر یا بیشتری نسبت به دیگر عبارات دارند. با جداسازی این عبارات و normalize کردن آن ها به یک لِول هدف (یعنی مشابه با باقی پارت وکال) شما می توانید لِول هموارتری داشته باشید که باعث می شود نیاز به استفاده ی شدید از پردازشگرهای داینامیک پیدا نکنید (تصویر 2). قطعا وکال ها داینامیک هایی طبیعی دارند که نباید آن ها را تغییر داد – پس به گوش هایتان اعتماد کنید. لِول ها را تنها در جایی تنظیم کنید که نیاز به تغییر دارند و مترها یا تصویر موج های صوتی شاید چنین چیزی را به شما نشان ندهد.

تصویر 2: تصویر بالا از نرم افزار Studio One است که وکال را پیش از normalize شدن برخی عبارت ها نشان می دهد. تصویر پایین وکال را پس از normalize شدن دستی عبارات به یک لِول مشخص نشان می دهد.

مواقعی که نباید صدا را normalize کرد چطور؟

بیشتر مترهای خروجی دیجیتال لِول سمپل های دیجیتال را اندازه گیری می کنند. پس اگر سمپل مقدار 0 را نشان دهد (یعنی حالتی که تمام چراغ های LED در متر، به جز چراغ قرمز، روشن می شوند) و شدت سیگنال به ناحیه ی قرمز و دیستورت شده نرسد مشکلی وجود ندارد، درست است؟ خیر، لزوما این طور نیست. پس از این که این صدا از فیلتر مبدل دیجیتال به آنالوگ عبور می کند، قوس بازتولید شده ی بین مقادیر سمپل می تواند لِول بالاتری را تولید کند که اگر شما پیش از آن از تمام ظرفیت هدروم استفاده کرده باشید به مشکل خواهید خورد

پس از این، صدا به فیلتر مبدل دیجیتال به آنالوگ هدایت می شود، قوس بین مقادیر سمپل ها می تواند لِول بالاتری ایجاد کند که اگر پیش از آن با محدودیت های هدروم مواجه شده باشید این شدت سیگنال در سخت افزار آنالوگ شما مشکل ساز خواهد شد (تصویر 3). صدایی که در 0 (یا پایین تر از آن) ایمن و بدون مشکل به نظر می رسد، می تواند تا 3dB بالاتر از هدروم ماکسیمم خروجی آنالوگ باشد و این موضوع می تواند باعث به وجود آمدن دیستورشن های واضحی در صدا شود.شاید این یکی از دلایلی باشد که برخی افراد حس می کنند رزولوشن 96kHz صدای بهتری دارد، چون زمانی که سمپل ها به یکدیگر نزدیک تر باشند، فرض بر این است که احتمال به وجود آمدن دیستورشن اینتر سمپل کاهش می یابد (البته این موضوع ثابت نشده است).

تصویر 3: موج صدای آنالوگ در تصویر A سمپل شده است، سپس در تصویر B لِول صدای دیجیتال تا ماکسیمم هدروم موجود بالا آمده است و در تصویر C پس از عبور از smoothing filter، که موج آنالوگ را بازسازی می کند، سیگنال خروجی از هدروم آنالوگ موجود تجاوز کردده است.

A: صدای اصلی که سمپل شده است

B: شدیدترین لِول سمپل تا 0dB بالا آمده است

C: پس از عبور از smoothing filter، سیگنال از 0dB تجاوز می کند

راه حل شناسایی این نوع دیستورشن، استفاده از مترهای True Peakاست که دیستورشن اینتر سمپل را هم بررسی می کنند (تصویر 4). نگاه کردن به یک متر خروجی که هم سنجش عادی و هم سنجش True Peak باشد می تواند نکات مفیدی را برای شما روشن کند، چرا که خواهید فهمید 0dB آن چیزی نیست که تا حال فکر می کردید.

تصویر 4: قسمت تجزیه و تحلیل پنجره ی Project در نرم افزار Studio One سنجش های True Peak را نمایش می دهد (که با رنگ زرد دور آن خط کشیده شده است). در این مورد، خروجی ما وقتی از فیلتر مبدل دیجیتال به آنالوگ عبور می کند تقریبا یک دسی بل بالاتر از 0 خواهد بود.

استفاده از Normalization برای یکدست کردن لِول قطعات مختلف یک آلبوم چطور؟

چنین چیزی از اصل اشتباه است، چرا که اگرچه دو قطعه ممکن است لِول پیک مشابهی داشته باشند، اما قطعه ای که لِول میانگین بالاتری دارد صدای بلندتری خواهد داشت. در حقیقت تکنولوژی پشت loudness war (تمایل به هرچه بلندتر ساختن صدای قطعات با استفاده از limiting و maximization) روی بالا بردن لِول میانگین تمرکز دارد از رسیدن پیک ها به نقطه ی دیستورشن جلوگیری می کند. Normalize کردن لِول پیک ها به شکل قابل ملاحظه ای با loudness war ارتباط پیدا نمی کند.

Normalize کردن لِول میانگین می تواند ابزار مفیدی برای در کنار هم قرار دادن قطعات یک آلبوم باشد، چون شما قطعات را با بلندی صدای مشابهی خواهید شنید و به این ترتیب می توانید تغییرات لازم برای این که قطعات با بلندی صدای مشابهی به گوش مخاطب برسند انجام دهید (و در عین حال مطمئن شوید لِول آن ها از هدروم موجود تجاوز نکند).

علیرغم باور عموم، Normalize کردن بر حسب لِول پیک می تواند برای عرضه ی آلبوم روی CD مفید باشد. از آنجایی که مقدار True Peak نباید بالاتر از 0 برود، اگر تمام قطعات را بر حسب True Peak صفر Normalize کنید، مطمئن خواهید شد که صدای آرام ترین قطعه ی آلبوم تا جای ممکن بالا آمده است و صدای آن در بلندترین حالت ممکن به گوش خواهد رسید. در این مرحله، می توانید لِول قطعاتی که صدای بلندتری دارند را پایین بیاورید تا با قطعات آرام تر آلبوم تناسب پیدا کنند.

با این حال در دنیای استریمینگ امروزه، قوانین تغییر یافته اند، چون سرویس های استریم موسیقی لِول موزیک ها را بر حسب مقیاس LUFS تنظیم می کنند. اگر با این عبارت آشنا نیستید پیشنهاد می کنیم مقاله ی دیگری که در وبلاگ تهران ملودی با نام “LUFS چیست و چرا اهمیت دارد” منتشر شده را مطالعه کنید. خلاصه ی مطلب این است که شما می توانید صدا را بر حسب نوع داینامیک هایی که می خواهید بشنوید مستر کنید و نتیجه ی نهایی در سوریس های استریم موسیقی صدای بلندتر یا آرام تری نخواهد داشت و در حقیقت بلندی صدای قطعه ی شما با موزیک های دیگری که در هر سوریس استریمینگ وجود دارد برابر خواهد بود.

به هر حال مهم است به یاد داشته باشید که normalization یک ابزار است. مانند هر ابزار دیگری نتیجه ای که با آن به دست می آید به نحوه ی استفاده ی شما بستگی دارد. از استفاده از normalization نترسید اما بیخود و بی جهت هم از آن استفاده نکنید. همان طور که در ابتدای متن گفته شد، هم استفاده از آن می تواند مفید باشد و هم استفاده نکردن از آن؛ مادامی که برای هر کار ابزار مناسب خودش را استفاده کنید مشکلی برایتان پیش نخواهد آمد.

منبع sweetwater

ضبط میکس و مسترینگ