MusicLM گوگل برای عموم؛ هوش مصنوعیِ آهنگ‌ساز!

MusicLM در ژانویهٔ سال ۲۰۲۳ معرفی شد و اکنون بعد از کش‌وقوس‌های فراوان، این ابزار هوش مصنوعی از طریق وب‌سایت AI Kitchen Test گوگل در دسترس عموم قرار داده شده‌است.

همان‌طور که در این خبر به آن اشاره کردیم، غول جست‌وجوی اهل سیلیکان‌ولی، ابتدای سال جاری میلادی از یک مدل زبانی بزرگ مخصوص تولید موسیقی رونمایی کرد. مدل زبانی MusicLM شباهت زیادی به سایر مدل‌های زبانی مولد دارد و دقیقن از همان مکانیزم پردازش زبان طبیعی (متن ورودی) برای تولید نتایج مورد نظر کاربر استفاده می‌کند.

گوگل در ژانویهٔ امسال، مقالهٔ علمی را تحت عنوان “MusicLM: Generating Music From Text” منتشر کرد.

همان‌طور که از عنوان مقالهٔ مذکور بر می‌آید، گمانه‌زنی‌هایی راجع به توسعهٔ ابزاری برای تبدیل متن به موسیقی پیرامون این مقاله شکل گرفته‌بود. کمپانی گوگل در آن زمان علاوه بر مقاله، تعداد بسیار زیادی نمونهٔ صوتی که با استفاده از این مدل زبانی تولید شده‌بودند را ارائه کرده‌بود اما خبری از دمو یا ابزار آنلاینی برای تست و ارزیابی توسط کاربران و محققان نبود.

خوش‌بختانه این هفته – و پس از برگزاری رویداد Google I/O – اهالی سیلیکان‌ولی بالأخره ابزار هیجان‌انگیزشان را در اختیار علاقه‌مندان به هوش مصنوعی و موسیقی قرار دادند. با توجه به این‌که مدل‌های زبانی هنوز در مرحلهٔ توسعه و بهبود هستند، همهٔ آن‌ها در فاز آزمایشی به سر می‌برند و در واقع نسخهٔ پیش‌نمایش(Preview) آن‌ها در دسترس عموم قرار داده شده‌است.

MusicLM هم از این قاعده مستثنی نیست و برای استفاده از آن، می‌بایستی از طریق ثبت‌نام در وب‌سایت AI Test Kitchen، وارد لیست انتظار شوید (چیزی شبیه به آن‌چه در مورد چت‌بات Bard و موتور جست‌وجوی Bing اتفاق افتاد.).

هرچند ما هنوز موفق نشده‌ایم به این سرویس جذاب و وسوسه‌برانگیز دسترسی پیدا کنیم اما با دیدن دموی منتشرشده توسط [یوتیوبر معروف] Mike Russell و هم‌چنین بررسی توییت‌های مربوط به MusicLM، متوجه قدرت خارق‌العادهٔ این مدل زبانی شده‌ایم.

بر اساس تجربیات کاربرانی که از MusicLM استفاده کرده‌اند، این مدل زبانی می‌تواند صداهای ساده یا حتا کل یک قطعهٔ موسیقی را تولید کند اما به شرطی که دستورات کاربر، دقیق و با جزئیات بالا باشند.

به نظر می‌رسد ماهیت اصلی مدل‌های زبانی، همین است؛ یعنی برای دستیابی به به‌ترین نتایج ممکن، ابتدا باید بلد باشیم درخواستِ درستی از آن داشته‌باشیم 🙂 از آن‌جا که MusicLM یک مدل زبانی است و تمام مدل‌های زبانی قادر به درک زبان طبیعی انسان‌ها هستند، MusicLM می‌تواند موسیقی‌هایی را بر اساس مود، شرایط، هنرمند مورد نظر، ژانر و … تولید کند.

برای مثال، می‌توانید از آن بخواهید یک موسیقی مخصوص مطالعه یا انجام تکالیف دانشگاه برایتان تولید کند. یا مثلن به او بگویید یک قطعهٔ کلاسیک که برای ساز پیانو نوشته شده‌است را در سبک راک و با نوازندگی Slash برایتان تولید کند.

خلاصه این‌که مدل‌هایی شبیه MusicLM و امثال آن، هیچ محدودیتی ندارند و این شما هستید که با دستورات خلاقانه‌تان، به آن‌ها می‌گویید که چه کاری باید برایتان انجام دهند 🙂

یکی از نکات جالب راجع به MusicLM، دریافت فیدبک کاربران و بهبود خود از طریق بازخوردهاست. مدل زبانی موسیقی گوگل برای تحقق این هدف، به‌ازای هر دستور ورودی، ۲ کلیپ صوتی تولید می‌کند و از کاربر می‌خواهد تا با انتخاب کلیپ مورد نظرش، دقت تولید اصواتی که تولید می‌کند را افزایش دهد.

از این گذشته، هربار که از MusicLM می‌خواهید یک قطعهٔ صوتی برایتان تولید کند، این ابزار واقعن یک کلیپ صوتی جدید و منحصربه‌فرد تولید می‌کند و مانند Jukebox – که گاهی اوقات اصوات تکراری و مشهور را به عنوان اصوات تولیدشده توسط هوش مصنوعی به کاربر ارائه می‌داد – از اصوات موجود در اینترنت استفاده نمی‌کند.

با توجه به این‌که از زمان معرفی ابزارهای هوش مصنوعی مولدِ متن، تصویر، ویدیو و … ، نگرانی‌های زیادی راجع به مسائل کپی‌رایت، گریبان‌گیر این سرویس‌ها و پلتفرم‌ها شده‌است، این قابلیت را می‌توان برگ برندهٔ گوگل در نظر گرفت.

https://youtu.be/IwtXUcbs7aI

در ویدیوی تبلیغاتی جدید گوگل برای مدل زبانی MusicLM، یک کارگاه هنری را در آزمایشگاه‌های فرهنگ و هنر گوگل (موسوم به Google Art & Culture) می‌بینیم. سپس Freya Murray مدیر برنامه‌های گوگل، سخنانی راجع به MusicLM ایراد می‌کند:

“همهٔ ما هنرمندان را به واسطهٔ تلاش بی‌وقفه‌شان برای آفرینش آثار منحصربه‌فرد و استفادهٔ خلاقانه از ابزارهای موجود می‌شناسیم. من MusicLM را نسخهٔ تکامل‌یافتهٔ آن می‌دانم.”.

Simon Doury از بخش Google Artist in Residence – که تمام پروژه‌های علمی-هنری گوگل در آن توسعه می‌یابد – MusicLM را ابزاری برای همکاری با هنرمندان می‌داند و در این باره می‌گوید:

“فرض کنید شما خواننده یا نوازندهٔ گیتار هستید و می‌خواهید قسمتی از موسیقی‌تان را مخصوص ساز پیانو بنویسید اما نوازندگی آن را بلد نیستید! اکنون با استفاده از MusicLM و نوشتن دستوراتی برای تولید قطعات صوتی مورد نیازتان، می‌توانید از این مدل زبانی هوش مصنوعی به عنوان هم‌کار و دست‌یارتان استفاده کنید.

بگذارید مثال دیگری بزنم؛ فرض کنید درامر هستید و می‌خواهید با پخش یک بکینگ‌ترک خوب، تمرینات‌تان را انجام دهید. با وجود MusicLM، دیگر لازم نیست وقت خود را برای پیداکردن موزیسین‌ها یا بکینگ‌ترک‌های بی‌کیفیت هدر دهید و تنها با نوشتن دستورات متنی واضح و مشخص، می‌توانید به‌ترین بکینگ‌ترک ممکن را از هوش مصنوعی تحویل بگیرید.”.

اگر اخبار تکنولوژی را دنبال کرده‌باشید، حتمن می‌دانید که با پیش‌رفت سهمگین، حیرت‌آور و سریع ابزارهای هوش مصنوعی مخصوص تولید آثار هنری بصری (یعنی تصویر، نقاشی، مدل سه‌بعدی و …) بسیاری از هنرمندان کوچک و بزرگ علیه این ابزارها موضع‌گیری کردند و در مواردی، کمپانی‌های توسعه‌دهندهٔ این ابزارها را به سرقت ادبی و سواستفاده از آثار هنری کپی‌رایت‌دار متهم کردند.

دلیل اصلی این امر، نگرانی ما انسان‌ها بابت ازدست‌دادن شغل و منبع درآمدمان است. طبیعتن هیچ‌یک از ما دلش نمی‌خواهد حقوق مادی‌اش را از دست بدهد و روزبه‌روز فقیرتر و ضعیف‌تر شود.

اکنون با معرفی MusicLM، موزیسین‌ها هم به صف مخالفین هوش مصنوعی مولد اضافه شده‌اند و نگرانی عمیق‌شان بابت نابودشدن آیندهٔ کاری خود را ابزار کرده‌اند.

هرچند گوگل در رونمایی رسمی از MusicLM صحبتی راجع به سیاست‌های محافظت از هنرمندان و آثار ادبی به زبان نیاورد اما در بیانیه‌ای که در وب‌لاگ خود منتشر کرده، ادعا می‌کند که این ابزارها و فناوری‌های حیرت‌آور، نه‌تنها حرفه و مشاغل هنرمندان را به خطر نمی‌اندازد، بلکه هنرمندان با استفاده از این ابزارها می‌توانند خلاقیت خود را پرورش داده و آثار هنری خاص‌تر و پیچیده‌تری خلق کنند.

غول جست‌وجوی اینترنت از این بیانیه به عنوان «تعهد به نوآوری مسئولانه» یاد کرده‌است. اهالی سیلیکان‌ولی ادعا می‌کنند که MusicLM بر اساس دستورالعمل‌های داخلی کمپانی و با رعایت اصل نوآوری مسئولانه توسعه یافته‌است.

طبق ادعای یکی از دانش‌مندان و محققان شناخته‌شده به نام Neil Zeghidour، مهم‌ترین مسئله برای گوگل، استفادهٔ هنرمندان از این فناوری و کشف راه‌های جدید برای تولید اصواتی غیر ممکن و هیجان‌انگیز است.

اگر شما هم مثل ما شیفتهٔ این مدل زبانی قدرت‌مند و خارق‌العاده هستید و دوست دارید هرچه سریع‌تر از آن استفاده کنید، بایستی با ثبت‌نام در وب‌سایت AI Kitchen Test، مدتی در لیست انتظار قرار بگیرید و در نهایت، به این سرویس وسوسه‌برانگیز دسترسی پیدا کنید.

https://youtu.be/g6FRkAbZPQo

منبع www.musicradar.com
عضویت در خبرنامه تهران ملودی
عضو خبرنامه ما شوید و مطالب و پیشنهادات ویژه ما را در ایمیل خود دریافت کنید.
نگران نباشید! هر زمان مایل باشید می‌توانید عضویت خود را لغو کنید.
ارسال نظر

آدرس ایمیل شما منتشر نخواهد شد.