MusicLM گوگل برای عموم؛ هوش مصنوعیِ آهنگساز!
MusicLM در ژانویهٔ سال ۲۰۲۳ معرفی شد و اکنون بعد از کشوقوسهای فراوان، این ابزار هوش مصنوعی از طریق وبسایت AI Kitchen Test گوگل در دسترس عموم قرار داده شدهاست.
همانطور که در این خبر به آن اشاره کردیم، غول جستوجوی اهل سیلیکانولی، ابتدای سال جاری میلادی از یک مدل زبانی بزرگ مخصوص تولید موسیقی رونمایی کرد. مدل زبانی MusicLM شباهت زیادی به سایر مدلهای زبانی مولد دارد و دقیقن از همان مکانیزم پردازش زبان طبیعی (متن ورودی) برای تولید نتایج مورد نظر کاربر استفاده میکند.
گوگل در ژانویهٔ امسال، مقالهٔ علمی را تحت عنوان “MusicLM: Generating Music From Text” منتشر کرد.
همانطور که از عنوان مقالهٔ مذکور بر میآید، گمانهزنیهایی راجع به توسعهٔ ابزاری برای تبدیل متن به موسیقی پیرامون این مقاله شکل گرفتهبود. کمپانی گوگل در آن زمان علاوه بر مقاله، تعداد بسیار زیادی نمونهٔ صوتی که با استفاده از این مدل زبانی تولید شدهبودند را ارائه کردهبود اما خبری از دمو یا ابزار آنلاینی برای تست و ارزیابی توسط کاربران و محققان نبود.
خوشبختانه این هفته – و پس از برگزاری رویداد Google I/O – اهالی سیلیکانولی بالأخره ابزار هیجانانگیزشان را در اختیار علاقهمندان به هوش مصنوعی و موسیقی قرار دادند. با توجه به اینکه مدلهای زبانی هنوز در مرحلهٔ توسعه و بهبود هستند، همهٔ آنها در فاز آزمایشی به سر میبرند و در واقع نسخهٔ پیشنمایش(Preview) آنها در دسترس عموم قرار داده شدهاست.
MusicLM هم از این قاعده مستثنی نیست و برای استفاده از آن، میبایستی از طریق ثبتنام در وبسایت AI Test Kitchen، وارد لیست انتظار شوید (چیزی شبیه به آنچه در مورد چتبات Bard و موتور جستوجوی Bing اتفاق افتاد.).
هرچند ما هنوز موفق نشدهایم به این سرویس جذاب و وسوسهبرانگیز دسترسی پیدا کنیم اما با دیدن دموی منتشرشده توسط [یوتیوبر معروف] Mike Russell و همچنین بررسی توییتهای مربوط به MusicLM، متوجه قدرت خارقالعادهٔ این مدل زبانی شدهایم.
بر اساس تجربیات کاربرانی که از MusicLM استفاده کردهاند، این مدل زبانی میتواند صداهای ساده یا حتا کل یک قطعهٔ موسیقی را تولید کند اما به شرطی که دستورات کاربر، دقیق و با جزئیات بالا باشند.
به نظر میرسد ماهیت اصلی مدلهای زبانی، همین است؛ یعنی برای دستیابی به بهترین نتایج ممکن، ابتدا باید بلد باشیم درخواستِ درستی از آن داشتهباشیم 🙂 از آنجا که MusicLM یک مدل زبانی است و تمام مدلهای زبانی قادر به درک زبان طبیعی انسانها هستند، MusicLM میتواند موسیقیهایی را بر اساس مود، شرایط، هنرمند مورد نظر، ژانر و … تولید کند.
برای مثال، میتوانید از آن بخواهید یک موسیقی مخصوص مطالعه یا انجام تکالیف دانشگاه برایتان تولید کند. یا مثلن به او بگویید یک قطعهٔ کلاسیک که برای ساز پیانو نوشته شدهاست را در سبک راک و با نوازندگی Slash برایتان تولید کند.
خلاصه اینکه مدلهایی شبیه MusicLM و امثال آن، هیچ محدودیتی ندارند و این شما هستید که با دستورات خلاقانهتان، به آنها میگویید که چه کاری باید برایتان انجام دهند 🙂
یکی از نکات جالب راجع به MusicLM، دریافت فیدبک کاربران و بهبود خود از طریق بازخوردهاست. مدل زبانی موسیقی گوگل برای تحقق این هدف، بهازای هر دستور ورودی، ۲ کلیپ صوتی تولید میکند و از کاربر میخواهد تا با انتخاب کلیپ مورد نظرش، دقت تولید اصواتی که تولید میکند را افزایش دهد.
از این گذشته، هربار که از MusicLM میخواهید یک قطعهٔ صوتی برایتان تولید کند، این ابزار واقعن یک کلیپ صوتی جدید و منحصربهفرد تولید میکند و مانند Jukebox – که گاهی اوقات اصوات تکراری و مشهور را به عنوان اصوات تولیدشده توسط هوش مصنوعی به کاربر ارائه میداد – از اصوات موجود در اینترنت استفاده نمیکند.
با توجه به اینکه از زمان معرفی ابزارهای هوش مصنوعی مولدِ متن، تصویر، ویدیو و … ، نگرانیهای زیادی راجع به مسائل کپیرایت، گریبانگیر این سرویسها و پلتفرمها شدهاست، این قابلیت را میتوان برگ برندهٔ گوگل در نظر گرفت.
https://youtu.be/IwtXUcbs7aI
در ویدیوی تبلیغاتی جدید گوگل برای مدل زبانی MusicLM، یک کارگاه هنری را در آزمایشگاههای فرهنگ و هنر گوگل (موسوم به Google Art & Culture) میبینیم. سپس Freya Murray مدیر برنامههای گوگل، سخنانی راجع به MusicLM ایراد میکند:
“همهٔ ما هنرمندان را به واسطهٔ تلاش بیوقفهشان برای آفرینش آثار منحصربهفرد و استفادهٔ خلاقانه از ابزارهای موجود میشناسیم. من MusicLM را نسخهٔ تکاملیافتهٔ آن میدانم.”.
Simon Doury از بخش Google Artist in Residence – که تمام پروژههای علمی-هنری گوگل در آن توسعه مییابد – MusicLM را ابزاری برای همکاری با هنرمندان میداند و در این باره میگوید:
“فرض کنید شما خواننده یا نوازندهٔ گیتار هستید و میخواهید قسمتی از موسیقیتان را مخصوص ساز پیانو بنویسید اما نوازندگی آن را بلد نیستید! اکنون با استفاده از MusicLM و نوشتن دستوراتی برای تولید قطعات صوتی مورد نیازتان، میتوانید از این مدل زبانی هوش مصنوعی به عنوان همکار و دستیارتان استفاده کنید.
بگذارید مثال دیگری بزنم؛ فرض کنید درامر هستید و میخواهید با پخش یک بکینگترک خوب، تمریناتتان را انجام دهید. با وجود MusicLM، دیگر لازم نیست وقت خود را برای پیداکردن موزیسینها یا بکینگترکهای بیکیفیت هدر دهید و تنها با نوشتن دستورات متنی واضح و مشخص، میتوانید بهترین بکینگترک ممکن را از هوش مصنوعی تحویل بگیرید.”.
اگر اخبار تکنولوژی را دنبال کردهباشید، حتمن میدانید که با پیشرفت سهمگین، حیرتآور و سریع ابزارهای هوش مصنوعی مخصوص تولید آثار هنری بصری (یعنی تصویر، نقاشی، مدل سهبعدی و …) بسیاری از هنرمندان کوچک و بزرگ علیه این ابزارها موضعگیری کردند و در مواردی، کمپانیهای توسعهدهندهٔ این ابزارها را به سرقت ادبی و سواستفاده از آثار هنری کپیرایتدار متهم کردند.
دلیل اصلی این امر، نگرانی ما انسانها بابت ازدستدادن شغل و منبع درآمدمان است. طبیعتن هیچیک از ما دلش نمیخواهد حقوق مادیاش را از دست بدهد و روزبهروز فقیرتر و ضعیفتر شود.
اکنون با معرفی MusicLM، موزیسینها هم به صف مخالفین هوش مصنوعی مولد اضافه شدهاند و نگرانی عمیقشان بابت نابودشدن آیندهٔ کاری خود را ابزار کردهاند.
هرچند گوگل در رونمایی رسمی از MusicLM صحبتی راجع به سیاستهای محافظت از هنرمندان و آثار ادبی به زبان نیاورد اما در بیانیهای که در وبلاگ خود منتشر کرده، ادعا میکند که این ابزارها و فناوریهای حیرتآور، نهتنها حرفه و مشاغل هنرمندان را به خطر نمیاندازد، بلکه هنرمندان با استفاده از این ابزارها میتوانند خلاقیت خود را پرورش داده و آثار هنری خاصتر و پیچیدهتری خلق کنند.
غول جستوجوی اینترنت از این بیانیه به عنوان «تعهد به نوآوری مسئولانه» یاد کردهاست. اهالی سیلیکانولی ادعا میکنند که MusicLM بر اساس دستورالعملهای داخلی کمپانی و با رعایت اصل نوآوری مسئولانه توسعه یافتهاست.
طبق ادعای یکی از دانشمندان و محققان شناختهشده به نام Neil Zeghidour، مهمترین مسئله برای گوگل، استفادهٔ هنرمندان از این فناوری و کشف راههای جدید برای تولید اصواتی غیر ممکن و هیجانانگیز است.
اگر شما هم مثل ما شیفتهٔ این مدل زبانی قدرتمند و خارقالعاده هستید و دوست دارید هرچه سریعتر از آن استفاده کنید، بایستی با ثبتنام در وبسایت AI Kitchen Test، مدتی در لیست انتظار قرار بگیرید و در نهایت، به این سرویس وسوسهبرانگیز دسترسی پیدا کنید.
https://youtu.be/g6FRkAbZPQo