یک مطالعه جدید هم نشان میدهد که شنوندگان دیگر نمیتوانند بهطور قابل اعتماد میان موسیقی ساختهشده توسط انسان و آهنگهایی که کاملا توسط هوش مصنوعی تولید شدهاند، تمایز قائل شوند.
به گزارش مجله اپل، این یافتهها نشان میدهد مدلهای یادگیری ماشین تا چه اندازه در بازآفرینی بیان موسیقایی، بافت صوتی و تونالیته احساسی پیشرفت کردهاند که این امر نگرانیهای فزایندهای را میان هنرمندان، پلتفرمهای استریم و نهادهای قانونگذار درباره مالکیت اثر، حق نشر و اصالت کار خلاقه ایجاد کرده است.
مرز باریک خلاقیت و تکنولوژی
این مطالعه که در چندین بازار بزرگ موسیقی انجام شد، از شرکتکنندگان خواست تشخیص دهند نمونههای صوتی پخششده توسط یک آهنگساز انسانی ساخته شدهاند یا توسط سیستمهای هوش مصنوعی تولید شدهاند؛ سیستمهایی که بر پایه پایگاههای عظیمی از دادههای صوتی دیجیتال آموزش دیدهاند. نتایج نشان داد که نرخ خطا بیش از ۸۰ درصد بوده است. یعنی بیشتر پاسخدهندگان قادر نبودند میان آهنگهای الگوریتمی و موسیقی سنتی تفاوتی تشخیص دهند.تلاشهای اولیه برای تولید موسیقی با ماشین اغلب به خاطر فقدان ظرافت مورد انتقاد قرار میگرفتند.
ملودیها تکراری، دینامیکها ثابت و پیشرفت احساسی تقریبا غایب بود. اما با ظهور مدلهای بزرگ تولیدکننده صوت، این وضعیت به سرعت تغییر کرد. این مدلها با استفاده از فرآیندهای دیفیوژن و توالیسازی عصبی، آهنگها را نُت به نُت میسازند و الگوهای هارمونیک آموختهشده را با تقلید سبکی در هم میآمیزند.
مدلهای امروزی، از جمله آنهایی که بر روی میلیونها قطعه دارای مجوز یا متعلق به قلمرو عمومی آموزش دیدهاند، قادرند تیمبر سازها، جملهبندیهای بیانی و حتی فضای محیطی را بازسازی کنند. حتی ناهنجاریها و نقصهایی که زمانی ویژگی منحصربهفرد اجرای انسانی شمرده میشد، اکنون توسط این مدلها بازتولید میشود. برخی سیستمها میتوانند یک قطعه کامل چندلایه تولید کنند؛ همراه با وکال و افکتهای تولیدی که بافت کار حرفهای استودیویی را تقلید میکند.
توانایی هوش مصنوعی در بازآفرینی عناصر ظریف انسانی از جمله نوسانات زمانی، عمق ریورب، و ناهنجاریهای تونال عامل مهمی در سردرگمی شنوندگان بوده است. آهنگهای استفادهشده در این آزمایش طیف گستردهای از ژانرها را شامل میشدند: از پیانوی کلاسیک و جَز گرفته تا پاپ و موسیقی الکترونیک. عملکرد هوش مصنوعی بهویژه در ژانرهای ساختارمند مانند EDM، امبینت و موسیقی متن ارکسترال بسیار قوی بوده است.
این یافتهها در زمانی منتشر میشوند که صنعت موسیقی با عدم قطعیت عمیقی روبهروست. شرکتهای نشر، پلتفرمهای استریم و نهادهای حقرسانی(collecting societies) در تلاشاند تعریف کنند که «تألیف اصیل» در دورانی که موسیقی میتواند در چند ثانیه بهصورت الگوریتمی ساخته شود، دقیقا چیست.
چند پلتفرم بزرگ استریم پیشاپیش سیستمهای برچسبگذاری محتوای هوش مصنوعی را اجرا کردهاند و برخی دیگر در حال سرمایهگذاری روی فناوری واترمارکگذاریاند تا بتوانند آثار مصنوعی را که در میان آپلودهای کاربران قرار میگیرد، شناسایی کنند. با این حال، چارچوبهای حقوقی همچنان پراکنده و نامنسجماند.
در بیشتر حوزههای قضایی، قوانین حق نشر خالقان غیرانسانی را به رسمیت نمیشناسند؛ بنابراین آثاری که بهطور خودکار توسط هوش مصنوعی تولید میشوند فاقد مالکیت مشخصاند. برخی دادگاهها حکم دادهاند که تنها فرایندهایی که در آن نقش انسان از طریق خلاقیت یا تصمیمهای ویرایشی قابل اثبات باشد، شایسته دریافت حمایت حقوقی هستند.
این ابهام، پرسشهای پیچیدهای برای موسیقیدانانی ایجاد میکند که از ابزارهای هوش مصنوعی در روند کار خود استفاده میکنند. برخی هنرمندان با مدلهای مولد مانند یک «سازِ همکار» رفتار میکنند. درحالیکه دیگران معتقدند موسیقی تولیدشده توسط هوش مصنوعی که بر پایه آثار انسانی آموزش دیده، خطر بازتولید بیجبران سبکهای هنری را به همراه دارد. ائتلافهای صنعتی در ایالات متحده و اروپا لابیهایی را برای وضع الزامات افشاگری آغاز کردهاند تا توزیعکنندگان را ملزم کنند آثار مصنوعی را بهطور صریح مشخص کنند.
در همین حال، پلتفرمهای استریم موسیقی تحت فشارند تا هجوم گسترده محتوای تولیدشده با هوش مصنوعی را مدیریت کنند. گزارشهایی وجود دارد که نشان میدهد روزانه دهها هزار آهنگ مصنوعی آپلود میشود؛ موضوعی که چالشهای نظارتی ایجاد کرده و بحثهایی را دربارهی نظامهای جبران منصفانه برای موسیقیدانان انسانی برانگیخته است.
نقطه عطف
با وجود جنجالها، گسترش تواناییهای خلاقانه هوش مصنوعی افقهای تازهای نیز برای آزمایش و نوآوری گشوده است. هنرمندان مستقل روزبهروز بیشتر از ابزارهای مولد برای طراحی صدا، تنظیم و کمک به آهنگسازی استفاده میکنند و اغلب خروجی الگوریتمی را با اجراهای شخصی خود ترکیب میکنند تا آثاری ترکیبی پدید آورند که مرز میان انسان و ماشین را محو میکنند.
شرکتهای بزرگ فناوری نیز بهطور فعال وارد این عرصه شدهاند. اوپنایآی، گوگل دیپمایند، متا و استبیلیتی هوش مصنوعی همگی سیستمهای تولید موسیقی را عرضه یا معرفی کردهاند که بر مجموعههای عظیم صداهای ضبطشده آموزش دیدهاند. این مدلها میتوانند قطعات سازی تولید کنند، خوانندگان را شبیهسازی کنند، یا بر اساس دستورهای متنی درباره حالت، تمپو یا احساس، قطعههای موجود را تغییر دهند.
دموکراتیزهشدن چنین ابزارهایی هم هیجان و هم نگرانی به همراه داشته است. از یک سو، خالقان اکنون به امکانات تولیدی دسترسی دارند که پیشتر فقط در اختیار استودیوهای بزرگ بود؛ و از سوی دیگر، سهولت تقلید میتواند بازار را اشباع کرده و یگانگی هنر انسانی را کمرنگ کند.
تحلیلگران صنعت معتقدند چالش اصلی نه در متوقفکردن موسیقی تولیدشده با هوش مصنوعی بلکه در بازتعریف مفهوم اصالت است. اینکه شنوندگان در عصری که هر صدا میتواند بهطور ریاضی بازتولید شود، «نیت»، «تألیف» و «ابتکار» را چگونه ارزشگذاری میکنند.
با پیشرفت مداوم هوش مصنوعی در درک ریتم، هارمونی و طنین احساسی، تمایز میان خلق انسانی و تولید الگوریتمی شاید برای مخاطبان کمتر اهمیت داشته باشد و در عوض، به موضوعی مرکزی برای چارچوبهای حقوقی و اخلاقی تبدیل شود که مالکیت خلاقانه را تعریف میکنند. نتیجه این نظرسنجی روشن و قطعی است: از نظر ملودی، حالوهوا و بافت صوتی، هوش مصنوعی از آستانه ادراکی عبور کرده است. آنچه زمانی کنجکاوی فنی به شمار میرفت، اکنون به بازیگری نامرئی در موسیقی معاصر بدل شده است.
بازیگری که مینویسد، تقلید میکند و حتی گاه از دست هنرمند انسانی که زمانی تعریفکننده صدای هنر بود، قابل تشخیص نیست. این تحول، پرسشهای بنیادی درباره خلاقیت، اصالت و آینده صنعت موسیقی ایجاد کرده است و شاید تنها نکته مسلم این باشد که در دنیای موسیقی قرن بیستویکم، انسان و ماشین هر دو نقشآفرینانی جدی هستند و مرزهای بین آنها روزبهروز محوتر میشود.









