“این فریادهای لعنتی است!” دنیای وهم آور هوش مصنوعی موسیقی deepfake

Category: دسته‌بندی نشده | No comments

‘وقت کریسمس است! وقت وان آب داغ است! ” آواز فرانک سیناترا است. حداقل ، شبیه او است. با یک چرخش آسان ، بوهومی شاد و شکوفه های برنجی و رشته ای کم اهمیت ، این می تواند به عنوان یک نسخه نمایشی از دست رفته Sinatra عبور کند. حتی صدا – آن لحن غنی که قبلاً “همه لگاتو و پشیمانی ها” توصیف شده بود – بسیار آشنا است ، حتی اگر بین کلیدها لنگ بزند و گاهی اوقات به نظر می رسد در پایین استخر شنیده شده است.

آهنگ مورد بحث یک آهنگ اصلی نیست ، بلکه یک جعلی قانع کننده است که توسط “شرکت تحقیق و استقرار” OpenAI ایجاد شده است ، پروژه Jukebox که از آن استفاده از هوش مصنوعی برای تولید موسیقی ، همراه با متن ، در یک انواع ژانرها و سبک های هنرمند. همراه با Sinatra ، آنها کارهایی را انجام داده اند که به عنوان “deepfakes” از کیتی پری ، الویس ، سایمون و گارفونکل ، 2Pac ، سلین دیون و موارد دیگر شناخته می شوند. پس از آموزش مدل با استفاده از آهنگ های 1.2 میلی متری که از وب خالی شده اند ، متن کامل با متن و متادیتای مربوطه ، می تواند بر اساس هر آنچه که تغذیه می کنید ، صدای خام را به مدت چند دقیقه پخش کند. کوین یا دالی پرتون یا موتزارت را وارد کنید ، از انتهای دیگر تقریب خواهید گرفت.

“به عنوان یک مهندسی ، واقعاً چشمگیر است” ، می گوید دکتر متیو یی کینگ ، نوازنده الکترونیکی ، پژوهشگر و دانشگاهی در گلداسمیت. (OpenAI از مصاحبه خودداری کرد.) “آنها یک سیگنال صوتی را به مجموعه ای از واژگان موسیقی – اگر دوست دارید یک فرهنگ لغت – در سه لایه مختلف از زمان تجزیه می کنند ، به شما مجموعه ای از قطعات اصلی را می دهند که برای بازسازی موسیقی کافی است الگوریتم می تواند این قطعات را بر اساس محرکی که وارد می کنید ، مرتب کند. بنابراین ، به عنوان مثال برخی از الا فیتزجرالد را به آن بدهید ، و آن بخشهای مربوط به “فرهنگ لغت” را پیدا کرده و با هم ترکیب می کند تا در فضای موسیقی او چیزی ایجاد کند. “

قابل تحسین دستاورد فنی این است که ، در مورد برخی از نمونه ها ، به ویژه نمونه هنرمندانی که مدتهاست درگذشته اند ، چیز وحشتناکی وجود دارد – اشباح غمگین در دستگاه گم شده ، کلیشه های پیش پا افتاده و غر زدن. “جیغ های لعنتی” در زیر یک نمونه از این نمونه سیناترا آمده است: “SOUNDS FUCKING DEMONIC” یکی دیگر را می خواند. ما در دره Uncanny پایین هستیم.

موسیقی Deepfake قرار است برای صنعت موسیقی پیام های گسترده ای داشته باشد زیرا شرکت های بیشتری الگوریتم های موسیقی را اعمال می کنند. پروژه Magenta Google – که به عنوان “کاوش یادگیری ماشین به عنوان ابزاری در روند خلاقیت” معرفی شده است – چندین API منبع باز ایجاد کرده است که با استفاده از صداهای کاملاً جدید ، تولید شده توسط ماشین یا آفرینش های مشترک با هوش مصنوعی انسان ، امکان ترکیب را فراهم می کند. استارت آپ های متعددی مانند Amper Music ، موسیقی سفارشی و تولید شده توسط هوش مصنوعی را برای محتوای رسانه ای تولید می کنند که دارای حق چاپ جهانی است. حتی Spotify در حال مخلوط کردن است گروه تحقیقاتی هوش مصنوعی آن توسط فرانسوا پاچت ، رئیس سابق آزمایشگاه علوم رایانه سونی موزیک هدایت می شود.

پیش بینی کار دشواری نیست ، اما چطور چنین عمیقی می تواند منجر به اخلاقی و فکری شود مسائل مربوط به دارایی اگر نمی خواستید برای استفاده از موسیقی یک هنرمند تثبیت شده در یک فیلم ، نمایش تلویزیونی یا تبلیغات ، نرخ بازار را پرداخت کنید ، می توانید تقلید خود را ایجاد کنید. در همین حال ، سرویس های پخش جریانی می توانند لیست های پخش ژانر با هنرمندان هوش مصنوعی مشابه با صدای مشابه را که حق امتیاز دریافت نمی کنند ، کاهش دهند و در نتیجه سود را افزایش دهند. سرانجام ، آیا خدمات پخش جریانی ، ایستگاه های رادیویی و سایر موارد به طور فزاینده ای از پرداخت موسیقی برای انسان اجتناب می کنند؟

ادارات حقوقی در صنعت موسیقی پیشرفت ها را از نزدیک دنبال می کنند. در اوایل سال جاری ، Roc Nation درخواست حذف DMCA را علیه یك كاربر گمنام YouTube به دلیل استفاده از هوش مصنوعی برای تقلید از صدای Jay-Z و ضرب آهنگ برای رپ شكسپیر و بیلی جوئل ثبت كرد. (هر دو فوق العاده واقع بینانه هستند.) “این محتوا به طور غیرقانونی از هوش مصنوعی برای جعل صدای مشتری ما استفاده می کند.” و در حالی که فیلم ها سرانجام “در انتظار کسب اطلاعات بیشتر از شاکی” بازگردانده شدند ، پرونده – اولین پرونده در نوع خود – سر و صدا می کند.

 جی زی ، که نسخه ای از هوش مصنوعی خود را مشاهده کرد که به شکسپیر و بیلی جوئل رپ می کند.

جی زی ، که نسخه ای از هوش مصنوعی خود را مشاهده می کند که به شکسپیر و بیلی رپ می کند جوئل. تصویر: Guardian Design / wireimage

Roc Nation از اظهارنظر درمورد مفاهیم حقوقی جعل هویت AI خودداری کرد ، همچنین چندین برچسب اصلی دیگر که گاردین با آنها تماس گرفته است: یکی به طور ناشناس گفت: “ما به عنوان یک شرکت عمومی ، هنگام بحث در مورد موضوعات آینده باید احتیاط کنیم.” حتی سازمان صنعت انگلستان ، BPI حاضر به ثبت سابقه در رابطه با نحوه برخورد صنعت با این دنیای جدید شجاعانه و اقدامات لازم برای محافظت از هنرمندان و یکپارچگی کار آنها نشد. IFPI ، یک نهاد تجارت بین المللی موسیقی ، به ایمیل ها پاسخ نداد.

شاید دلیل آن این باشد که حداقل در انگلستان این نگرانی وجود دارد که مبنایی برای محافظت قانونی. روپرت اسکلت ، رئیس حقوقی گروه Beggars Group ، که شامل برچسب های مستقل 4AD ، XL ، تجارت خشن و غیره است ، می گوید: “با موسیقی دو حق چاپ مجزا وجود دارد.” “یکی در نت موسیقی و شعر – یعنی آهنگ – و یک آهنگ جداگانه در ضبط صدا ، که مورد توجه برچسب ها است. و اگر کسی از ضبط واقعی استفاده نکرده باشد “- اگر یک شبیه سازی با استفاده از هوش مصنوعی ایجاد کرده باشد -” در رابطه با ضبط صدا از نظر حق چاپ هیچگونه برخورد قانونی با وی نخواهید داشت. “

در مورد “ضبط کردن” ضبط ، علت بالقوه ای برای اقدام وجود دارد ، اما ، اسکلت می گوید ، بار اثبات سنگین است و احتمال موفقیت چنین عملی در ایالات متحده ، جایی که حمایت قانونی از جعل هویت افراد مشهور برای اهداف تجاری وجود دارد و موارد سرقت ادبی مانند گرفتن املاک ماروین گی در Blurred Lines به موفقیت رسیده است. قانون انگلستان چنین مقررات و موارد قبلی را ندارد ، بنابراین حتی اگر خالق در مورد ماهیت آنها صریح باشد ، حتی بهره برداری تجاری از تقلب های عمیق نیز قابل اجرا نیست. اسکلت می گوید: “این به واقعیت های هر مورد بستگی خواهد داشت.” داشتن دیوید بووی هرچه دوست دارید بخواند – این یک قدرت و مسئولیت خارق العاده است Mat Dryhurst

با این وجود ، برخی از این امکانات خلاقانه هیجان زده شده اند. “اگر یک مدل آماری از میلیون ها آهنگ دارید ، می توانید از الگوریتم بپرسید: چه چیزی را ندیده اید؟” می گوید یی کینگ. “شما می توانید آن فضای خالی را پیدا کنید ، و سپس چیز جدیدی ایجاد کنید.” Mat Dryhurst ، هنرمند و پادکستر که سالها تحقیق و کار با هوش مصنوعی و فناوری مرتبط را صرف کرده است ، می گوید: «نزدیکترین قیاسی که می بینیم نمونه برداری است. این مدل ها ابعاد جدیدی از آن را فراهم می کنند و تفاوت بین نمونه برداری از ضبط ثابت صدای بووی و آواز خواندن بووی از هر آنچه دوست دارید را نشان می دهند – یک قدرت و مسئولیت خارق العاده. “

Deepfakes همچنین س questionsالات عمیق تری را به وجود می آورد: چه چیزی یک هنرمند خاص را خاص می کند؟ چرا ما به سبک ها یا انواع خاصی از موسیقی پاسخ می دهیم ، و چه اتفاقی می افتد که می توان در صورت درخواست ایجاد کرد؟ Yee-King تصور می کند که ماشین ها قادر هستند در هر زمان ، بر اساس تنظیماتی که انتخاب می کنید ، قطعه ای عالی از موسیقی را برای شما تولید کنند – و همچنین ستاره های پاپ با استفاده از یک مدل گوش دادن به هوش مصنوعی ، پیش بینی می کنند که کدام آهنگ ها هستند محبوب باشید یا آنچه جمعیت های مختلف به آن پاسخ می دهند. او می گوید: “فقط به مردم یک جریان صوتی بهینه بدهید ،” با هنرمندانی که کاملاً از حلقه خارج شده اند. “

اما اگر احساس سرمایه گذاری احساسی در هنرمندان این کار را می کنند – و در بخش انسانی آفرینش – ما چیزی اساسی را در موسیقی از دست خواهیم داد. دریوهرست می گوید: “این سیستم ها در بیان انسان آموزش دیده اند و باعث تقویت آن می شوند.” “اما قطعه گمشده پازل یافتن راه هایی برای جبران خسارت مردم است ، نه جایگزینی آنها.”

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>