نیویورک تایمز علیه اوپن‌ای‌آی وارد نبرد شد

زمانی که داده‌ها به عنوان نفت قرن ۲۱ شناخته می‌شدند، هیچ‌کس تصور نمی‌کرد که نبرد بر سر مالکیت یک پاراگراف یا یک تصویر، بتواند موتور محرک نوآوری‌های میلیارد دلاری را به لرزه درآورد و مرزهای قانون را جابه‌جا کند.

این خبر حاوی محتوای صوتی یا تصویری است. برای جزییات بیشتر به منبع خبر مراجعه کنید
خلاصه خبر
گروه علم و پیشرفت خبرگزاری فارس - در اواخر سال ۲۰۲۳ میلادی، زمانی که نیویورک تایمز شکایت خود را علیه اوپن ای آی و مایکروسافت ثبت کرد، دنیای فناوری متوجه شد که دوران بهره‌برداری رایگان از محتوا به پایان رسیده است. این شکایت تنها یک اختلاف ساده بر سر کپی‌رایت نبود، بلکه پرسشی بنیادین درباره ماهیت آموزش مدل‌های زبانی هوشمند مطرح می‌کرد.در متن این شکایت، نمونه‌های متعددی ارائه شد که نشان می‌داد خروجی‌های چت جی پی تی شباهت نگران‌کننده‌ای به مقالات آرشیوی این روزنامه دارد. شاکیان معتقد بودند که این سامانه تنها اطلاعات را خلاصه نمی‌کند، بلکه در حال بازتولید غیرقانونی دسترنج روزنامه‌نگارانی است که برای تهیه هر گزارش هزینه‌های سنگینی پرداخته‌اند.اوپن ای آی در واکنش به این اتهامات، بر مفهوم استفاده منصفانه تأکید کرد و مدعی شد که داده‌ها از اینترنت عمومی گردآوری شده‌اند. این شرکت استدلال می‌کرد که هدفش جایگزینی روزنامه‌نگاری نیست، بلکه مدل‌های آن‌ها تنها الگوهای آماری را یاد می‌گیرند و نسخه برداری مستقیم انجام نمی‌دهند.این تقابل حقوقی، بحث‌های داغی را در محافل قانونی ایجاد کرد که آیا آموزش مدل‌های هوش مصنوعی یک استفاده ثانویه مشروع است یا شکلی نوین از دزدی دیجیتال. نتیجه این پرونده می‌تواند سرنوشت صدها شرکت فناوری دیگر را که بر پایه داده‌های انبوه بنا شده‌اند، به کلی دگرگون سازد.

دستور دادگاه برای گشودن جعبه سیاه مدل‌های هوشمند

نقطه عطف این پرونده زمانی رقم خورد که دادگاه فدرال آمریکا، شرکت اوپن ای آی را ملزم کرد تا بخشی از لاگ‌های مکالمه کاربران را برای بررسی در اختیار روند رسیدگی قرار دهد. این دستور که توسط رسانه‌هایی نظیر رویترز بازتاب یافت، به معنای گشودن درهای جعبه سیاه هوش مصنوعی به روی قانون بود.دادگاه با این اقدام نشان داد که برای داوری عادلانه، باید به عمق فرآیند آموزش مدل‌ها نفوذ کرد تا مشخص شود چه میزان از داده‌های دارای کپی‌رایت در حافظه ماشین باقی مانده است. این تصمیم، شرکت‌های بزرگ فناوری را که لاگ‌های خود را دارایی محرمانه می‌دانستند، با چالشی بی‌سابقه روبرو کرد. از سوی دیگر، این اقدام پرسش‌های جدیدی را درباره حریم خصوصی کاربران مطرح ساخت؛ چرا که حالا داده‌های تعامل مردم با هوش مصنوعی می‌توانست به عنوان سند در دادگاه استفاده شود.این تداخل میان حق مالکیت رسانه‌ها و حق خلوت کاربران، پیچیدگی‌های پرونده را دوچندان کرد.این پیام روشن به صنعت فناوری مخابره شد که دیگر نمی‌توان پشت پیچیدگی‌های فنی پنهان شد و از نظارت قضایی گریخت. شفافیت در آموزش مدل‌ها اکنون به یک ضرورت قانونی تبدیل شده است که می‌تواند کل مدل کسب‌وکار غول‌های سیلیکون ولی را زیر سؤال ببرد.

شکایت‌های زنجیره‌ای دامن‌گیر مدل‌های تصویرساز شد

بحران مالکیت داده تنها به متن محدود نماند و به سرعت وارد دنیای تصاویر شد، جایی که گتی ایمیجز شکایتی پرجزئیات را علیه استبیلیتی ای آی مطرح کرد. این آرشیو بزرگ مدعی شد که میلیون‌ها تصویر دارای واترمارک، بدون اجازه برای آموزش مدل استیبل دیفیوژن مورد استفاده قرار گرفته است.این پرونده که به طور هم‌زمان در آمریکا و بریتانیا پیگیری می‌شد، نشان داد که مالکان محتوا در سطح جهانی برای مقابله با هوش مصنوعی متحد شده‌اند.گتی ایمیجز تأکید داشت که استفاده از آثار هنری و عکس‌های حرفه‌ای برای تولید تصاویر ماشینی، به معنای نابودی تدریجی معیشت عکاسان است.نتایج اولیه دادگاه‌های بریتانیا نشان داد که پاسخ حقوقی واحدی برای این مناقشات وجود ندارد و هر حوزه قضایی مسیر خاص خود را طی می‌کند. برخی ادعاها پذیرفته شدند و برخی دیگر رد گشتند، که این خود نشان‌دهنده سردرگمی قانون‌گذاران در برابر سرعت خیره‌کننده پیشرفت فناوری است. رسانه‌های دیگری مانند راو استوری و آلترنت نیز با اتهاماتی نظیر حذف اطلاعات مدیریت کپی‌رایت به این جبهه پیوستند. این زنجیره از شکایت‌ها ثابت کرد که دوران داده‌های بی‌صاحب به سر آمده و هر بایت اطلاعات در فضای وب، اکنون یک صاحب قانونی دارد که به دنبال سهم خود است.

پلتفرم‌های داده‌محور درهای خود را به روی خزنده‌ها بستند

در واکنش به این درگیری‌ها، پلتفرم‌های بزرگی نظیر ردیت و توییتر که اکنون ایکس نامیده می‌شود، سیاست‌های دسترسی به ای پی آی‌های خود را به کلی تغییر دادند. آن‌ها با وضع تعرفه‌های سنگین، مانع از گردآوری رایگان داده‌ها توسط شرکت‌های هوش مصنوعی شدند تا از دارایی‌های دیجیتال خود محافظت کنند. این تصمیمات که با هدف پایداری کسب‌وکار توجیه می‌شد، عملاً دیواری بلند میان داده‌ها و توسعه‌دهندگان ایجاد کرد.پلتفرم‌ها دیگر تمایلی نداشتند که مواد اولیه مورد نیاز برای رقبای آینده خود را به رایگان در اختیار آن‌ها قرار دهند و اینترنت باز را به فضایی بسته تبدیل کردند.استک اورفلو نیز محدودیت‌های جدیدی اعمال کرد تا از خروج دانش تخصصی برنامه‌نویسان توسط ربات‌های خودکار جلوگیری کند. این موج از انسداد داده‌ها، نشان‌دهنده پایان عصر همکاری‌های آزاد در وب و آغاز دوران انحصارگری اطلاعاتی توسط قدرت‌های بزرگ است.این تغییر رویکرد، ضربه سختی به استارتاپ‌های کوچک و پژوهشگران مستقل وارد کرد که دیگر توان پرداخت هزینه‌های گزاف برای دسترسی به داده را ندارند. در این میان، تنها شرکت‌های بسیار ثروتمند هستند که می‌توانند با پرداخت مبالغ کلان، دسترسی خود را به منابع آموزشی حفظ کنند و رقابت را از بین ببرند.

پژوهشگران دانشگاهی قربانیان خاموش نبرد داده‌ها شدند

یکی از دردناک‌ترین پیامدهای این جنگ حقوقی، متوقف شدن پروژه‌های علمی در دانشگاه‌ها بود که سال‌ها بر دسترسی آزاد به داده‌های اجتماعی متکی بودند.پژوهشگرانی که بر روی اخبار جعلی یا رفتارهای آنلاین مطالعه می‌کردند، ناگهان خود را پشت درهای بسته و حساب‌های بانکی خالی دیدند.این محققان که نه به دنبال سود تجاری، بلکه به دنبال کشف حقایق اجتماعی بودند، به قربانیان خاموش مناقشات میان غول‌های فناوری و رسانه‌ها تبدیل شدند. محدودیت‌های جدید، امکان نظارت مستقل بر عملکرد شبکه‌های اجتماعی را از میان برده و جامعه را در برابر آسیب‌های فضای مجازی بی‌دفاع کرده است.پروژه‌هایی که هدفشان بهبود امنیت اینترنت یا درک پویایی‌های گفت‌وگو بود، حالا به دلیل هزینه‌های سنگین ای پی آی نیمه‌کاره رها شده‌اند.این انسداد دانش، به معنای آن است که در آینده تنها شرکت‌های بزرگ مالک حقیقت خواهند بود و هیچ نهاد مستقلی نمی‌تواند ادعاهای آن‌ها را راستی‌آزمایی کند. صدای اعتراض اساتید و دانشجویان در میان هیاهوی دادگاه‌های میلیاردی شنیده نمی‌شود، اما اثرات آن در درازمدت بر کیفیت علم و آگاهی عمومی بسیار ویرانگر خواهد بود. نبرد بر سر پول، به تدریج در حال خشک کردن ریشه‌های پژوهش‌های آزاد در فضای دیجیتال است.

شرکت‌های هوش مصنوعی نوآوری را در خطر می‌بینند

در سوی دیگر میدان، شرکت‌های هوش مصنوعی هشدار می‌دهند که بدون دسترسی به داده‌های گسترده، پیشرفت این فناوری به کلی متوقف خواهد شد. آن‌ها تأکید دارند که خروجی‌های مدل‌ها تنها بازتابی آماری از الگوها هستند و ذخیره یا بازنشر مستقیم آثار صورت نمی‌گیرد.این شرکت‌ها در بیانیه‌های مطبوعاتی خود پافشاری می‌کنند که سخت‌گیری‌های قانونی می‌تواند کشور را در رقابت جهانی هوش مصنوعی عقب بیندازد. از نظر آن‌ها، قوانین کپی‌رایت قدیمی برای دنیای مدرن که در آن ماشین‌ها از داده‌ها یاد می‌گیرند، کارایی لازم را ندارد و نیازمند بازنگری است. اما یافته‌های علمی جدید درباره پدیده حفظ کردن در مدل‌های زبانی، نشان می‌دهد که ماشین‌ها گاهی دقیقاً همان متون آموزشی را بازتولید می‌کنند. این یافته‌ها به استدلال شاکیان وزن بیشتری داده و ادعای آماری بودن محض خروجی‌ها را با تردیدهای جدی مواجه کرده است.تضاد میان ضرورت نوآوری و حفظ حقوق مالکیت، به بن‌بستی رسیده است که خروج از آن نیازمند راهکارهای حقوقی کاملاً نوین است. اگر هزینه‌های داده بیش از حد بالا برود، هوش مصنوعی ممکن است به جای یک ابزار عمومی، به انحصار چند شرکت معدود درآید که توان مالی پرداخت حق‌الامتیازها را دارند.

قانون‌گذاران جهانی به دنبال سهم خود از کیک داده‌ها هستند

مناقشه بر سر داده‌ها اکنون به مرحله‌ای رسیده که دولت‌ها و قانون‌گذاران در سراسر جهان دیگر نمی‌توانند تماشاگر باقی بمانند. کشورهایی مانند هند پیشنهادهایی را برای دریافت حق‌الامتیاز از شرکت‌های ای آی بابت استفاده از محتوای محلی و فرهنگی خود مطرح کرده‌اند.این رویکرد جدید نشان می‌دهد که داده‌ها به یک مسئله امنیت ملی و حاکمیت اقتصادی تبدیل شده‌اند که فراتر از حقوق کپی‌رایت شخصی است.دولت‌ها می‌خواهند اطمینان حاصل کنند که ثروت تولید شده توسط هوش مصنوعی، به طور عادلانه میان تولیدکنندگان اصلی محتوا توزیع می‌شود.هم‌زمان، بحث‌های مربوط به حریم خصوصی در دادگاه‌ها به این معناست که قوانین جدید باید مرز میان داده‌های آموزشی و داده‌های شخصی را مشخص کنند. هیچ شرکتی نباید مجاز باشد که بدون رضایت صریح، از تعاملات خصوصی مردم برای تقویت مدل‌های تجاری خود استفاده کند.ورود سیاست به دنیای کدها، پیچیدگی‌های جدیدی را ایجاد کرده است که می‌تواند منجر به تکه‌تکه شدن اینترنت جهانی شود.هر کشور ممکن است قوانین خاص خود را برای دسترسی به داده‌ها وضع کند، که این امر فعالیت شرکت‌های بین‌المللی را با دشواری‌های فراوانی روبرو خواهد ساخت.

دوران داده‌های بی‌صاحب در فضای وب به پایان رسید

در پایان این روایت پرفراز و نشیب، یک حقیقت کاملاً روشن شده است: دوران داده‌های بی‌صاحب و اینترنت به مثابه معدن رایگان به پایان رسیده است. فناوری که سریع‌تر از قانون حرکت کرده بود، حالا ناچار است بایستد و بهای پیش‌دستی خود بر مقررات را به سنگین‌ترین شکل ممکن بپردازد. روزنامه‌نگاران، هنرمندان، پژوهشگران و غول‌های فناوری همگی در یک بن‌بست حقوقی گرفتار شده‌اند که برنده قطعی ندارد. هر حکمی که صادر شود، بخشی از اکوسیستم دیجیتال را با چالش مواجه خواهد کرد و توازن قدرت را در دنیای اطلاعات تغییر خواهد داد.آینده نوآوری اکنون در گروی یافتن مدلی عادلانه برای جبران خدمات تولیدکنندگان محتوا است که در عین حال راه را بر پیشرفت علمی نبندد. این نبرد نشان داد که داده دیگر تنها یک عدد در پایگاه داده نیست، بلکه به قلب تپنده اقتصاد و سیاست در قرن جدید تبدیل شده است.ما در حال گذار به جهانی هستیم که در آن هر کلمه و هر تصویر دارای ارزش مادی و حقوقی مشخصی است که توسط هوش مصنوعی نقد می‌شود. نتایج نهایی این درگیری‌ها، تعریف جدیدی از خلاقیت، مالکیت و حریم خصوصی را برای نسل‌های آینده رقم خواهد زد که هیچ راه بازگشتی از آن وجود ندارد.#هوش_مصنوعی#کپی_رایت#نیویورک_تایمز#حق_مالکیت#اقتصاد_داده
21:00 - 5 دی 1404
نظرات کاربران
ارسال به صورت ناشناس
اخبار داغ