هوش‌مصنوعی «آنتروپیک» میلیون‌ها کتاب را نابود کرد:

حق مولف زیر تیغ الگوریتم!

گروه فرهنگ و هنر

کدخبر: 543242 چهارشنبه 11 تیر 1404

شرکت «آنتروپیک» میلیون‌ها کتاب را خرید، اسکن و نابود کرد تا مدل زبانی خود را آموزش دهد.

گروه فرهنگ و هنر- در انباری‌های بی‌نام در گوشه‌ای از دنیا، جایی که نه نویسنده‌ای حضور دارد و نه کتاب‌خوانی، جلدهای رنگ‌پریده میلیون‌ها کتاب پاره‌پاره روی زمین افتاده‌اند. نه به‌خاطر سانسور، نه در نتیجه جنگ یا حادثه‌ای طبیعی بلکه قربانیان یک انقلاب فناورانه‌اند؛ انقلاب هوش‌مصنوعی. جایی که کلمات، دیگر فقط حامل معنا نیستند بلکه تبدیل به سوختی برای تغذیه ذهن ماشینی شده‌اند که باید «هوشمند» شود. شرکت «آنتروپیک»، در اقدامی که ترکیبی‌ است از زرنگی حقوقی، قاطعیت فناورانه و بی‌پروایی اخلاقی، میلیون‌ها کتاب را خریده، صفحاتشان را از هم دریده، آنها را اسکن کرده و سپس با خیال راحت به سطل زباله سپرده است. همه اینها برای آموزش مدل زبانی بزرگش به‌نام «کلود» صورت گرفته است. این واقعه تنها یک تصمیم فناورانه نیست بلکه بازتابی‌ از نبرد میان فرهنگ و الگوریتم، میان خلاقیت انسانی و پردازش ماشینی است.

موضوع از جایی افشا شد که در یکی از دادگاه‌ها، قاضی به این نتیجه رسید که آنتروپیک قانونی عمل کرده است. طبق حکم صادرشده، این شرکت مجاز است مدل‌های زبانی خود را براساس کتاب‌هایی که به‌شکل فیزیکی خریده است آموزش دهد؛ حتی بدون دریافت اجازه‌ مستقیم از نویسندگان. این مجوز، اگرچه از منظر قانونگذاران قابل قبول به نظر رسید اما از نظر بسیاری از نویسندگان، فعالان فرهنگی و حامیان حقوق مولف، به نوعی چراغ سبز برای نابودی میراث مکتوب بشر تلقی شد. مبنای حقوقی این اقدام به «قاعده اولین فروش» بازمی‌گردد. طبق این اصل، فردی که کالایی دارای حق نشر را به‌‌طور قانونی خریداری می‌کند، می‌تواند هرگونه استفاده‌ای از آن داشته باشد، حتی اگر این استفاده شامل پاره‌کردن و اسکن‌کردن آن برای اهدافی چون آموزش مدل‌های هوش‌مصنوعی باشد. شرکت آنتروپیک با درایت از این اصل بهره برد و به‌جای طی مسیر پرهزینه و پیچیده دریافت مجوز مستقیم از ناشران یا نویسندگان، تصمیم گرفت کتاب‌ها را به‌صورت فیزیکی خریداری کرده و به‌صورت درون‌سازمانی از محتوای آنها استفاده کند. در این مسیر، این شرکت یک مهره کلیدی را به خدمت گرفت: تام تروی، فردی که پیشتر در پروژه اسکن کتاب‌های گوگل نقش محوری داشت. آنتروپیک در بهمن۱۴۰۲ (فوریه۲۰۲۴)، تروی را استخدام کرد تا بتواند عملیات خرید و اسکن انبوه کتاب‌ها را بدون مواجهه با مانع حقوقی اجرا کند. راهکار او ساده اما بحث‌برانگیز بود؛ خرید کتاب‌ها، پاره‌کردن صفحات برای تسهیل فرآیند اسکن، استفاده از نسخه دیجیتالی فقط درون شرکت و سپس نابودکردن فایل‌ها و نسخه‌های کاغذی. اقدامی که به‌لحاظ قانونی، فعلا مشکلی ندارد اما از نظر اخلاقی محل تردید جدی ا‌ست.

مساله این است که آنتروپیک تنها بازیگر این صحنه نیست. شرکت‌های دیگری همچون متا نیز به اقداماتی مشابه دست زده‌اند. متا اخیرا به‌دلیل استفاده غیرمجاز از آثار نویسندگان در آموزش مدل‌های هوش‌مصنوعی خود، هدف شکایتی جمعی از سوی گروهی از نویسندگان قرار گرفته است. تفاوت در اینجاست که آنتروپیک، مسیر رسمی‌تری را برای رسیدن به همان هدف طی کرده؛ گرچه هنوز هم سایه اقدامات قبلی‌اش که شامل دانلود و استفاده غیرقانونی از محتوای دارای حق نشر بوده، از سرش برداشته نشده است. در واقع، آنچه اکنون شاهد آن هستیم، بخشی از روندی وسیع‌تر در صنعت هوش‌مصنوعی ا‌ست؛ صنعتی که در عطش دائمی برای داده‌های باکیفیت به سر می‌برد. مدل‌های زبانی بزرگ برای ارتقای کیفیت، نیازمند حجم عظیمی از متون طبیعی‌ هستند اما از آنجایی که اینترنت پر از محتوای تکراری، کم‌کیفیت یا آلوده به خطا و تعصب است، شرکت‌ها به‌سراغ منابع سنتی اما غنی‌تری همچون کتاب‌ها رفته‌اند. کتاب‌ها، با ساختار دقیق، زبان پالوده و موضوعات متنوع، بهترین خوراک برای تغذیه مدل‌های زبان‌محور هستند.

پرسش مهمی که مطرح می‌شود این است که آیا نابودکردن منابع فرهنگی، ولو به قصد پیشرفت علمی، موجه است؟ بسیاری از منتقدان این اقدام را شکلی از «بی‌احترامی نظام‌مند به خلاقیت انسانی» می‌دانند. آنها می‌پرسند: آیا واقعا هیچ راه دیگری برای اسکن این کتاب‌ها بدون نابود کردن آنها وجود نداشته است؟ پاسخ ساده است: چرا، وجود داشته است. موسسات آرشیوی و دانشگاهی در دهه‌های اخیر روش‌هایی برای اسکن بدون تخریب ابداع کرده‌اند؛ روش‌هایی که اگرچه پرهزینه‌تر و کندترند اما به حفظ فیزیکی کتاب‌ها کمک می‌کنند اما شرکت‌هایی نظیر آنتروپیک که در رقابتی نفسگیر برای رسیدن به قله هوش‌مصنوعی قرار دارند، اولویت را به سرعت و صرفه‌جویی مالی می‌دهند؛ ولو به قیمت از بین بردن میلیون‌ها نسخه فیزیکی. از این منظر، موضوع دیگر صرفا یک مساله فنی یا حقوقی نیست بلکه تبدیل به یک چالش فرهنگی-تمدنی شده است. ما با شرایطی روبه‌رو هستیم که در آن آینده فناوری، بر دوش گذشته مکتوب بنا می‌شود اما بدون توجه به ارزش و میراث آن گذشته. اگر کتاب‌ها فقط به عنوان «داده خام» برای آموزش هوش‌مصنوعی تلقی شوند، نه به‌عنوان آثار هنری، پژوهشی یا فرهنگی، چه چیزی از روح خلاقیت انسانی باقی خواهد ماند؟ در کنار این نگرانی‌ها، مساله‌ حق مولف و پرداخت عادلانه به نویسندگان نیز وجود دارد. بسیاری از نویسندگان معتقدند که استفاده از آثارشان برای آموزش مدل‌های هوش‌مصنوعی بدون اجازه و بدون پرداخت، نوعی بی‌عدالتی آشکار است.

برخی انجمن‌های نویسندگان اکنون در تلاش‌ هستند قوانین را به گونه‌ای بازنویسی کنند که استفاده از کتاب‌ها برای آموزش الگوریتم‌ها نیز مشمول حقوق نشر شود؛ تلاشی که اگرچه منطقی به‌نظر می‌رسد اما با مقاومت غول‌های فناوری مواجه شده است.

از سوی دیگر، مدافعان هوش‌مصنوعی نیز استدلال‌هایی دارند. آنها می‌گویند توسعه مدل‌های زبانی پیشرفته، می‌تواند به‌نفع جامعه نیز باشد. مدل‌هایی که از میلیون‌ها کتاب تغذیه شده‌اند، توانایی تولید متن‌های باکیفیت، کمک به آموزش، ارتقای مهارت‌های زبانی، ترجمه بهتر و حتی خلق آثار ادبی را دارند. این گروه معتقدند اگرچه منابع انسانی قربانی شده‌اند اما دستاورد نهایی می‌تواند خدمت بزرگی به بشریت کند. با این حال، در جهانی که سرعت پیشرفت فناوری از ظرفیت‌های حقوقی و اخلاقی پیشی گرفته، تردیدی نیست که باید مرزهایی مشخص و شفاف برای تعامل میان خلاقیت انسانی و ظرفیت‌های ماشینی تعیین کرد. نابودی میلیون‌ها کتاب برای آموزش هوش‌مصنوعی، شاید از منظر کارایی قابل توجیه باشد اما نمی‌توان آن را بدون در نظر گرفتن ارزش فرهنگی، هنری و انسانی این آثار در نظر گرفت. این مساله، همانطورکه در افشای اقدامات آنتروپیک دیده شد، تنها یکی از نمونه‌های ده‌ها مورد مشابه است. با افزایش استفاده از داده‌های فرهنگی در آموزش مدل‌ها، پرسش‌های اخلاقی پیچیده‌تری مطرح خواهند شد: اگر ماشین‌ها بتوانند از آثار انسانی بیاموزند، آیا انسان‌ها هم در آینده باید از ماشین‌ها اجازه بگیرند؟ آیا فرهنگ، سرمایه‌ای مشترک است که می‌توان آن را بدون رضایت خالقانش در اختیار الگوریتم‌ها گذاشت؟ در نهایت، شاید هوش‌مصنوعی بتواند جمله بسازد، شعر بگوید، یا حتی رمان بنویسد. اما آنچه از بین رفته، روحی ا‌ست که هر واژه در خود داشت. روحی که نه قابل اسکن است، نه قابل شبیه‌سازی و نه جایگزین‌پذیر. آنچه آنتروپیک انجام داد، اگرچه قانونی بود اما به‌زعم بسیاری، لکه‌ای‌ است بر حافظه‌ فرهنگی بشر در عصری که باید بیش از همیشه از خلاقیت انسانی محافظت می‌کرد.