Ужасы нейронных сетей. Часть 1: Нейросети и авторское право
![Ужасы нейронных сетей. Часть 1: Нейросети и авторское право](https://files.vgtimes.ru/posts/2025-02/uzhasy-neyronnyh-setey.-chast-1-neyroseti-i-avtorskoe-pravo-120067.webp?1738919520)
С каждым годом на развитие искусственного интеллекта выделяются колоссальные средства. Его начинают добавлять в телефоны, роботы-пылесосы и даже в холодильники. С помощью ИИ ищут информацию, редактируют изображения или просто общаются с чат-ботом. Это очень удобное средство... на первый взгляд. Но вы когда-нибудь задумывались об опасности, которая таится в нейронных сетях? В этой серии статей постараюсь рассказать на примерах о тёмной стороне этой технологии.
Введение
В этой серии статей, хочу разобрать как нейросети влияют на нашу жизнь и каких опасностей стоит остерегаться.
Начнём с чего-нибудь «лайтового». Авторское право. В большинстве случаев оно защищает автора от кражи его трудов и их бесплатного использования. Авторское право (АП) распространяется на книги, музыку, картины, программы и т.д. То есть на продукты интеллектуального труда. Даже на фото-стоках картинка не является вашей, пока её не купите. А теперь вернёмся к нейросетям. Что бы красиво нарисовать закат у реки, ИИ должен понимать как выглядят «закат» и «река». Для этого он обучается на большом массиве данных, с изображениями закатов и рек, что бы выявить закономерности и предоставить на основе этих данных результат.
Но откуда берутся массивы для обучения? Если это одиночка захотевший настроить локальный Stable Diffusion для личного использования, то он может понабрать понравившиеся фото из поисковика, не переживая о всяких копирайтах и лицензиях. Так как даже в самом худшем случае, коммент со сгенерированным Илоном Маском в образе усатого трубопроводчика, сидящего в KFC — просто снесут, но судится вряд ли будут. А вот у больших компаний с этим дела обстоят чуть сложнее.
Откуда у данных ноги растут
Давайте разберём, откуда компании берут датасеты для обучения. К примеру можно вспомнить, как в 2021 году в Оксфорде была конференция с участием Megatron-Turing NLG. Он был обучен на англоязычных статьях из «Википедии», новостях за 2016-2019 годы и архивах Reddit объёмом в 38 ГБ. Кстати, он сделал весьма пугающие заявления.
Не стоит забывать что ваши промты (запросы к ИИ) тоже используются для обучения. А у Google и Майкрософт, есть помимо них куда больше информации о вас. Впрочем это тема для следующей статьи.
У Midjourney в лицензии говорится что вы даёте ей, её преемникам и преемникам их преемников «бессрочную, всемирную, неисключительную, сублицензируемую, безвозмездную, безотзывную лицензию» на весь контент который вы в неё загружаете.
Так же есть крупнейший набор данных YFCC100M принадлежащей Yahoo. Он содержит в себе, согласно официальному сайту, «99,2 миллиона фотографий и 0,8 миллиона видео с Flickr, все из которых были опубликованы под одной из различных лицензий Creative Commons». Flickr — это сайт для размещения пользовательских фотографий. Значит ли что все изображения опубликованные там, будут скормлены нейросетям? Нет, так как при загрузке фотографий, можно настроить тип лицензии. На выбор даётся 9 вариантов:
- All Rights Reserved — тип лицензии установленный по умолчанию. Означает что вы и только вы можете использовать этот продукт, пока явно не дадите своё согласие третьим лицам или ресурсу на его использование.
- Public Domain Work — переводится как „общественное достояние". Обозначает контент который вошёл в общественное достояние из за истечения срока действия авторского права (как первые версии Микки Мауса), невыполненных требований по защите или изначально этого права не существовало (например произведения Шекспира или труды Ньютона). Обозначается символом перечёркнутого копирайта, который тоже является общественным достоянием.
- Public Domain Dedication (CC0) —Означает что вы отказываетесь от всех прав (насколько это возможно в вашей стране) на контент и его может использовать любой желающий, без указания первоисточника. В отличии от предыдущего пункта, этот тип лицензии может быть поставлен автором лично. Из за того что в некоторых странах могут быть свои законы касательно авторского права, кое где автор не может полностью передать права. Технически вы предоставляете чрезвычайно расширенную лицензию, неограниченному кругу лиц. По факту от Public Domain Work ничем практически не отличается, кроме того, что этот тип лицензии может быть отозван (правда не факт что успешно. Может произойти и Эффект Стрейзанд).
- Attribution (CC BY 2.0) — Обязывает авторов берущих за основу или копирующих вашу работу, указывать оригинального автора.
- Attribution-NonCommercial (CC BY-NC 2.0) — В дополнении к указанию авторства, нельзя использовать оригинальную работу или производные произведения в коммерческих целях.
- Attribution-NonCommercial-NoDerivs (CC BY-NC-ND 2.0) — в отличии от двух предыдущих, можно распространять только точные копии работы автора, без создания производных материалов, но всё так же с указанием авторства и не в коммерческих целях.
- Attribution-NoDerivs (CC BY-ND 2.0) — Аналогично предыдущей лицензии, но можно использовать и в коммерческих целях.
- Attribution-NonCommercial-ShareAlike (CC BY-NC-SA 2.0) - CC BY-NC 2.0 + обязывает авторов берущих за основу вашу работу (будь то фан-арты, фанфики или полноценные игры) распространять её, на основе такой же лицензии, которая и у оригинала.
- Attribution-ShareAlike (CC BY-SA 2.0) — то же самое что и предыдущее, но можно использовать в коммерческих целях. Более новая версия этой лицензии стоит на сайте SCP Foundation.
Теперь разобравшись с типами лицензий (они нам в будущем понадобятся... наверное), давайте разберёмся какие из них точно не могут использоваться для обучения ИИ. Лицензии с типом NonCommercial не могут быть использованы только для обучения коммерческих моделей, а NoDerivs — вообще ни в каких, так как любая нейро-мазня сделанная на основе изображений — уже считается производной работой, что противоречит лицензии. Что касается Attribution то она может быть использована, только если в отчётах компании которая обучает нейросеть, есть упоминание авторов и ссылки на оригиналы, откуда были позаимствованы изображения (в случае с локальными моделями, в репозиторий должен быть включён документ с перечнем всех использованных работ с данной лицензией). Но тут встаёт вопрос в том, как проконтролировать что бы в обучающую базу, не попали данные защищённые авторским правом. Для этого вначале разберёмся как проходит обучение.
В нейросети, данные о изображении не хранятся в исходном виде. Они «перевариваются» в весы и смещения. Описание этого процесса Займёт не одну статью, поэтому вкратце опишу как это работает (более подробно смотрите у Шарифова и на Вики странице посвящённой Китайской комнате).
Нейросети скармливается набор данных с правильными ответами на них и на основе этого, строятся взаимосвязи. Это всё равно что нам показать тысячи картинок солнца и непонятную нам кракозябру, потом показать дождь и другую загогулину. Мы понятия не имеем на каком это языке, но подозреваем что одно значение означает солнце, а другое — дождь (для нейросети это по прежнему два непонятных объекта, которые связаны с другими двумя непонятными объектами). Весы означают вес элементов. Например у первого иероглифа, после 300 фотографий солнца в разных вариациях (рисунокфото со спутникаснимок), вдруг появится рисунок домика и солнца. В таком случае вес «солнца» будет выше, поэтому дом мы проигнорируем. Чем чаще встречается элемент, тем он весомее.
Теперь, когда в этом разобрались, можно перейти к методам проверки.
Проверка исходных данных
В исследовании «Extracting Training Data from Diffusion Models» проведённом сотрудниками Google, DeepMind, ETH Zurich, Princeton, и UC Berkeley, выяснили что при определённых стечениях обстоятельств, нейросеть может выдавать изображения очень близкие к оригиналу. Например:
Исследователи смогли получить тысячи примеров, начиная от фотографий отдельных людей и заканчивая логотипами компаний, которые защищены авторским правом.
Кстати, это к слову о том, что нельзя нейросети рассказывать конфиденциальную информацию. Но это тема для другой статьи.
Ещё порой нейросети выдают изображения с деталями напоминающими водяные знаки. Вот несколько примеров найденных на Reddit.
На последок хотелось бы показать исследование «DIAGNOSIS: Detecting Unauthorized Data Usages in Text-to-image Diffusion Models». Вот что они предлагают:
«В частности, мы модифицируем защищенные изображения, добавляя на них уникальный контент с помощью скрытых функций деформации изображений, которые почти незаметны для человека, но могут быть захвачены и запомнены диффузионными моделями. Анализируя, запомнила ли модель внедренное содержимое (т. е. обрабатываются ли сгенерированные изображения внедренной функцией постобработки), мы можем обнаружить модели, которые незаконно использовали несанкционированные данные».
Кстати, код можно найти на GitHub, ссылка есть на странице исследования.
Также, если у модели открытый исходный код, можно проанализировать его «внутренности» и сопутствующую документацию на предмет сведений о датасетах, на которых она была обучена.
Хорошо, с этим разобрались. А интересовались ли вы, как авторское право распространяется на труды нейросетей?. Но для начала (не)большое отступление.
Мартышкин труд
2011 год. Фотограф Дэвид Слейтер отправился в Индонезию, что бы сделать снимки хохлатых павианов обитающих в заповеднике. Пока фотограф был занят своими делами, макака завладела камерой и нажала на кнопку. Звук привлёк внимание обезьяны и она продолжила нажимать на неё. Было снято много снимков, но хороших получилось мало. По прибытии с заповедника, Слэйтер лицензировал изображение Caters News Agency, на том основании что он, являлся автором идеи и специально хотел чтоб мартышки поиграли с камерой. Он утверждал что всё было в его поле зрении и всё вышло как и задумывалось. Вначале статья об этом появилась на DailyMail, а после вызвала обсуждения на сайте Techdirt, когда там вышла статья о том, может ли фото сделанное обезьяной — быть объектом авторского права. В статье присутствовало 3 фото обезьяны.
Неделю спустя на Techdirt вышел другой пост, в котором говорилось, что представитель компании которой принадлежит фото, связался с автором и попросил удалить их, так как они использованы без разрешения. На что автор был в недоумении, ведь уведомление было написано как обычное письмо, без использования юридических терминов и упоминания авторского права. Да и может ли снимок который сделала обезьяна вообще быть лицензирован, ведь животное не может быть субъектом авторского права? Да даже если и может, изображение были показаны в рамках добросовестного использования (так как статья была новостным репортажем) и проблем быть не должно. Он почти подумал что это может быть шуткой но, всё же отправил ответ, в котором подробно разъяснил свою позицию.
От Caters News Agency пришёл ответ:
«Независимо от того, кто владеет авторскими правами, а кто нет, — на 100% ясно, что владелец авторских прав — это не вы сами».
Автор статьи был в ещё большем недоумении. Так как по логике письма, любой кто не владеет авторским правом, может подать жалобу если и опубликовавший тоже ими не владеет (что является нарушением закона в некоторых местах). Он по прежнему настаивал что даже если Caters владеет правами (в чём он сильно сомневался), его использование изображений является «квинтэссенцией добросовестного использования», так как пост был посвящён не столько самим фотографиям, сколько размышлениям на тему принадлежности авторского права произведениям созданными животными. Поэтому автор оставил фото в посте.
Следующий виток произошёл когда фотографии были загружены на Викисклад (один из проектов Викимедиа). Особенность ресурса заключалась в том, что загруженные фотографии должны быть под свободными лицензиями. На этот раз к Викимедии обратился сам Слейтер и просил либо удалить фото, либо платить за использование. На что получил отказ и объяснение что произведения сделаны не человеком, поэтому они считаются общественным достоянием. После этого Слейтер обратился к BBC, с заявлением что понёс от действий Викимедии финансовые потери (предположительно 10 000 £), так как никто не хочет покупать фотографии, пока они считаются общественным достоянием. После этого начались судебные тяжбы.
Мнения юристов разделились. Одни разделяли точку зрения Викимедии, другие утверждали что авторское право можно приписать по факту владения камерой на которую были сделаны снимки. Так как в таком случае фотограф мог настроить свет, фокус, угол съёмки и прочие действия, а животному всего лишь нужно было нажать на кнопку. Преподаватель в сфере права интеллектуальной собственности, Андрес Гуадамуз, ссылался на другое прецедентное дело, в котором был достаточен сам факт отбора фотографии из массива, для выражения личности фотографа, а значит и приписыванием ему АП.
Всё решилось 22 декабря 2014 года, когда Бюро авторского права США вынесло решение, объяснив, что произведения, не созданные людьми, не являются объектами авторского права, и указав в качестве примеров «фотографии, сделанные обезьянами».
В 2015 году в суд подало уже общество по защите прав животных (People for the Ethical Treatment of Animals, PETA, известная по сомнительным решениям). Они просили о предоставлении обезьянам возможности выступать субъектами авторского права, и позволить PETA заниматься администрированием средств полученных от фотографий этого, и всех других хохлатых павианов из заповедника. Позже стало известно что они возможно перепутали обезьяну и указали в заявлении не того павиана, который изображён на снимке. Они заявляли что это девочка Наруто, в то время как Слейтер утверждал что это был другой примат, и вообще самец.
11 сентября 2017 года суд отклонил апелляцию PETA. Слейтер сделал добровольное пожертвование в размере 25 процентов от всех средств, заработанных за счёт этих снимков, в пользу фонда защиты хохлатых макак.
Нейросетевой "худо"жник
Что то мы отошли от темы, давайте вернёмся к нейросетям. Как видно из примера с макакой, на момент 2017 года, авторское право распространялось только на людей. Но что насчёт компьютеров? Точной правовой базы пока что нет, поэтому правила отличаются в зависимости от модели. Например:
- У Midjourney можно использовать сгенерированный контент «в максимально возможной степени в соответствии с действующим законодательством». Но "если вы являетесь компанией или сотрудником компании, с доходом более 1 000 000 долларов США в год, вы должны быть подписаны на план «Pro» или «Mega», чтобы владеть своими активами". Но меня смущает фраза «Вы являетесь владельцем всех изображений, созданных с помощью Midjourney, даже если ваша подписка больше не активна». А ChatGPT указывает что согласно стороннему источнику (информационная статья датированная январём 2024 года), обладатели бесплатного тарифного плана, могут использовать сгенерированные изображения по лицензии Creative Commons Attribution-NonCommercial International License (CC BY-NC 4.0) (так и знал что табличка в начале понадобится). Но возможно за этот год правила пользования изменились. Но в любом случае если хотите использовать для коммерческой деятельности, лучше проконсультироваться со службой поддержки и юристами.
- DALL-E: OpenAI, разработчик DALL-E, предоставляет пользователям полные права на коммерческое использование сгенерированных изображений. Это означает, что пользователи могут свободно использовать созданные изображения в своих проектах, включая коммерческие, без необходимости указывать авторство или получать дополнительное разрешение.
- Stable Diffusion: так как это открытая модель, то права на сгенерированные ею изображения зависят от условий использования конкретного сервиса или приложения, основанного на этой модели. Рекомендую внимательно изучать пользовательские соглашения и лицензионные условия каждого сервиса, чтобы понять свои права и ограничения (а то я чуть с ума не сошёл, пробираясь через бюрократические дебри).
Выводы
Нейросети более бережно относятся к сохранениям своих прав на сгенерированный контент, чем к соблюдению авторских прав произведений на основе которых этот контент сгенерирован.
В следующей статье рассмотрим более подробно, что о вас собирает нейросеть и как оно может быть использовано против вас. Здесь не было примеров с использованием DeepSeek, как раз потому что она больше подходит для следующей части.
Если есть какие то замечания или предложения — с интересом почитаю их в комментариях.