С каждым годом на развитие искусственного интеллекта выделяются колоссальные средства. Его начинают добавлять в телефоны, роботы-пылесосы и даже в холодильники. С помощью ИИ ищут информацию, редактируют изображения или просто общаются с чат-ботом. Это очень удобное средство... на первый взгляд. Но вы когда-нибудь задумывались об опасности, которая таится в нейронных сетях? В этой серии статей постараюсь рассказать на примерах о тёмной стороне этой технологии.
В этой серии статей, хочу разобрать как нейросети влияют на нашу жизнь и каких опасностей стоит остерегаться.
Начнём с чего-нибудь «лайтового». Авторское право. В большинстве случаев оно защищает автора от кражи его трудов и их бесплатного использования. Авторское право (АП) распространяется на книги, музыку, картины, программы и т.д. То есть на продукты интеллектуального труда. Даже на фото-стоках картинка не является вашей, пока её не купите. А теперь вернёмся к нейросетям. Что бы красиво нарисовать закат у реки, ИИ должен понимать как выглядят «закат» и «река». Для этого он обучается на большом массиве данных, с изображениями закатов и рек, что бы выявить закономерности и предоставить на основе этих данных результат.
Но откуда берутся массивы для обучения? Если это одиночка захотевший настроить локальный Stable Diffusion для личного использования, то он может понабрать понравившиеся фото из поисковика, не переживая о всяких копирайтах и лицензиях. Так как даже в самом худшем случае, коммент со сгенерированным Илоном Маском в образе усатого трубопроводчика, сидящего в KFC — просто снесут, но судится вряд ли будут. А вот у больших компаний с этим дела обстоят чуть сложнее.
Давайте разберём, откуда компании берут датасеты для обучения. К примеру можно вспомнить, как в 2021 году в Оксфорде была конференция с участием Megatron-Turing NLG. Он был обучен на англоязычных статьях из «Википедии», новостях за 2016-2019 годы и архивах Reddit объёмом в 38 ГБ. Кстати, он сделал весьма пугающие заявления.
Не стоит забывать что ваши промты (запросы к ИИ) тоже используются для обучения. А у Google и Майкрософт, есть помимо них куда больше информации о вас. Впрочем это тема для следующей статьи.
У Midjourney в лицензии говорится что вы даёте ей, её преемникам и преемникам их преемников «бессрочную, всемирную, неисключительную, сублицензируемую, безвозмездную, безотзывную лицензию» на весь контент который вы в неё загружаете.
Так же есть крупнейший набор данных YFCC100M принадлежащей Yahoo. Он содержит в себе, согласно официальному сайту, «99,2 миллиона фотографий и 0,8 миллиона видео с Flickr, все из которых были опубликованы под одной из различных лицензий Creative Commons». Flickr — это сайт для размещения пользовательских фотографий. Значит ли что все изображения опубликованные там, будут скормлены нейросетям? Нет, так как при загрузке фотографий, можно настроить тип лицензии. На выбор даётся 9 вариантов:
Теперь разобравшись с типами лицензий (они нам в будущем понадобятся... наверное), давайте разберёмся какие из них точно не могут использоваться для обучения ИИ. Лицензии с типом NonCommercial не могут быть использованы только для обучения коммерческих моделей, а NoDerivs — вообще ни в каких, так как любая нейро-мазня сделанная на основе изображений — уже считается производной работой, что противоречит лицензии. Что касается Attribution то она может быть использована, только если в отчётах компании которая обучает нейросеть, есть упоминание авторов и ссылки на оригиналы, откуда были позаимствованы изображения (в случае с локальными моделями, в репозиторий должен быть включён документ с перечнем всех использованных работ с данной лицензией). Но тут встаёт вопрос в том, как проконтролировать что бы в обучающую базу, не попали данные защищённые авторским правом. Для этого вначале разберёмся как проходит обучение.
В нейросети, данные о изображении не хранятся в исходном виде. Они «перевариваются» в весы и смещения. Описание этого процесса Займёт не одну статью, поэтому вкратце опишу как это работает (более подробно смотрите у Шарифова и на Вики странице посвящённой Китайской комнате).
Нейросети скармливается набор данных с правильными ответами на них и на основе этого, строятся взаимосвязи. Это всё равно что нам показать тысячи картинок солнца и непонятную нам кракозябру, потом показать дождь и другую загогулину. Мы понятия не имеем на каком это языке, но подозреваем что одно значение означает солнце, а другое — дождь (для нейросети это по прежнему два непонятных объекта, которые связаны с другими двумя непонятными объектами). Весы означают вес элементов. Например у первого иероглифа, после 300 фотографий солнца в разных вариациях (рисунокфото со спутникаснимок), вдруг появится рисунок домика и солнца. В таком случае вес «солнца» будет выше, поэтому дом мы проигнорируем. Чем чаще встречается элемент, тем он весомее.
Теперь, когда в этом разобрались, можно перейти к методам проверки.
В исследовании «Extracting Training Data from Diffusion Models» проведённом сотрудниками Google, DeepMind, ETH Zurich, Princeton, и UC Berkeley, выяснили что при определённых стечениях обстоятельств, нейросеть может выдавать изображения очень близкие к оригиналу. Например:
Исследователи смогли получить тысячи примеров, начиная от фотографий отдельных людей и заканчивая логотипами компаний, которые защищены авторским правом.
Кстати, это к слову о том, что нельзя нейросети рассказывать конфиденциальную информацию. Но это тема для другой статьи.
Ещё порой нейросети выдают изображения с деталями напоминающими водяные знаки. Вот несколько примеров найденных на Reddit.
На последок хотелось бы показать исследование «DIAGNOSIS: Detecting Unauthorized Data Usages in Text-to-image Diffusion Models». Вот что они предлагают:
«В частности, мы модифицируем защищенные изображения, добавляя на них уникальный контент с помощью скрытых функций деформации изображений, которые почти незаметны для человека, но могут быть захвачены и запомнены диффузионными моделями. Анализируя, запомнила ли модель внедренное содержимое (т. е. обрабатываются ли сгенерированные изображения внедренной функцией постобработки), мы можем обнаружить модели, которые незаконно использовали несанкционированные данные».
Кстати, код можно найти на GitHub, ссылка есть на странице исследования.
Также, если у модели открытый исходный код, можно проанализировать его «внутренности» и сопутствующую документацию на предмет сведений о датасетах, на которых она была обучена.
Хорошо, с этим разобрались. А интересовались ли вы, как авторское право распространяется на труды нейросетей?. Но для начала (не)большое отступление.
2011 год. Фотограф Дэвид Слейтер отправился в Индонезию, что бы сделать снимки хохлатых павианов обитающих в заповеднике. Пока фотограф был занят своими делами, макака завладела камерой и нажала на кнопку. Звук привлёк внимание обезьяны и она продолжила нажимать на неё. Было снято много снимков, но хороших получилось мало. По прибытии с заповедника, Слэйтер лицензировал изображение Caters News Agency, на том основании что он, являлся автором идеи и специально хотел чтоб мартышки поиграли с камерой. Он утверждал что всё было в его поле зрении и всё вышло как и задумывалось. Вначале статья об этом появилась на DailyMail, а после вызвала обсуждения на сайте Techdirt, когда там вышла статья о том, может ли фото сделанное обезьяной — быть объектом авторского права. В статье присутствовало 3 фото обезьяны.
Неделю спустя на Techdirt вышел другой пост, в котором говорилось, что представитель компании которой принадлежит фото, связался с автором и попросил удалить их, так как они использованы без разрешения. На что автор был в недоумении, ведь уведомление было написано как обычное письмо, без использования юридических терминов и упоминания авторского права. Да и может ли снимок который сделала обезьяна вообще быть лицензирован, ведь животное не может быть субъектом авторского права? Да даже если и может, изображение были показаны в рамках добросовестного использования (так как статья была новостным репортажем) и проблем быть не должно. Он почти подумал что это может быть шуткой но, всё же отправил ответ, в котором подробно разъяснил свою позицию.
От Caters News Agency пришёл ответ:
«Независимо от того, кто владеет авторскими правами, а кто нет, — на 100% ясно, что владелец авторских прав — это не вы сами».
Автор статьи был в ещё большем недоумении. Так как по логике письма, любой кто не владеет авторским правом, может подать жалобу если и опубликовавший тоже ими не владеет (что является нарушением закона в некоторых местах). Он по прежнему настаивал что даже если Caters владеет правами (в чём он сильно сомневался), его использование изображений является «квинтэссенцией добросовестного использования», так как пост был посвящён не столько самим фотографиям, сколько размышлениям на тему принадлежности авторского права произведениям созданными животными. Поэтому автор оставил фото в посте.
Следующий виток произошёл когда фотографии были загружены на Викисклад (один из проектов Викимедиа). Особенность ресурса заключалась в том, что загруженные фотографии должны быть под свободными лицензиями. На этот раз к Викимедии обратился сам Слейтер и просил либо удалить фото, либо платить за использование. На что получил отказ и объяснение что произведения сделаны не человеком, поэтому они считаются общественным достоянием. После этого Слейтер обратился к BBC, с заявлением что понёс от действий Викимедии финансовые потери (предположительно 10 000 £), так как никто не хочет покупать фотографии, пока они считаются общественным достоянием. После этого начались судебные тяжбы.
Мнения юристов разделились. Одни разделяли точку зрения Викимедии, другие утверждали что авторское право можно приписать по факту владения камерой на которую были сделаны снимки. Так как в таком случае фотограф мог настроить свет, фокус, угол съёмки и прочие действия, а животному всего лишь нужно было нажать на кнопку. Преподаватель в сфере права интеллектуальной собственности, Андрес Гуадамуз, ссылался на другое прецедентное дело, в котором был достаточен сам факт отбора фотографии из массива, для выражения личности фотографа, а значит и приписыванием ему АП.
Всё решилось 22 декабря 2014 года, когда Бюро авторского права США вынесло решение, объяснив, что произведения, не созданные людьми, не являются объектами авторского права, и указав в качестве примеров «фотографии, сделанные обезьянами».
В 2015 году в суд подало уже общество по защите прав животных (People for the Ethical Treatment of Animals, PETA, известная по сомнительным решениям). Они просили о предоставлении обезьянам возможности выступать субъектами авторского права, и позволить PETA заниматься администрированием средств полученных от фотографий этого, и всех других хохлатых павианов из заповедника. Позже стало известно что они возможно перепутали обезьяну и указали в заявлении не того павиана, который изображён на снимке. Они заявляли что это девочка Наруто, в то время как Слейтер утверждал что это был другой примат, и вообще самец.
11 сентября 2017 года суд отклонил апелляцию PETA. Слейтер сделал добровольное пожертвование в размере 25 процентов от всех средств, заработанных за счёт этих снимков, в пользу фонда защиты хохлатых макак.
Что то мы отошли от темы, давайте вернёмся к нейросетям. Как видно из примера с макакой, на момент 2017 года, авторское право распространялось только на людей. Но что насчёт компьютеров? Точной правовой базы пока что нет, поэтому правила отличаются в зависимости от модели. Например:
Нейросети более бережно относятся к сохранениям своих прав на сгенерированный контент, чем к соблюдению авторских прав произведений на основе которых этот контент сгенерирован.
В следующей статье рассмотрим более подробно, что о вас собирает нейросеть и как оно может быть использовано против вас. Здесь не было примеров с использованием DeepSeek, как раз потому что она больше подходит для следующей части.
Если есть какие то замечания или предложения — с интересом почитаю их в комментариях.
Про историю с макакой, которой дали в руки фотоаппарат и она сделала селфи, поэтому авторских прав на неё нет — обезьянам не присваивают. Это такой выпад против авторских прав. Люди, связанные с искусством изобретательны в смысле подобных выходок, принятых называть перформансами. Не знаю, насколько правозащитники и вообще юристы эти заявления всерьёз воспримут.
Так уже суд был (и тяжбы до 17 года велись), где и обсуждался данный вопрос