Что умеют и могут нейросети? Рассказываем, как ИИ рисует картины, пишет дипломные работы, сдает экзамены и читает по губам
Пока мы наблюдаем за развитием конфликта нейросетей и цифровых художников, в других отраслях эта технология тоже делает большие успехи: ищет ответы на любой вопрос, анализирует кредитную историю, пишет остроумные комментарии в Twitter и помогает в диагностике болезней. Мы собрали самые интересные и важные достижения нейросетей в этом материале.
Сразу закроем тему «картиночных» нейронок — про их возможности мы выпустили большой материал, где рассказали о том, как они работают, на что способны и как их настроить и использовать. Также мы подготовили разнообразные гайды на эту же тему.
Гайды по нейросетям
- Нейросети: лучшие программы для улучшения или создания изображений и видео
- Как создавать портреты при помощи нейросети Stable Diffusion
- Редакция VGTimes рисует арты при помощи нейросети — смотрите, что у нас получилось
- Китайская нейросеть Me in Comics рисует аниме из фото онлайн — что делать, если она не работает?
- Как пользоваться нейросетью Midjourney онлайн: как зарегистрироваться и создать нужную картинку по запросу
- Как пользоваться ChatGPT: как зарегистрироваться из России, почему нейросеть не дописывает текст и другие ответы на частые вопросы
- Лучшие нейросети для создания презентаций в 2024 году
Помимо создания картинок, нейросети способны вырезать фон, подгонять изображение под различные стили, генерировать сотни несуществующих людей в секунду — новости о подобном мелькали весь минувший год.
Успехи этой технологии в других областях — науке, бизнесе и медицине — куда важнее, но не столь наглядны и эффекты. Хотя та же ChatGPT заставила поволноваться даже Google.
Какую нейросеть пробовали?
Всемогущая ChatGPT
ChatGPT — это чат-бот на основе языковой модели GPT-3,5. По словам разработчиков из компании OpenAI, сама модель может быть использована для решения «любых задач на английском языке». И они ни разу не преувеличивают.
ChatGPT способна писать стихи, рассказы, вести осмысленный диалог, отвечать на вопросы лучше, чем Google, аргументировано спорить и даже писать код.
Школьники и студенты давно научились списывать тесты, но проверка сочинений и развернутых вопросов до недавнего времени всё ещё могла сказать преподавателю об уровне знаний ученика. С появлением ChatGPT уже нельзя быть уверенным в этом.
Так, педагог из российского лицея попросил нейросеть написать итоговое сочинение для ЕГЭ и дал оценить результат нескольким коллегам. Если не брать во внимание пару повторов и небрежностей, подобное сочинение получило бы «зачёт», оно соответствовало всем требуемым критериям оценки: необходимый объём, наличие аргументов, выводов и так далее.
Другой энтузиаст «погонял» нейросеть по вводному курсу микробиологии, и программа справилась с задачей лучше, чем среднестатистический студент. Более того, нейросеть понимала сравнения, смогла выделить общую черту у нескольких понятий и решить задачу по микробиологии, обосновывая каждый шаг. По словам автора материала, он поставил бы нейросети 95 баллов из 100, что куда больше, чем получает среднестатистический студент-микробиолог.
ChatGPT отлично справляется с большим объемом данных. Этим воспользовался судья из Колумбии, который столкнулся с очень специфичным делом — необходимо было узнать, покрывает ли медицинская страховка ребенка с аутизмом все расходы на его лечение. Служитель Фемиды вбил все исходные данные в чат-бот, который проанализировал данные из интернета и вынес вердикт в пользу ребенка.
Конечно, он не спросил напрямую о том, какое решение необходимо принять. Судья вводил конкретные запросы, а чат-бот искал информацию о судебных прецедентах. Но даже процесс принятия решения многократно ускорился.
Недавно один из студентов московского вуза за 23 часа написал с помощью ChatGPT диплом, который потом успешно защитил. Сначала он попросил сформировать план диплома по заданной теме, затем — расписать каждый из пунктов. Конечно, пришлось редактировать стилистику текста и править перевод, но зато оригинальность работы составила 83%. И, пожалуй, если бы этот случай не получил огласки в соцсетях, «искусственности» работы никто бы и не заметил.
Для того, чтобы бороться с подобным, OpenAI, компания-владелец чат-бота, даже выпустила инструмент AI Text Classifier, который достаточно хорошо определяет тексты, написанные нейросетью. Сейчас инструмент находится на стадии разработки, и создатели обещают улучшить алгоритмы для более точного распознавания.
Но если текст будет переписан «на бумагу», с распознаванием могут возникнуть определенные трудности. А ведь этот процесс также успели автоматизировать. Блогер Тормари Лул (Tomary lul) на своём YouTube-канале показал связку из ChatGPT и 3D-принтера. Вместо печатающей головки на 3D-принтере установлена обычная ручка, текст генерируется чат-ботом, а после сразу передается в ПО 3D-принтера.
Похоже, учителям будущего придётся находить новые критерии оценки знаний учащихся, ведь ни тесты, ни сочинения, ни развернутые ответы уже не будут давать гарантии, что это личные знания, а не переписывание «с интернета».
Конечно, тот факт, что нейросеть обучалась на английском языке, накладывает некоторые ограничения в российских реалиях, но даже так модель способна на многое.
Поисковик нового времени
ChatGPT способна обсуждать с пользователем прочитанные произведения, отвечать на философские вопросы, давать внятные ответы, обобщать информацию (и лить воду, если нужно), понимать строгие рамки и условия, рифмовать и искать информацию лучше Google.
В отличии от поисковика, она даёт не ссылки на тысячи различных страниц, а один вполне конкретный ответ. Причём сформулированный так, что его можно просто переписать в тетрадь и сдать на проверку.
Поэтому вскоре после появления ChatGPT другие компании, владеющие поисковиками, либо начали работу по внедрению чат-бота в свои сервисы, либо анонсировали собственные аналоги технологии.
Microsoft буквально на днях показала обновленный поисковик Bing NEW. К нему подключили ИИ-модель, и теперь пользователь при запросе получает сразу два результата. Слева — «классические» ссылки на страницы, а справа — подсказки бота.
Новый поисковик способен отвечать на предметные запросы вроде «поместится ли полка из IKEA с артикулом X в минивэн», а также перенаправлять пользователя напрямую в интерфейс чат-бота, чтобы уточнить запрос или отправить результат по почте друзьям.
Бот также способен пересказывать PDF-файлы, сравнивать информацию из нескольких источников и выводить результаты в виде таблиц, переписывать фрагменты кода или публиковать заметки в LinkedIn. Компания старается внедрить эту технологию в свою экосистему, создавая тем самым настоящего виртуального помощника.
Информации о системе Google куда меньше. Она зовётся Apprentice Bard. Важной особенностью технологии является актуальность информации. Поисковый бот имеет актуальную базу данных, в то время как ChatGPT обучен на дата-сете от 2021 года. Об актуальных событиях он ничего не знает.
Поисковая выдача продукта Google схожа с Bing NEW. Всё те же две версии — сгенерированный ответ и классический список ссылок. В отличии от продукта OpenAI, система старается генерировать ответы из нескольких источников, а не «копирует» ответ из одного. Других подробностей о технических аспектах и возможностях Apprentice Bard нет.
Да и энтузиасты не остались в стороне — для браузеров на базе Chrome и Mozilla создали расширение, которое встраивает ChatGPT в такие поисковики как Google, «Яндекс» и DuckDuckGo. Механизм работы тот же — слева запросы, справа «ответ» нейросети на родном для пользователя языке. Возможности чат-бота, в том числе его способность писать код, сохранились в полной мере.
Код, который пишет себя сам
Технология zero-code — перспективное направление в развитии нейросетей, которое позволит создавать приложения без необходимости написания кода. И эти приложения будут не только запускаться, но и исправно работать.
Упомянутая выше ChatGPT уже сейчас способна анализировать строки кода, объяснять принципы алгоритмов, писать программы по запросу и даже указывать на ошибки. Сервису StackOverflow, где программисты могли задавать вопросы друг другу, пришлось ввести ограничение на ответы с помощью этой программы.
Так, один энтузиаст с Reddit написал «нейродебаггер». Он способен анализировать код, написанный на 22 языках программирования, и объяснять, где ошибка и как её исправить.
В основе программы лежит нейросеть OpenAI Codex, которая также часть ChatGPT. С помощью последней пользователь habr написал простенькое приложение на Android. Ну, как написал: энтузиаст решил поставить эксперимент — лично он не напишет ни одной строчки кода, а лишь будет копировать ответы чат-бота. При этом он внимательно следовал советам нейросети и, при появлении ошибок и багов, спрашивал у ChatGPT способы их решения.
В результате, спустя десяток-другой запросов, ему удалось создать приложение, которое запускается и исправно показывает актуальный курс акций 50 самых известных компаний.
Сверхточная хирургия и мгновенный анализ
Недавно мы писали в новостях о том, что врачи провели первую в мире операцию на мозге с использованием ИИ. Благодаря технологии Human Connectome врачи отсканировали мозг пациента, проанализировали его и спланировали операцию так, чтобы выполнить хирургическое вмешательство через отверстие в черепе размером менее сантиметра. Ранее приходилось делать разрезы в 2,5-3 см.
Но ИИ в медицине применяется уже достаточно давно. Нейросети, на основе массива данных о пациенте, рассчитывают оптимальные дозировки препаратов, помогают искать эффективные методы лечения, а также диагностировать различные виды рака с помощью полноформатных изображений, которые могут весить до 1 Гб. Анализ подобных изображений врачами без ИИ занимает в десятки раз больше времени.
Если обобщать, подобные технологии постепенно становятся верными помощниками врачей всех специальностей. Уже сейчас ИИ может поставить диагноз точнее, чем большинство известных методик, рассчитать программу лечения, проконсультировать пациента, проследить за ходом заболевания и ответить на все возникшие вопросы чуть ли не напрямую.
Конечно, законодательно всё это остаётся лишь в рамках лабораторных исследований. Для повсеместного использования технология пока слишком молода. Кто будет отвечать за ошибку ИИ? Достаточно ли 95% точности в диагностике? Не натворит ли он дел в плохом смысле, как это случается с технологиями автономного вождения?
Научные открытия, требующие обработки большого объема данных
Но в полной мере нейросети, конечно, раскрываются, когда речь заходит о «больших данных» — областях науки и технологий, где нужно оперировать гигантским количество информации, по определенным критериям выцепляя нужное или генерируя и тут же проверяя новые концепции.
В основе большинства лекарств — действующее вещество с определенным составом. Одно из самых перспективных направлений — создание новых лекарств. Для этого нейросеть сначала просят «сгенерировать» новую молекулу, активное вещество, а после смоделировать её параметры — предсказать, как она поведет себя в той или иной ситуации и какими свойствами будет обладать.
Так, вариант за вариантом, компьютер выдумывает всё новые опции. Конечно, их ещё предстоит воссоздать и протестировать, но машина делает это в сотни и тысячи раз быстрее, чем делал бы человек.
Что интересно (и страшно), не так давно энтузиасты сделали то же самое «наоборот» — попросили специально обученные нейросети смоделировать как можно более токсичные вещества. Нейросеть выдала больше сорока тысяч вариантов, многие из которых ученые идентифицировали, а некоторые оказались и намного более токсичными.
Благодаря ИИ уже были совершены открытия в области химии, астрономии, математике, физике, а также во многих других областях, которые требуют вдумчивого и кропотливого анализа.
Дело в том, что человечество вплотную подобралось к технологиям, которые генерируют слишком много данных. К примеру, скоро запустят Square Kilometer Array — прибор для исследования космоса, который будет производить столько же трафика, сколько весь интернет. Без «виртуальных помощников» никак не обработать столько данных, даже если над ними будут трудиться все астрономы мира.
Рутинные дела и бизнес-планирование
Ещё в 2018 году «Сбер» сократил 14 тысяч сотрудников, часть из которых отправил на переобучение в другие отделы. По словам руководства банка, они выполняли рутинную работу, которую удалось переложить на плечи искусственного интеллекта. А к 2025 году планируется «оптимизировать» таким образом половину рабочего штата.
Эта новость — ещё один повод задуматься о возможностях нейросетей. Всё чаще их используют для обыденных вещей: ИИ выписывает штрафы, находит пропавшие машины по камерам видеонаблюдения, анализирует рукописный текст и сканы документов, рассчитывает износ оборудования и даже вырабатывает бизнес-стратегии.
Например, по Москве сейчас катаются специально оборудованные машины, которые в автоматическом режиме фиксируют «изъяны» города: ямы на дорогах, покосившиеся дорожные знаки, сломанное городское имущество. Всего шесть таких автомобилей за пару месяцев смогли зафиксировать более 23 тысяч нарушений. А если машин будет больше?
Или, например, другое направление. Если ИИ сможет читать по губам? Загрузить записи камер наблюдений, сделать базу с биометрическими данными людей — и готов тот самый «Большой брат», которого так часто рисуют в старых боевиках. Хотя представлять не нужно — Meta Research представила аудиовизуальную скрытую модель BERT AV-HuBERT, которая, если запись достаточно чёткая, прекрасно читает по губами почти в реальном времени.
Другой проект, Dbrain, занимается распознавание рукописного текста и проверкой документов на подлинность. Он сравнивает формат изображения, ищет артефакты и «надписи поверх», проверяет информационную «подпись» фотографии, тем самым позволяя за секунды распознавать поддельный документ или его фото.
А недавно Google представила свою нейросеть для редактирования видео. Она способна создавать видео по текстовому описанию и менять объекты в кадре. Например, можно сфотографировать машину на парковке, а нейросеть создаст видео, где эта машина пересекает реку вброд.
Эта технология взяла своё начало из другой — некоторые «картиночные» нейросети уже давно умеют дорисовывать изображения, добавляя новые детали или заменяя одни объекты другими по текстовому описанию. Одна из таких программ — Text to Image Editor. Но и в той же Stable Diffusion есть специальный модуль inPaint. Пририсовать очки Ван Гогу? Легко! Перекрасить красный автомобиль в зеленый? Не вопрос! В общем, генерация видео — лишь следующий шаг технологии, которая может изменить кинематограф и отрасль CGI-эффектов.
Хотя гораздо чаще мы сталкиваемся с «рекламными ИИ». Большинство крупных компаний вроде Google, Amazon или Alibaba используют их для оптимизации рекламных баннеров, всё лучше угадывая потребности и запросы граждан. Так что если вы произнесли где-то слово «матрас», а через пару минут увидели его рекламу, знайте — это работа нейросети.
О будущем нейросетей и рисках
На наших глазах мир начинает с азартом использовать нейросети во всех сферах жизни. В науке они обрабатывают петабайты данных за считанные дни, в бизнесе — берут на себя рутинную работу и подсказывают, как можно оптимизировать процессы. В медицине — следят за пациентом и вырабатывают стратегии лечения не хуже профессиональных докторов.
Но стоит помнить, что нейросети — лишь инструмент. И этот инструмент использует накопленные интернетом знания. И тут возникает проблема — условный программист или блогер оставляет в сети куда более четкий информационный след, нежели слесарь или лесоруб. В результате последние для нейросетей ценятся куда ниже, ведь упоминаний о них меньше.
Из-за подобных казусов, к примеру, в США свернули проект по автоматической выдаче кредитов. Созданная нейросеть отклоняла 80% заявок со стороны темнокожих клиентов или людей с определенными фамилиями или профессиями, поскольку в данных, которые ей «скормили», статус людей с подобными «тегами» был очень низким.
Да и интернет знает множество случаев, когда нейросети или чат-боты быстро становились злодеями, которые сыпали расистскими и антисоциальными высказываниями. Недавно по этой причине забанили на Twitch Neuro-Sama, нейросеть-витубера. Затем, правда, разбанили.
«Стримерша» отправилась смотреть Nothing, Forever — бесконечный мультяшный ситком, в котором сценарий, картинка и озвучка создаются «коллективом» нейросетей.
Но хватило Neuro-Sama ненадолго — вскоре она вновь начала размышлять на неприемлемые темы и её канал заблокировали. Впрочем, следом в бан отправился и Twitch-канал ситкома, главный герой которого также начал размышлять о «болезнях» трансгендеров.
Конечно, все эти скандалы и резонансные случаи прогресс не остановят. Но нам следует помнить о том, что нейросети — инструмент безграничной силы, который направляют люди. Возможности технологии трудно осознать и, вполне возможно, в ближайшее десятилетие она изменит представление людей как о науке, так и о технологиях в целом.
Мнение ведущего программиста сервиса нейросетевых технологий
Наконец, мы решили спросить мнение человека, который каждый день работает с нейросетями и хорошо в них разбирается, — ведущего программиста сервиса NeuroFox.pro под ником Mr4erk.
VGTimes: Здравствуйте! Спасибо, что откликнулись. Какое применение нейросетевых технологий за последнее время впечатлило вас больше всего? Может, генерация картинок, диагностика болезней? Или что-то другое?
Mr4erk: Добрый день! Из последних достижений нейросетей меня впечатлили GitHub Copilot и недавно стрельнувшая ChatGPT в сфере программирования.
GitHub Copilot, как описывают его разработчики, «ваш искусственный напарник-программист». Это система, которая в реальном времени анализирует создаваемый пользователем код, а после предлагает варианты его продолжения в виде отдельных фрагментов или функций. Настоящий Т9 в мире программирования.
Система также способна превращать комментарии, описывающие функцию, в код. То есть мы в буквальном смысле вводим текст «создать алгоритм, который будет перемножать две матрицы 3х3», прописываем дополнительные условия и за минуту получаем работающий алгоритм.
А про возможности ChatGPT, думаю, многие и так слышали.
VGTimes: За какой, по вашему мнению, срок нейросети смогут полностью изменить науку, автоматизировать рутинные действия вроде обработки данных или пробной генерации тех же молекул?
Mr4erk: Тут сложно оценивать какие-то сроки. Могу лишь сказать, что очень быстро (в течении пяти-десяти лет) это всё упрется в мощности, которые, в свою очередь, упрутся в законы физики. Если за это время не будет какого-то технологического прорыва в обучении нейросетей.
Уже сейчас мы подбираемся к отметке в 1,5 нанометра в архитектуре процессоров. Делать их меньше — уже физически невозможно. А нейросети хотят «кушать». И «кушают» они очень много.
VGTimes: Могут ли запретить эту технологию, как потенциальную опасность для человечества? Ну, знаете, может какой-нибудь SkyNet появится?
Mr4erk: В плане запретов считаю, что всё это довольно сложно, вряд ли будет. Если что-то и будет, то коснется в основном больших корпораций.
Запретить нейросети — это как запретить считать на калькуляторе или, как вариант посерьезнее, запретить криптовалюты. Какие-то ограничения уже есть, но они больше формальность, чем запрет.
Насчет SkyNet или чего-то подобного: дайте нейросети навыки и ресурсы для самообучения — и он сам себя напишет.
Что думаете о восстании машин?
* * *
А что вы думаете о нейросетях и их потенциале? Может, знаете интересные случаи использования этой технологии, которые мы упустили? Поделитесь ими в комментариях!
-
Google показала новый поиск со встроенным ИИ
-
Нейросеть пишет и читает рэп в стиле Дрейка — бесплатно и на любую тему
-
ИИ нарисовал, какой будет The Elder Scrolls 6. А еще нейросеть даже рассказала сюжет игры
-
Нейросеть показала, как выглядели бы Duke Nukem 3D, DOOM, Final Fantasy 7, RDR 2 и другие игры в стиле фильмов 80-х
-
Google представила нейросеть для создания и редактирования видео