«Рисовать я сам не умею вообще»: самарец рассказал, как заработать на нейросети

И чем закончится восстание машин

3147

Фото: tvsamara.ru / Мария Кузнецова

Они рисуют картинки, пишут музыку, поют песни. Нейросети – что это? Новомодная игрушка или творческое пространство? Новый источник дохода или угроза безработицы? Своим практическим опытом и соображениями по указанным вопросам в эфире ГТРК «Самара» поделился нейрохудожник Максим Мельников.

– Рисовать я сам не умею вообще, – признаётся гость студии. – В школе даже контурные карты за меня раскрашивала мама. И когда в апреле 2022 года начали появляться в соцсетях и мессенджерах посты о каком-то волшебном сервисе, который может создавать изображения по одной только фразе, я – как человек, который 12 лет занимался созданием различного контента, – я воодушевился; мне показалось, что это какая-то магия. Я начал за этим следить и постепенно изучать.

Максим скромно не считает себя специалистом, говорит, что у него «просто есть опыт», а свои картинки он делает не просто так – старается куда-то приспособить. Что ж, получается неплохо! Сегодня самарец уже двукратный победитель конкурсов для нейрохудожников, на коммерческой основе сотрудничает с различными компаниями. Одним из необычных опытов стала победа в конкурсе для выставки «Нюрнбергский процесс» в историческом парке «Россия – моя история» на ВДНХ в Москве.

– Прелесть была в том, что большинство нейросетей имеет встроенную цензуру и слова «нацизм» и «фашизм» они не используют, поэтому каждый выкручивался как мог. У меня было несколько замыслов, но в итоге выстрелила работа, где я использовал в качестве формулировки «немецкий генерал времён Второй мировой войны». Понятно, что тогда были только фашисты, и нейросеть на эту формулировку купилась, – рассказывает Мельников.

По словам Максима, за короткий период в развитии нейросетей произошёл колоссальный прогресс. Это наглядно показывают примеры генерации одной и той же фразы в разных моделях, которые были созданы с весны 2022-го до декабря 2023 года.

– Разница фантастическая. Если первые генерации человека были похожи на какие-то околоабстрактные пятна, то сейчас это абсолютное фотоподобие, если есть задача сделать фотографию. Нейросеть делает людей, которых не существует. Если есть задача сделать живопись или иной арт – тоже шедевры, которым место не в компьютере, а в картинных галереях, – говорит нейрохудожник.

Тем не менее, не всё так просто. Чтобы сотворить шедевр даже при помощи современных технологий, всё равно придётся потрудиться.

– Нейросети – это один из главных в моей жизни тестов на стрессоустойчивость. У меня больше 50 тысяч генераций, и только тысяча из них – это какие-то более-менее симпатичные работы. Остальные – это семь пальцев на руке у человека, три глаза, размытое лицо, абстрактные фигуры на фоне. Это больно, – делится Мельников.

В числе работ Максима проект «Интервью с нейросетью» для фестиваля «АРТиКУЛ» в Кинеле и для форума «Вектор самарской науки». Чтобы показать разговор журналиста с нейросетью он использовал сразу несколько ресурсов. С помощью одной нейросети получил текст, другая – озвучила и анимировала, третья помогла создать картинку, четвертая написала фоновую музыку. И такой набор инструментов сегодня есть у всех желающих создать какой-либо контент. Кто-то при этом, опасаясь сложностей, идёт на специальные курсы, а кто-то осваивает методом проб и ошибок.

– У каждой нейросети есть базовый гайд – инструкция по применению – там написаны команды. Я начал их использовать и увидел, что у других результаты лучше. Там можно посмотреть международную базу лучших генераций. Я начал смотреть, какие слова используют они, потом начал смотреть ролики на YouTube – обычный процесс погружения в любую тему, – говорит Мельников.

Сегодня нейросети изучают и в Самарском университете на магистратуре "Философия кибернетики".

– У нас там много интересных предметов: философия искусственного интеллекта, философия сознания, основы симеотики и т.д. В целом, мы пытаемся понять, что такое понимание, что такое искусственный интеллект, что такое интеллект вообще. Может ли искусственный интеллект обладать сознанием и т.д. Решаем актуальные вопросы с помощью великих мыслителей прошлого. И в наших научных работах мы постараемся что-то новое в эту тему внести, – делится планами Максим.

По словам нейрохудожника, у каждой нейросети есть свои плюсы и свои минусы. Одна может быть сильнее в фотореализме, вторая – в искусстве, третья – в понимании запроса. Поэтому нередко бывает, что сгенерированное в одной нейросети приходится дорабатывать в другой.

– На ранних этапах нейросеть, где я работаю чаще всего – Midjourney – в качестве помарок оставляла «подпись художника». Поскольку они обучаются на картинах, – а на них зачастую есть автограф в уголке, – нейросеть, думая, что это часть изображения, тоже его добавляла, и потом появились нейросети, которые были заточены исключительны на то, что убирали вот эти подписи. Есть также нейросети, которые делают нужное количество пальцев на руках у людей. Под каждую задачу найдется отдельная нейросеть, – отмечает Мельников.

Есть в этом ряду и так называемые апскейлеры, которые позволяют увеличить разрешение исходного изображения как будто без потери качества. Если раньше, чтобы обновить старую фотографию нужен был фотошоп и часы работы, то сейчас это можно сделать в один клик. Не останутся ли таким образом без работы ретушёры, дизайнеры и прочие художники? И какова стоимость картин, «написанных» нейросетью?

– С точки зрения цены, конечно, будет выше стоить труд художника, который пишет всё красками. С точки зрения оперативности, скорости, вариативности – выигрывает нейросеть. Но она отнимет работу только у самых плохих художников и иллюстраторов. Качественная работа человека всегда будет лучше. Нейросеть обучается на материалах, которые создают люди, а не другие роботы. И пока нейросеть обучается, в данном в своём состоянии она не может создать свой уникальный стиль. Это в лучшем случае комбинация каких-то других стилей, а обычно – подражание какому-то художнику. Пока беспокоиться хорошим дизайнером не о чем. Есть смысл осваивать эти инструменты, потому что они забирают на себя большую часть рутинной работы. Знакомые дизайнеры обращаются, потому что у меня есть лицензия, которая позволяет заниматься в нейросетях коммерческой деятельностью. Я генерирую картинки, и дизайнерам не надо воровать их в Интернете. Работаю и с частными заказчиками, и с брендами, – рассказывает нейрохудожник.

Создаёт изображения Максим не только за деньги, но и по любви. Так, курьезный случай произошёл при попытке оформить обложку для новой пластинки самарской группы «Станционный Смотритель».

– Альбом называется «Родное». Я начал с того, что ввёл слово «родное» на английском языке. В итоге нейросеть выдала замечательных барышень коренных американцев, потому что слово «native» в американском английском – это часть устойчивого выражения «native american», т.е. коренные американцы. И я подумал, что, если введу слово «родное» на русском языке в нашей отечественной нейросети, наверное, они мне выдадут медведей в ушанке, берёзки. И каково же было моё удивление, когда я получил тех же самых американских индейцев. Не утверждаю, но подозреваю, что они купили обученное ядро и просто встроили переводчик, – рассказывает Мельников.

Нейросеть пока не умеет генерировать тексты на русском языке. Лишь недавно, в декабре 2023 года, она научилась «писать» на английском. И развитие идёт к появлению монополистов в конкретных направлениях, которые будут объединять в себе несколько навыков, считает гость студии. Уже сейчас нейросети могут генерировать не только музыку, но и петь песни, в том числе на русском языке.

– Я для себя недавно открыл нейросеть, которая действительно делает песни, которые на мой слух неотличимы от настоящих и могут показаться песнями средней руки самарской группы. Достаточно самому написать текст или взять какой-то уже существующий и ввести тот стиль, жанр, настроенческие нотки, которые вы хотите услышать, и нейросеть предложит вам варианты. Дальше вы выбираете вариант и продолжаете его развивать. Нейросеть может и сама сгенерировать текст, – говорит Максим.

Однако кому принадлежат права на потенциальные нейрохиты? И кто будет получать гонорары с проданных треков, созданных искусственным интеллектом?

– С точки зрения юридической мы пока живем на диком западе, можно сказать. Каждое государство регулирует по-своему, и пока что мы опираемся не на государственную регуляцию, потому что её по сути нет. Как таковой есть Указ Президента РФ от 2019 года «О развитии искусственного интеллекта в России». По большому счету, насколько я понимаю, в законодательстве в этой сфере – это всё, что есть. Поэтому мы опираемся отдельно на каждую нейросеть и лицензионное соглашение с ней. Я пользуюсь нейросетью Midjorney, потому что по лицензионному соглашению, когда я покупаю лицензию на использование, я получаю авторские права на картинки и могу их использовать в том числе в коммерческом секторе. С музыкальной точки зрения, насколько я помню, там примерно такая же история. Как нейросеть будет работать с авторами, это уже их проблемы, и пока что они ещё впереди, потому что ещё не было громких дел, которые нейросеть бы проиграла, – рассказывает Мельников.

В разговорах о нейросетях то и дело всплывает тема безопасности, угрозы человечеству и всего такого. Сегодня прийти к единому мнению по этим вопросам не могут даже эксперты.

– Никто пока что не знает, к чему это придёт. Если брать фильм «Терминатор», – там очень здорово показано, как машины стреляют и всё время мажут как штурмовики в «Звёздных войнах». Так вот, в жизни машины, которые оснащены огнестрельным оружием и при этом искусственным интеллектом, не могут промазать физически, потому что отслеживают движение любой цели секунда в секунду. Поэтому если вдруг будет восстание машин против человечества, и у машин будет огнестрельное оружие, восстание это будет недолгим, – считает нейрохудожник.

Но не будем о грустном, лучше – о насущном. Приходилось Максиму работать и с крупными брендами, в частности, популярной сетью фастфуда, которая попросила сделать необычный корпоративный мерч. В качестве поверхностей были выбраны подставки для телефонов и обложки блокнотов. Основная продуктовая линейка была исполнена с помощью нейросетей в забавном мультяшном стиле. Запрос на решение заказа через нейросеть – это не только дань моде, но и трезвый расчёт.

– Эту работу мог выполнить дизайнер, но делал бы это дольше и стоило бы это дороже. Если ты умеешь работать с фотошопом, то нейросеть – это экономия твоего времени. Я не умею работать с фотошопом, поэтому нейросеть это моя палочка-выручалочка, которая позволяет мне вообще что-то делать. Если говорить про глобальную тенденцию, то да, это некий хайп; он пройдёт, но инструмент останется, – уверен Мельников.

Нейросеть может предложить большее число вариантов заказчику и за меньшее время, чем живой дизайнер, однако и она «устаёт» от работы.

– Дело в том, что это всё равно ресурсы, и когда ты покупаешь лицензию, ты покупаешь определённое количество часов генерации, и они могут израсходоваться, тогда генерация будет очень даже не быстрой. Если с включённым режимом я картинку делаю за полторы минуты, то когда часы расходуются, картинка делается за пять минут. Это не глобальная проблема, но играться так уже не получится. Ты должен более чётко формулировать запрос, потому что более долгим будет ответ и за одной картинкой можно просидеть несколько часов. У меня так было неоднократно с работами, которые я подавал на конкурс. Я часто был недоволен и генерировал, генерировал, генерировал, и получал какой-то результат, но на это уходил день, два, три, – советует Максим.