Нейрокомикс: Feedstars — история о космонавте Фидмане
Aгентство Feedstars специализируется на работе со звездами и инфлюенсерами. Поэтому тема для комикса нашлась сразу — космические приключения. Предпочтение по стилистике было отдано в пользу классических комиксов: черно-белый и «обводка». Главный герой — Фидман, ведь именно так называлась платформа для постинга, с которой начиналась история агентства. Фидман — путешественник, который открывает для себя новую галактику (возможно, и целый мир), ищет свое место и предназначение в ней. И (внимание, спойлер) он их находит!
Общее время работы над комиксом заняло около недели. Сначала специалисты разработали и согласовали общую идею, затем выбрали подходящую нейросеть. После начали расписывать подробный сценарий, параллельно создавая основные сцены. На этом этапе команде стало понятно, что нейросети любят экспериментировать. Довериться импровизации пришлось и дизайнерам. Многие сгенерированные изображения вдохновили на развитие дополнительных витков истории.
Перед началом работы было протестировано несколько нейросетей — Midjourney, Stable Duffusion и Kandinsky 2.1. Специалситы остановились на последней — Kandinsky 2.1 от «Сбера». Эта нейросеть имеет простой интерфейс и очень быстрое время генерации, равняющееся одной минуте. И, самое главное, она сразу понимает то, что именно от нее хотят. При наличии основного героя было важно, чтобы он оставался неизменным и узнаваемым, и возможность выбора стиля создаваемого изображения очень в этом помогла.
Вмешательство в сгенерированные изображения было минимальным — кадрирование, удаление редких ненужных артефактов. Основная работа дизайнера заключалась в верстке самого комикса, добавлении текста и цветовой коррекции.
При создании комикса многое зависело от времени генерации изображения. Например, в Stable Diffusion получалась очень крутая картинка, но время генерации порой доходило до 10 минут на одно изображение даже на сравнительно мощном ПК. Плюс ко всему, много времени занимало создание правильного запроса, который далеко не всегда давал нужный результат. Например, пишешь: «one spaceship, no people», а он выдает целый десант.
В Kandinsky 2.1 были свои проблемы, знакомые всем нейросетям, — лицами, конечностями, анатомией и клонами.
Подробные описания, в свою очередь, наоборот тормозили нейросеть. Она начинала мудрить, создавая совсем не то, что требовалось.
Некоторые предметы тоже были деформированы, например, звезды. Но это добавило даже какого-то флера в иллюстрации, намекая на то, что все они уникальны. Поэтому их решено было оставить.
Одна из главных проблем — найти общий язык с нейросетью. При работе с Kandinsky 2.1 мы столкнулись с проблемой написания правильных запросов. Стандарты запросов для других нейросетей тут не подошли. ИИ начинал тормозить, и генерировать картинку получалось только после нескольких попыток и долгих минут ожидания.
Самое главное — сделать правильный выбор нейросети. Они все заточены под разные задачи и требуют совершенно разный подход. Например, работа со Stable Diffusion требует подготовки: поиск подходящих модулей для работы, написание точных и развернутых запросов, мощная видеокарта. Kandinsky 2.1 неплохо справляется с диджитал иллюстрациями, но совсем плох в реалистичной генерации людей.
Источник: www.sostav.ru