Общество поглотила страшная болезнь: нейрокомикс от Interpool

В нашей истории создания и философии Interpool мы переносимся в мир известной франшизы, в котором общество поглотила страшная болезнь. Из-за хаотичности и перегруженного инфо-клаттера, к которому мозг человека не успевает адаптироваться, люди потеряли всякую осознанность восприятия жизни и вещей вокруг. Рекламные материалы не органично упакованы для подачи и восприятия людей. Их внимания не хватает на то, чтобы поглощать и усваивать удобоваримо растущий поток неорганизованной информации.

В центре событий собирательный образ работника нашей компании — Вео. Он начинает замечать что-то подозрительное вокруг себя и хочет выбраться из этого круговорота и спасти человечество. А ты готов узнать правду?

Изначально мы определили для себя визуальное описание для каждого действующего лица комикса.

В описаниях мы использовали маркеры, чтобы AI мог опираться на популярные референсы при создании:

В итоге у нас получилось нечто среднее между всеми маркерами, что нас по итогу устроило.

Двигаясь по сюжету, мы пытались ставить персонажей в различные ситуации и изображать на их лице эмоции. Для этого использовали одно и то же описание внутри команды Midjourney + описание ситуации или эмоции.

Проблемой здесь стало то, что AI каждый раз генерирует персонажа заново, и почти всегда они абсолютно не похожи друг на друга.

Здесь мы начали использовать подходящие изображения персонажей (как референс-ссылка внутри команды для MJ) и описывать ситуацию, эмоцию и окружение.

Здесь важным стал тот момент, что для персонажа необходимо прописывать ключевые детали, которые MJ опускает при создании — это красные линзы очков и очки как таковые. Для этого, после ссылки на референс, мы везде добавляли man in red lense glasses, что решило проблему.

Пример, как изменился персонаж при использовании команды:

При создании диалога между таксистом и главным героем мы столкнулись с другой проблемой — это ракурсы. Описания side view или backside view никак не помогали делу, поэтому к первичному описанию backside view in a car, мы добавили view from backside passenger, после чего мы сохранили схожесть персонажа на всех кадрах и получили нужный нам ракурс.

Пример неудачной и удачной реализации:

Помимо MJ, мы использовали ChatGPT plugin Photorealistic для составления базовых промптов, и в ряде случаев он помогал.

Сначала были сложности с тем, что картинки получались хорошие, но более реалистичные, чем того требует комикс. Или же в другой графической манере, несмотря на указание Manga style.

Два подобных примера и промпт ниже.

Еще одна сложность — отрисовка двух разных персонажей на одном кадре была проблемой, так как MJ скрещивал их характеристики, одежду, и наличие референсов тут не помогало.

Пример смешения:

И даже одного персонажа он никак не мог усадить в одну сторону, чтобы в другую мы могли поставить собеседника героя.

Поэтому решили сначала создать само пространство, в которое потом встраивали уже отдельно созданных и вырезанных героев.

В итоге после четырех недель работы набегами в «свободное» время, получили неординарный опыт сторителлинга собственной «сказки» и философии; узнали о более подробных настройках параметров MJ, приоритеты промптов и итоговую выдачу их как результат у MJ; научились гибко подходить к решению в выражении определенных сцен.

И, конечно, преисполнились в своем познании. А также замахнулись на вторую часть комикса. Спасибо Sostav-у за такой интересный челлендж!

Источник: www.sostav.ru