Общество поглотила страшная болезнь: нейрокомикс от Interpool
В нашей истории создания и философии Interpool мы переносимся в мир известной франшизы, в котором общество поглотила страшная болезнь. Из-за хаотичности и перегруженного инфо-клаттера, к которому мозг человека не успевает адаптироваться, люди потеряли всякую осознанность восприятия жизни и вещей вокруг. Рекламные материалы не органично упакованы для подачи и восприятия людей. Их внимания не хватает на то, чтобы поглощать и усваивать удобоваримо растущий поток неорганизованной информации.
В центре событий собирательный образ работника нашей компании — Вео. Он начинает замечать что-то подозрительное вокруг себя и хочет выбраться из этого круговорота и спасти человечество. А ты готов узнать правду?
Изначально мы определили для себя визуальное описание для каждого действующего лица комикса.
В описаниях мы использовали маркеры, чтобы AI мог опираться на популярные референсы при создании:
В итоге у нас получилось нечто среднее между всеми маркерами, что нас по итогу устроило.
Двигаясь по сюжету, мы пытались ставить персонажей в различные ситуации и изображать на их лице эмоции. Для этого использовали одно и то же описание внутри команды Midjourney + описание ситуации или эмоции.
Проблемой здесь стало то, что AI каждый раз генерирует персонажа заново, и почти всегда они абсолютно не похожи друг на друга.
Здесь мы начали использовать подходящие изображения персонажей (как референс-ссылка внутри команды для MJ) и описывать ситуацию, эмоцию и окружение.
Здесь важным стал тот момент, что для персонажа необходимо прописывать ключевые детали, которые MJ опускает при создании — это красные линзы очков и очки как таковые. Для этого, после ссылки на референс, мы везде добавляли man in red lense glasses, что решило проблему.
Пример, как изменился персонаж при использовании команды:
При создании диалога между таксистом и главным героем мы столкнулись с другой проблемой — это ракурсы. Описания side view или backside view никак не помогали делу, поэтому к первичному описанию backside view in a car, мы добавили view from backside passenger, после чего мы сохранили схожесть персонажа на всех кадрах и получили нужный нам ракурс.
Пример неудачной и удачной реализации:
Помимо MJ, мы использовали ChatGPT plugin Photorealistic для составления базовых промптов, и в ряде случаев он помогал.
Сначала были сложности с тем, что картинки получались хорошие, но более реалистичные, чем того требует комикс. Или же в другой графической манере, несмотря на указание Manga style.
Два подобных примера и промпт ниже.
Еще одна сложность — отрисовка двух разных персонажей на одном кадре была проблемой, так как MJ скрещивал их характеристики, одежду, и наличие референсов тут не помогало.
Пример смешения:
И даже одного персонажа он никак не мог усадить в одну сторону, чтобы в другую мы могли поставить собеседника героя.
Поэтому решили сначала создать само пространство, в которое потом встраивали уже отдельно созданных и вырезанных героев.
В итоге после четырех недель работы набегами в «свободное» время, получили неординарный опыт сторителлинга собственной «сказки» и философии; узнали о более подробных настройках параметров MJ, приоритеты промптов и итоговую выдачу их как результат у MJ; научились гибко подходить к решению в выражении определенных сцен.
И, конечно, преисполнились в своем познании. А также замахнулись на вторую часть комикса. Спасибо Sostav-у за такой интересный челлендж!
Источник: www.sostav.ru