Анна Анашина, «АЛИДИ Продвижение»: алгоритмы воображения

В контексте искусственного интеллекта и обработки естественного языка, промпт — это вводное предложение или набор предложений, которые используются для того, чтобы направить модель на выполнение определенной задачи. Это текстовое описание того, что мы хотим получить в результате. И чем более детальным будет это описание, тем больше результат будет соответствовать тому, что нам надо. Об этом Sostav рассказала дизайнер трейд-маркетингового агентства «АЛИДИ Продвижение» Анна Анашина.

Рассмотрим на примере имиджа. Допустим, мы хотим получить изображение матового металлического огнетушителя, для использования его в Telegram. На первом месте идет описание того объекта, который будет основным на нашем имидже. Далее идет описание материала, цвета, света, положения в кадре, описание фона и окружения, стилистики изображения. В финале прописываем соотношения сторон для картинки. В Midjourney по умолчанию идет 1:1, то есть квадрат, нам это подходит.

Сейчас покажу, как я веду работу над конкретным запросом. Итак, начнем вот с такого промпта для этой задачи.

Это не совсем тот результат. Добавляем в начало описательной части «brushed stainless steel». И в конец промпта дописываем «серый фон» и добавляем эффектов.

Как мы видим, изображения получаются более единообразные. Это показатель того, что мы на верном пути. Вообще, хороший промпт от неподходящего отличить очень легко. Если вы, прогоняя один и тот же промпт несколько раз, получаете схожие единообразные изображения — значит все получилось и «шалость удалась».

Вернемся к нашему огнетушителю — в изображении мне не нравится, что отсутствуют некоторые элементы конструкции.

На этот раз хотелось уже наверняка попасть в цель. Для этого один и тот же эффект описываем разными словами несколько раз. Тут действует тот же прием, что и в общении: когда мы не понимаем собеседника, то можем использовать выражение «объясни то же самое, но другими словами». С нейросетями так же, только мы используем в промпте все варианты описания одного и того же обьекта и задачи.

Итак, смотрим, что добавилось — это просьба сделать конструкцию более высокоточной, описание самой конструкции огнетушителя. Также я прописала мягкие тени, малую глубину резкости и точнее описала, какой хочу свет. В конце дублировала пожелание получить высокоточные элементы.

Опять же действует то же правило, что и в общении. Если хочешь, чтобы собеседник запомнил, о чем ты говорил, повтори несколько раз — в написании промптов действует та же схема.

Итак, у меня получилось, именно то, что я хотела. Теперь, используя эту конструкцию промпта, можно делать, например, огнетушители из разных материалов, меняя описание материала.

В работе над видео и текстами правила те же. Естественно, в видео мы можем прописывать изменение композиции в кадре, ближе-дальше для каких-то элементов и др. Для текстов — это стилистика текста и т. д. То есть учитываем особенности формата. Стоит избегать аллегорий, какого-то высокохудожественного языка, так как это делает результат более непредсказуемым.

Таким образом, следуя описанной структуре, можно легко и быстро получить желаемый результат. Также можно использовать библиотеки промптов или сайты со стилистиками для ИИ.

В мире генеративного искусственного интеллекта существует множество моделей, каждая из которых может быть оптимизирована для определенных задач:

Источник: www.sostav.ru