Анализируем визуал и исправляем ошибки

Уровень: легко

Кому пригодится: Менеджерам и руководителям, HR и разработчикам, маркетологам и всем, у кого нет времени, но часто приходится быть экспертом в своей области и объяснять, как что-то работает

Инструменты: приложения Копирайтер, ChatGPT, Иллюстратор, Диктор, Подкаст

Это Артур. Он занимается развитием пищевого производства на Дальнем Востоке. Работы много: Артур анализирует рынок, ищет новых партнеров, отвечает за разработку стратегии развития производства, с учетом дальневосточного региона, проводит модернизацию существуюших предприятий. Если задачи нет в календаре, значит времени даже подумать о ней нет.

Каждое утро Артур ездит на машине в офис и видит одну и ту же рекламу партнера: дистрибьютера консервных изделий. Реклама ему не нравится: устаревший дизайн, странные цвета, нагромождение текста. Но времени сесть и разобраться в этом, а также знаний в графическом дизайне у Артура нет.

Задача

Дома после ужина Артур решает попробовать проанализировать визуальную составляющую рекламу и ее дизайн и предложить партнеру расширить охват аудитории: больше целиться в миллениалов и поколение Z, создав новые этикетки для консервных банок.

Сделать анализ нужно быстро, критерии пока не очень понятны, но, предвкушая завтрашнюю поездку на работу и рекламный щит по дороге, Артур понимает, что лучше с этим что-то сделать.

Решение

Методом эксперимента Артур решает загрузить фотку рекламы в ChatGPT и спросить, что нейросеть думает о дизайне. Но точно ли она справится с тем, что увидит на картинке?

к сведению

В настройках приложения ChatGPT можно выбрать GPT-4 Vision. Модель умеет распознавать изображения и использовать их для формирования ответов.

Как это работает: вы отправляете файл с изображением — может быть, это просто фотография, скриншот с текстом или график. Нейросеть обработает изображение, чтобы дать ответ на ваш вопрос. Например, вы можете отправить фото кофемашины и спросить, как ей пользоваться. GPT-4 Vision увидит детали кофемашины, обратит на них внимание и даст вам нужную информацию.

GPT-4V понимает текст, распознает объекты, считает предметы, анализирует диаграммы и графики, определяет человеческие эмоции, находит различия и дефекты, объясняет смыслы.

Шаг 1: обработка картинки ChatGPT

Для начала Артур грузит фотографию и с ходу придумывает критерии. В похожей задаче вы можете использовать свои. Чем детализированнее они будут, тем качественнее получится ответ.

Вот такие критерии описал Артур:

цвет
сам текст и его уместность
актуальность дизайна

Также он попросил прокомментировать каждый пункт и дать рекомендации по исправлениям.

Нейросеть ответила довольно подробно:

Шаг 2: уточняющие вопросы

Теперь с этой информацией нужно что-то делать. Например, можно развить вопрос из одного пункта и спросить про цвета поконкретнее.

Ответ Артуру нравится. Его можно скопировать и сделать частью предложения по изменению дизайна.

Конкретизировать цветовую палитру некогда. Можно попробовать придумать животное для этикетки. Все любят котиков, и, возможно, животное как лицо бренда сможет повысить лояльность покупателей.

Артур задает следующий вопрос:

Какое животное поместить на баннер?
Пусть баннер будет шутливым, для молодежи. 
Приведи 3 примера с пояснением

подсказка

Всегда просите нейросеть привести конкретное число примеров, идей, метафор, пунктов плана — 3, 4, 5. Тогда вы получите структурированный и более четкий ответ, и вам будет легче разобраться с информацией.

Если 3-5 идей недостаточно, напишите нейросети — придумай еще 5, но добавь N

Если вы попросили 10 пунктов, а нейросеть прислала 7 и молчит, напишите ей — еще или дальше. Объем текста, который выдает нейросеть за раз, ограничен и может чисто физически не поместиться в окно.

Вот, что отвечает нейросеть:

Котики были ожидаемы, ответ интересный. Можно развить его дальше, задавая дополнительные вопросы, но Артуру хочется нарисовать картинку.

Шаг 3: создаем промт с ChatGPT

Описание животных, которое написала нейросеть, конечно, можно и нужно дорабатывать.

к сведению

Нейросеть — это миллиарды нейронов информации. Когда нейросеть получает ваш запрос, состоящий из N-количества слов, она пытается нащупать взаимосвязь между ними и нарисовать картинку исходя из данных. В куске текста, вырванном из контекста, нащупать связи тяжело.

Чем абстрактнее ваш запрос, чем выше непредсказуемость результата. Иногда нейросеть создает шедевры, а иногда — руки-сосиски и пятилапых собак. Рискните, вдруг получится настоящий AI-арт.

Артур не хочет рисковать, он поступает хитрее — просит нейросеть составить ему промт (текст запроса) для приложения Иллюстратор, которое создает картинки:

Cоставь промт - описание картинки, которую я смогу загрузить в нейросеть, которая создает картинки. 

Шаблон промта: главный предмет-герой, что делает, что на заднем фоне, какие цвета

И вот ответ ChatGPT:

Шаг 4: создаем иллюсторацию по промту из ChatGPT

Артур копирует получившийся промт и вставляет его в приложение Иллюстратор. Выбирает стиль акварель и нейросеть DALL-E 3 и вот какой результат у него получается:

подсказка

Обязательно экспериментируйте с разными стилями и нейросетями. Их сочетание, а также детали вашего промта, цветов, стилей и упоминание режиссеров/фильмов, могут помочь вам создать очень красивые изображения.

Кому еще может пригодится опыт

аналитикам и дизайнерам — для анализа дашбордов и изображений, их исправления и рефакторинга
разработчикам — для создания структуры кода по скрину продукта или изображению (признаемся, что тут нужно тщательно экспериментировать)
всем в бытовых целях — расшифровывать бабушкины рецепты, дневниковые записи, рецепты врача и результаты анализов (sic! рекомендации нейросетей не являются основанием для принятия решений, лучше обратитесь за медицинской помощью!)

Задача​

Решение​

Шаг 1: обработка картинки ChatGPT​

Шаг 2: уточняющие вопросы​

Шаг 3: создаем промт с ChatGPT​

Шаг 4: создаем иллюсторацию по промту из ChatGPT​

Кому еще может пригодится опыт​