Привет! В этом видео расскажу, как установить и настроить Forge - оптимизированный аналог Automatic1111 от создателя Fooocus и ControlNet. Научимся генерировать картинки на прозрачном фоне, вырезать фон у готовых изображений и создавать маски для инпейнтинга. Полезно для всех любителей ИИ-арта! Приятного просмотра!
Привет, это Настя, руководитель отдела контента в Aigital — сервиса на основе нейросетей для решения маркетинговых задач. Мы придумываем и разрабатываем шаблоны, которые упрощают пользователям создание контента для рекламы, СМИ и соцсетей. Каждую неделю мы рассказываем о развитии стартапа и изнанке продукта.
Сегодня расскажу о создании Customer Journey Map (CJM) с помощью нейросетей, обновленном инструменте для удаления фона и генерации картинки на основе другого изображения.
Генерация картинки по референсу
На этой неделе мы добавили на платформу новый навык — генерация картинки на основе другого изображения. С помощью этого навыка можно решать множество прикладных задач: от генерации обложек для YouTube-видео в едином стиле до создания изображений для сайта компании или соцсетей. Он учитывает стиль, цветовую палитру и композицию предложенного изображения при генерации. Помимо этого навык учитывает и то, что указано в текстовом промпте.
Например, в поле «Референс» вы добавляете картинку — обложку с любого YouTube-видео, которая вам нравится по стилистике и цветовой палитре. В текстовом поле указываете, что вам нужна обложка для Youtube-видео с рецептом приготовления шашлыков для кулинарного блога. В результате вы получаете картинку с шашлыками, подходящую по тематике для вашего блога, а по стилистике, палитре и композиции похожую на изображение, что вы добавляли в качестве референса.
Генерация изображения в навыке «В стиле референса»
Под капотом навык работает следующим образом:
На первом этапе ИИ анализирует референс — GPT-4o подробно описывает картинку с разных сторон, прорабатывает её стилистику.
В параллель с этим другая нода GPT-4o берет текстовый запрос пользователя и переводит его на английский.
На следующем шаге GPT формирует объемный промпт, объединяя описание референса и текстовый запрос пользователя. Веса в нем расставлены так, чтобы нейронка понимала, на что следует обратить больше внимания, а на что меньше.
Этот текстовый промпт отправляется в Fooocus.
Fooocus умеет работать с входящими изображениями, поэтому вместе с текстовым промптом приходит и картинка-референс. Получается двойной удар по задаче — и со стороны текстового описания референса, и визуально — с ориентиром на само исходное изображение.
Fooocus сохраняет не только цветовую палитру, но и пропорции картинки-референса. Это особенно удобно, если требуется определенный размер изображения.
Генерация изображения в навыке «В стиле референса»
1/2
Картинка-референс (первое изображение) и результат генерации по референсу и описанию (второе изображение)
Далее обученная нами модель улучшает черты лица на картинке и передает ее пользователю.
Мы решили поэкспериментировать и сгенерировать стол со стульями на основе скрина нашего лендинга. Нейронка сохранила пропорции, забрала темно-серый на фон, а зеленый и белый в акценты.
Изображение сгенерировано в навыке «В стиле референса»
Создание Customer Journey Map с помощью ИИ
Навык «Путь пользователя» или Customer Journey Map для сегодняшнего разбора выбрало большинство читателей пятого дайджеста.
CJM — это карта пути клиента, которая показывает все этапы взаимодействия пользователя с продуктом или услугой. Она помогает понять, как клиент воспринимает ваш продукт, какие у него возникают вопросы и болевые точки на каждом этапе.
В этом навыке Aigital выступает в роли специалиста по CJM, глубоко знающего психологию, маркетинг, продуктовую разработку.
Перед тем как приступить к разработке карты пути клиента, важно четко понять, кто будет использовать ваш продукт и каковы их цели. Для этого нужно описать сам продукт, услугу и пользователя. Если у вас еще нет четкого представления о пользователе, можно воспользоваться навыком «3 портрета пользователя». В результате вы получите подробные портреты пользователей с учетом их дохода и психографики (интересов и взглядов) на основе описания вашего продукта.
В основу промпта лег фреймворк по Customer Journey Map от нашего продакт-менеджера Юры. Одна из компетенций Юры — как раз создание CJM.
Вы можете забрать этот фреймворк в Figma-комьюнити и использовать для презентации своей команде сгенерированный в Aigital CJM.
CJM должна включать не только общие этапы взаимодействия с продуктом, но и детализацию каждого шага. Подробный ответ генерируется под каждый шаг CJM, чтобы детальнее проработать задачу. Шаги пользователей, которые сейчас учитываются в навыке:
Онбординг (Onboarding) — первое взаимодействие клиентов с продуктом или услугой, знакомство с основными функциями и преимуществами.
Обзор ценности (Value Discovery) — глубокое изучение продукта или услуги, понимание его уникальной ценности и соответствия потребностям.
Рассмотрение вариантов (Consideration) — оценка плюсов и минусов продукта или услуги, принятие решения о покупке.
Покупка (Purchase) — процесс покупки.
Формирование привычки (Habit Formation) — включение продукта или услуги в повседневные привычки, развитие лояльности.
Распространение (Advocacy) — рекомендация продукта или услуги.
Aigital генерирует подробное описание каждого шага, отмечая следующее:
Какой цели я хочу достичь на этом этапе?
Какие действия мне нужно предпринять для достижения цели?
Какие трудности могут возникнуть?
Какие вопросы или сомнения могут появиться?
Где я могу ошибиться?
Что мотивирует меня двигаться к цели?
Какие эмоции я могу испытывать на этом этапе?
Отдельным пунктом в каждом шаге прописываются возможности для улучшения пользовательского опыта. В промпте для этого навыка мы прописываем, что CJM создается, чтобы повысить вовлеченность и снизить отток пользователей.
Наш фреймворк близок к маркетинговой воронке, но поскольку видов CJM довольно много, мы не хотим ограничиваться одним. Поделитесь в комментариях, какие шаги проходит ваш клиент, взаимодействуя с продуктом? В этом навыке мы планируем сделать выпадающее меню с выбором типа CJM.
Небольшие, но важные обновления
Еще немного о том, какие изменения в сервисе мы реализовали или готовим в ближайшее время.
Обновили «Удаление фона». Новый инструмент, на котором работает навык, очень быстро и гораздо качественнее отрабатывает задачу. Особенно это заметно на мелких деталях, например, на волосах.
Обратите внимание на волосы девушки
В раздел истории списаний добавили названия навыков, в которых происходили генерации. Теперь стало удобнее отслеживать, сколько вы расходуете кредитов на те или иные генерации.
Результаты генерации в текстовых навыках теперь приходят с форматированием — подзаголовки в них выделены жирным, маркированные списки аккуратно оформлены, если позволяет задача — добавлены эмодзи. Кроме того, теперь вы можете получать результат в виде таблички, достаточно указать это в пункте «Что учесть» или в своем запросе.
Надеемся, вы уже успели протестировать «Маркетологуса» и «Чат с ИИ». Мы готовим к релизу 10 новых ИИ-ассистентов, среди них будут эксперты по HR, SMM и SEO.
Комментарий разработчика: В этой версии модель больше склоняется к Pony, обеспечивая большее разнообразие и сохраняя реалистичное качество. Рекомендуется использовать Adetailer для наилучших результатов.
Источник - @neurosklad 🤖 - все, что нужно, для твоей нейронки!
Привет, мои дорогие любители нейро-картинок! Хочу поделиться с вами свежими новостями о Stable Diffusion 3!
Со-генеральный директор Stability AI Кристиан Лафорте на выставке Computex Taipei анонсировал скорый релиз весов модели Stable Diffusion 3 Medium. Уже с 12 июня их можно будет скачать на платформе Hugging Face.
Чем же примечательна эта новая модель?
Stable Diffusion 3 Medium - это продвинутая нейросеть для генерации изображений из текста (text-to-image). Она обладает впечатляющими 2 миллиардами параметров и призвана превзойти предыдущие модели в тех областях, где у них возникали трудности.
Вот некоторые из ключевых особенностей SD3 Medium:
📸 Фотореализм: Модель успешно устраняет типичные артефакты на руках и лицах, обеспечивая высокое качество генерируемых изображений без необходимости в сложной постобработке.
🖌️ Типографика: SD3 Medium демонстрирует впечатляющие результаты в работе с типографикой, превосходя даже более крупные современные модели.
⚡ Производительность: Благодаря оптимизированному размеру и эффективности, эта модель отлично подходит как для личного, так и для корпоративного использования.
🎨 Тонкая настройка: SD3 Medium способна улавливать нюансы даже из небольших наборов данных, что открывает широкие возможности для персонализации и творческих экспериментов.
Однако не обошлось и без ложки дегтя. Веса и код SD3 Medium будут доступны только для некоммерческого использования. Если вы планируете применять эту модель в коммерческих целях, вам придется заполнить специальную анкету на сайте Stability AI и ждать ответа от их команды.
Теперь у меня к вам вопрос, друзья: как вы думаете, сможет ли сообщество создать качественный файнтюнинг для SD3 Medium, или мы так и останемся на SDXL? Делитесь своими мыслями в комментариях! 💬
Я рассказываю больше о нейросетях у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке. Всех обнял. Удачных генераций!
Пока все боятся, что ИИ уничтожит человечество, мамочки уже используют его в быту.
Так например одна находчивая дама создала дипфейковые новости, где ведущий рассказывает и стыдит беспорядок в комнате ее малышей. 😅🤪
Снедаемые чувством вины, карапузы дружно побежали наводить порядок, а то еще и Санта Клаус с подарками прокатит
Вот так чувство вины стоит на страже порядка в детских комнатах 👻
Видео для вас перевел телеграм канал ИИшница 🍳 Если вам интересны новые технологии, полезные сервисы и новости будущего, добро пожаловать на канал! А еще, если вы устали от новостей об играх, непонятных приколов, то вам тем более ко мне)
UDIO - пока еще бесплатная нейросеть для создания музыки, в том числе со словами. Мне очень понравился этот генератор песен, по простому промпту он создал мне прям достойный ню-джаз со всеми полагающимися. Кому интересно, статья про мой эксперимент с UDIO и обзор на эту нейросеть
Mubert - очень простой и понятный сервис для создания треков и аудиозаставок. Mubert использует базу сэмплов от разных электронных продюсеров и генерирует уникальные музыкальные потоки в реальном времени. Мой обзор на Mubert
Soundraw - тоже простая в использовании, во free версии можно создавать неограниченное количество треков, но нет возможности скачивания, поэтому диктофон в помощь. Платформа позволяет вам генерировать уникальные, студийного качества треки одним нажатием кнопки. Вы можете выбирать из разных жанров и настроений. Идеален для саундтреков к видео, трансляций или подкастов. Поскольку сэмплы обучены теории музыки, ИИ Soundful никогда не воспроизведет уже существующую песню, даже с собственной платформы.
Loudly - ИИ для профессионалов, где много настроек, и можно генерировать семплы с голосом.
Amper Music- AI для создания музыки из имеющихся сэмплов.
AIVA - нейросеть для сведения музыки: делает автоматический мастеринг. Есть куча шаблонов. Создает эмоциональную музыку для саундтреков к рекламным роликам, видеоиграм, фильмам и многому другому. Он помогает независимым разработчикам игр, начинающим музыкантам и профессиональным композиторам в их творческом процессе. Может создавать музыку с нуля или вариации существующих песен, не беспокоясь о процессах лицензирования, что делает его отличным вариантом для музыкантов и контент-мейкеров.
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпиcывайтесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.