Генеративный ИИ на основе графического интерфейса для обработки изображений (в стиле Photoshop)

Содержание

Вопрос или проблема
Ответ или решение
Как установить и использовать StableDiffusion:
Особенности и возможности

Вопрос или проблема

Я искал процессор изображений на базе GenAI, который идеальным образом смог бы обрабатывать запросы, такие как “обрезать это изображение под форму завернутого леденца с плавным переходом в три пикселя”; или “размыть фон травы на этом портрете, сохранив листву деревьев в фокусе”.

Другими словами, это должен быть свободно доступный онлайн инструмент, который может выполнять сложные задачи, которые обычно требуют очень опытного пользователя Photoshop или подобного программного обеспечения.

Я знаю о генераторах на базе ИИ (текст в изображение), но надеюсь, что из вышеизложенного ясно, что я ищу нечто другое. Это включает в себя Adobe Firefly, который, похоже, больше предназначен для генерации изображений, а не для редактирования изображений.

Поиск в Google не выявил никаких соответствующих бесплатных стандартных инструментов, поэтому я надеюсь, что кто-то сможет что-то порекомендовать.

Вполне возможно, что пока не существует такого (бесплатного) инструмента, хотя если это так, то, предположительно, такой инструмент не так уж и далеко в будущем.

Один онлайн (в браузере) инструмент, который я нашел, но не пробовал, так как он требует платной подписки без бесплатной пробной версии, – это Luminar. Pixlr бесплатен, но его возможности редактирования, похоже, не превышают тех, которые предлагают более старые версии Photoshop, то есть не являются инструментами на базе GenAI.

StableDiffusion – это генеративная AI-модель с открытым исходным кодом, разработанная Stability AI. Она предназначена для генерации качественных изображений из текстовых описаний и может работать локально на вашем персональном компьютере.
. Чтобы запустить более старую версию StableDiffusion локально, вам нужен мощный компьютер с совместимой GPU и достаточными ресурсами. Следуйте нескольким шагам:

Установите Python: > python3.82, вероятно, требуется, создайте среду Conda.
Склонируйте репозиторий Stable Diffusion: git clone https://github.com/CompVis/stable-diffusion.git. Возможно, есть более новый репозиторий.
Скачайте веса. См. пост в блоге от AssemblyAI.
Запустите модель: как только вы завершите вышеописанные шаги, вы можете запустить Stable Diffusion с помощью команды python demo.py --prompt "ваш текстовый запрос здесь". Время вывода будет высоким, около 8-12 минут.

Ответ или решение

Введение в мир GenAI для обработки изображений

Сегодняшние пользователи часто сталкиваются с необходимостью редактирования изображений, требующего не только базовых навыков работы с графикой, но и творческого подхода. Во многом это связано с появлением Generative AI (GenAI) — технологии, которая меняет подходы к созданию и редактированию изображений. Особенно остро стоит вопрос о наличии удобных графических интерфейсов, позволяющих реализовать сложные запросы, такие как "обрезать изображение в форме завернутой леденцовой палочки с размытой границей в три пикселя" или "размыть фон травы на портрете, оставив листву деревьев в фокусе".

Проблематика и текущие решения

На данный момент существует множество инструментов для генерации изображений на основе текстовых запросов, однако решение, которое отвечало бы вашим требованиям по редактированию изображений с использованием GenAI, по понятным причинам сложно найти. Например, Adobe Firefly фокусируется на создании изображений, а не на их редактировании.

Вы уже упомянули о таких инструментах, как Luminar и Pixlr, однако они либо требуют платной подписки, либо не обеспечивают возможности использования возможностей GenAI. Таким образом, задача поиска бесплатного и эффективного онлайн-редактора остается актуальной.

Перспективные решения: использование StableDiffusion

Одним из наиболее значительных решений в области GenAI является StableDiffusion, разработанный компанией Stability AI. Этот инструмент позволяет вам генерировать высококачественные изображения на основе текстовых описаний и может быть установлен на вашем компьютере.

Как установить и использовать StableDiffusion:

Установка Python: Убедитесь, что у вас установлен Python версии 3.8.2 и выше.
Создание среды Conda: Используйте Conda для создания отдельной среды Python.
Клонирование репозитория StableDiffusion: Используйте команду:
```
git clone https://github.com/CompVis/stable-diffusion.git
```
Обратите внимание, что могут существовать более новые версии репозитория.
Загрузка весов модели: Для получения модели StableDiffusion вы можете найти соответствующие инструкции в блогах и документации (например, AssemblyAI).
Запуск модели: После выполнения предыдущих шагов вы сможете запустить StableDiffusion с помощью следующей команды:
```
python demo.py --prompt "ваш текстовый запрос"
```

Особенности и возможности

Хотя StableDiffusion в первую очередь предназначен для генерации изображений, он может быть адаптирован для выполнения задач редактирования с использованием специфических текстовых команд. Например, создание изображений для определенных форм может быть использовано в сочетании с программами для пост-редактирования таких как GIMP или Photoshop для дальнейшей точной корректировки.

Будущее генерируемого редактирования

Важно отметить, что инструменты, позволяющие редактировать изображения с поддержкой GenAI, все еще находятся на стадии активного развития. Мы можем ожидать появления онлайн-платформ, которые будут интегрировать мощные алгоритмы генеративного искусственного интеллекта и доступный интерфейс для работы с изображениями.

Заключение

С текущими реалиями поиска GenAI-редакторов, аналогичных Photoshop, выбор остается достаточно ограниченным. StableDiffusion и подобные инструменты открывают новые горизонты, но требуют определенных технических знаний для установки. Однако вы можете ожидать, что со временем появятся более удобные и доступные решения, которые помогут упростить процесс редактирования изображений для широкой аудитории. С учетом быстрого развития технологий, рано или поздно те возможности, о которых вы мечтаете, станут реальностью.