Interpult Studio

Отказ от ответственности: Все изображения в этой истории были сгенерированы с помощью искусственного интеллекта..

Каждые несколько лет появляется технология, которая четко разделяет мир на до и после. Я помню, как впервые увидел видео YouTube, встроенное в веб-страницу; первый раз, когда я синхронизировал файлы Evernote между устройствами; в первый раз я просмотрел твиты от людей поблизости, чтобы узнать, что они говорят о концерте, который я посещал.

Я помню, как впервые зашазамил песню, вызвал Uber и транслировал себя в прямом эфире с помощью Meerkat. Я думаю, что выделяет эти моменты ощущение того, что открылся какой-то непредсказуемый набор новых возможностей. Чем бы стал Интернет, если бы в него можно было легко добавлять видеоклипы? Когда вы могли вызвать любой файл на свой телефон из облака? Когда вы могли транслировать себя на весь мир?

Прошло несколько лет с тех пор, как я увидел зарождающуюся технологию, которая заставила меня позвонить своим друзьям и сказать: ты должен это увидеть. Но на этой неделе я сделал, потому что у меня есть новый, чтобы добавить к списку. Это инструмент для создания изображений под названием DALL-E, и хотя у меня очень мало представлений о том, как он будет в конечном итоге использоваться, это один из самых привлекательных новых продуктов, которые я видел с тех пор, как начал писать этот информационный бюллетень.

Технически речь идет о технологии DALL-E. 2. Он был создан OpenAI, семилетней компании из Сан-Франциско, чья миссия состоит в создании безопасного и полезного искусственного интеллекта общего назначения. OpenAI уже хорошо известен в своей области благодаря созданию GPT-3, мощного инструмента для создания сложных текстовых отрывков из простых подсказок и Второй пилотинструмент, помогающий инженерам-программистам автоматизировать написание кода.

READ  Cisco полностью свернёт бизнес в России и Беларуси

DALL-E — портмоне сюрреалиста Сальвадора Дали и студии Pixar. ВАЛЛ-И — принимает текстовые подсказки и генерирует из них изображения. В январе 2021 года компания представил первую версию инструментакоторый был ограничен квадратами размером 256 на 256 пикселей.

Но вторая версия, бета-тестирование которого началось в апреле, кажется радикальным скачком вперед. Изображения теперь имеют размер 1024 на 1024 пикселя и могут включать в себя новые методы, такие как «закрашивание» — замена одного или нескольких элементов изображения другим. (Представьте, что вы фотографируете апельсин в миске и заменяете его яблоком.) DALL-E также лучше понимает взаимосвязь между объектами, что помогает ему изображать все более фантастические сцены — коала, бросающая мяч в баскетбол, космонавт, едущий на лошадь.

Вот уже несколько недель, потоки изображений, сгенерированных DALL-E заняли мою временную шкалу в Твиттере. И после того, как я задумался о том, что я мог бы сделать с этой технологией… а именно, тратить бесчисленные часы на это — очень приятный человек в OpenAI сжалился надо мной и пригласил меня в частное исследовательское бета-тестирование. Как сообщила мне сегодня пресс-секретарь, количество людей, у которых есть доступ, сейчас составляет несколько тысяч; компания надеется добавить 1000 человек в неделю.


При создании учетной записи OpenAI заставляет вас согласиться с Политика содержания DALL-E, который предназначен для предотвращения большинства очевидных потенциальных злоупотреблений платформой. Не допускается ненависть, домогательства, насилие, секс или нагота, и компания также просит вас не создавать изображения, связанные с политикой или политиками. (Здесь, кажется, стоит отметить, что среди соучредителей OpenAI есть Илон Маск, который, как известно, недоволен Twitter за гораздо менее строгий набор политик. Он покинул его правление в 2018 году.)

READ  Смартфон ZTE Axon 40 Ultra с подэкранной камерой поступил в продажу на мировом рынке • Interpult Studio

DALL-E также предотвращает создание многих потенциальных изображений, добавляя ключевые слова (например, «стрельба») в черный список. Вам также не разрешается использовать его для создания изображений, предназначенных для обмана — дипфейки запрещены. И хотя нет запрета на попытки сделать изображения на основе публичных лиц, вы не можете загружать фотографии людей без их разрешения, и технология, кажется, слегка размывает большинство лиц, чтобы было ясно, что изображения были изменены.

Как только вы согласитесь с этим, вам будет представлен восхитительно простой интерфейс DALL-E: текстовое поле, предлагающее вам создать все, что вы можете придумать, если позволяет политика в отношении контента. Представьте, что вы используете панель поиска Google, как если бы это был Photoshop — это DALL-E. Заимствуя некоторые идеи поисковой системы, DALL-E включает кнопку «удиви меня», которая предварительно заполняет текст предлагаемым запросом, основанным на прошлых успехах. Я часто использовал это, чтобы получить идеи для пробных художественных стилей, которые я, возможно, никогда не рассматривал бы в противном случае — например, «макро 35-миллиметровая фотография» или пиксель-арт.

Для каждого из моих первоначальных запросов DALL-E требовалось около 15 секунд для создания 10 изображений. (Ранее на этой неделе количество изображений было сокращено до шести, чтобы предоставить доступ большему количеству людей.) Почти каждый раз я ловил себя на том, что громко ругаюсь и смеюсь над тем, насколько хороши результаты.

Например, вот результат «собаки шиба-ину, одетой как пожарный».

А вот один из «бульдога в костюме волшебника, цифровое искусство».

Я так люблю этих фальшивых собак с искусственным интеллектом. Я хочу усыновить их, а затем написать о них детские книжки. Если метавселенная когда-либо существует, я хочу, чтобы они присоединились ко мне там.

Знаешь, кто еще может прийти? «Лягушка в шляпе, цифровое искусство».

Почему он буквально идеален?

На нашем сервере Sidechannel Discord я начал принимать запросы. Кто-то попросил изобразить «метавселенную ночью, цифровое искусство». То, что пришло мне в ответ, казалось мне, было достаточно грандиозным и абстрактным:

Я не буду пытаться объяснить здесь, как DALL-E делает эти изображения, отчасти потому, что я все еще работаю над тем, чтобы понять это сам. (Одна из основных задействованных технологий, «распространение», объяснена полезно в этом сообщении в блоге в прошлом году от Google AI.) Но меня неоднократно поражало, насколько креативной может казаться эта технология генерации изображений.

Возьмем, к примеру, два результата, которыми поделился в моем Discord другой читатель с доступом DALL-E. Во-первых, посмотрите на набор результатов для «Экономист-медведь перед обвалом биржевого графика, цифровое искусство».

А во-вторых, «экономист-бык перед графиком растущего фондового рынка с восходящей линией, синтвейвом, цифровым искусством».

Поразительно, насколько DALL-E улавливает здесь эмоции: испуг и раздражение медведя и агрессию быка. Кажется неправильным называть все это «творческим» — то, что мы здесь рассматриваем, — не более чем вероятностные догадки, — и все же они производят на меня тот же эффект, что и взгляд на что-то действительно творческое.

Еще одним привлекательным аспектом DALL-E является то, как он пытается решить одну проблему различными способами. Например, когда я попросил его показать мне «вкусную булочку с корицей с выпученными глазами», ему пришлось придумать, как изобразить глаза.

Иногда DALL-E добавлял пару пластиковых глаз к рулону, как сделал бы я. В других случаях это создавало глаза из отрицательного пространства в глазури. И в одном случае это сделало глаза из миниатюрные булочки с корицей.

Это был один из тех случаев, когда я громко выругался и начал смеяться.

DALL-E — самый продвинутый инструмент для создания изображений, который я когда-либо видел, но далеко не единственный. Я также немного поэкспериментировал с подобным инструментом под названием Середина пути, который также находится в стадии бета-тестирования; Google анонсировала еще один, названный Imagen, но еще не позволил посторонним попробовать его. Третий инструмент, DALL-E Mini, за последние несколько дней сгенерировал серию вирусных изображений; однако он не имеет никакого отношения к OpenAI или DALL-E, и я полагаю, что разработчик вскоре получит письмо о прекращении действия.

OpenAI сообщила мне, что еще не приняла никаких решений о том, может ли DALL-E когда-нибудь стать общедоступной и если да, то каким образом. Цель текущего бета-тестирования — показать, как люди используют эту технологию, при необходимости адаптируя как инструмент, так и политику контента.

И все же количество вариантов использования DALL-E, которые художники обнаружили, уже удивляет. Один художник использует DALL-E для создания фильтров дополненной реальности для социальных приложений. Шеф-повар из Майами использует его, чтобы получить новые идеи о том, как сервировать свои блюда. Бен Томпсон написал прозорливую статью о том, как DALL-E можно использовать для создавать чрезвычайно дешевые среды и объекты в метавселенной.

Естественно и уместно беспокоиться о том, что такого рода автоматизация может сделать с профессиональными иллюстраторами. Вполне возможно, что многие рабочие места будут потеряны. И все же я не могу не думать, что такие инструменты, как DALL-E, могут быть полезны в их рабочих процессах. Что, если бы они попросили DALL-E набросать для них несколько концепций, например, прежде чем они начнут? Инструмент позволяет создавать варианты любого изображения; Я использовал его, чтобы предложить альтернативу Платформер логотипы:

Я буду придерживаться логотипа, который у меня есть. Но если бы я был иллюстратором, я бы оценил альтернативные предложения, хотя бы для вдохновения.

Также стоит подумать о том, какой творческий потенциал эти инструменты могут открыть для людей, которые никогда бы не подумали (или не могли себе позволить) нанять иллюстратора. В детстве я писал свои собственные комиксы, но мои навыки иллюстрирования так и не продвинулись далеко. Что, если бы вместо этого я мог поручить ДАЛЛ-И нарисовать всех моих супергероев вместо меня?

С одной стороны, это не похоже на инструмент, который большинство людей будет использовать каждый день. И все же я предполагаю, что в ближайшие месяцы и годы мы найдем еще более творческие применения таких технологий: в электронной коммерции, в социальных приложениях, дома и на работе. Для артистов это может стать одним из самых мощных инструментов для создания ремиксов, которые мы когда-либо видели, — при условии, что проблемы с авторскими правами будут решены. (Мне сказали, что не совсем ясно, считается ли использование ИИ для создания изображений защищенных произведений добросовестным использованием или нет. Если вы хотите увидеть, как DALL-E берет «Бэтмен ест бутерброд», напишите мне в Директ.)

Я подозреваю, что мы увидим и некоторые вредоносные применения этого инструмента. Хотя я доверяю OpenAI в обеспечении строгой политики против неправомерного использования DALL-E, наверняка появятся аналогичные инструменты, которые будут использовать более универсальный подход к модерации контента. Люди уже создают вредоносные, часто порнографические дипфейки преследовать своих бывших, используя грубые инструменты, доступные сегодня; эта технология будет только улучшаться.

Часто бывает так, что, когда появляется новая технология, мы сосредотачиваемся на ее более счастливом и причудливом использовании только для того, чтобы игнорировать то, как она может быть использована не по назначению в будущем. Несмотря на то, что я был в восторге от использования DALL-E, я также очень обеспокоен тем, что аналогичные инструменты могут сделать в руках менее щепетильных компаний.

Также стоит подумать о том, что может сделать даже положительное использование этой технологии в масштабе. Когда большинство изображений, с которыми мы сталкиваемся в Интернете, созданы искусственным интеллектом, как это влияет на наше ощущение реальности? Как мы узнаем, что все, что мы видим, реально?

На данный момент DALL-E кажется прорывом в истории потребительских технологий. Вопрос в том, будем ли мы считать это через несколько лет началом творческой революции или чем-то более тревожным. Будущее уже наступило, и оно добавляет 1000 пользователей в неделю. Настало время обсудить его последствия, пока он не попал в руки остального мира.


https://www.theverge.com/23162454/openai-dall-e-image-generation-tool-creative-revolution

от admin