«Возможно, людям будут платить за то, чтобы они вообще хоть что-нибудь хотели»
Медиахудожник Вадим Эпштейн о генеративном искусстве, нейросетях, человеческих желаниях как ценной валюте и синтетических медиа будущего
ФОТО: ЛЮБОВЬ КАБАЛИНОВА
Вадим Эпштейн мог стать физиком-теоретиком, но искусство как метод познания мира оказалось привлекательней науки. Генеративным искусством он занялся около 15 лет назад — задолго до того, как сам этот термин стал массово популярным. Reminder публикует большое интервью с Эпштейном об искусстве и его восприятии людьми, о нейросетях, метавселенных, человеческих желаниях как ценной валюте будущего и о синтетических медиа, которые не будут иметь абсолютно никакой связи с реальностью.
«Чистая математика — это круто, но как-то недостаточно»
— Когда мы обсуждали интервью, вы предложили на старте договориться о том, что есть искусство и что есть творчество.
— Само слово искусство применяют в двух не очень связанных областях и смыслах. Первый смысл — как некий путь, установка, метод жизни, познания, творчества. Второй — как социальный конструкт. Одно применение — внутри человека, второе — вне человека, в окружающем мире, всякие галереи, институции и так далее.
Второе — четко оформленные формальные конструкты. Если человек, компания, контора подпадают под определенные признанные занятия и выполняют их в признанном формате — выставляются в галереях, участвуют в конкурсах, фестивалях, в чисто административной движухе, в социальном мире автоматически считается, что вот это — искусство. Остальное считается чем угодно, но не искусством. Об этом внешнем направлении говорить бессмысленно, это просто деталь капитализма, условно говоря.
А если говорить о внутреннем направлении, мне очень нравится определение, которое я почерпнул от совершенно чудесного художника и куратора Дмитрия Булатова. Он говорил, что искусство — это метод вызывания и постижения сильных и глубоких эмоциональных переживаний, которые нельзя вызвать другими способами в реальном мире. Или так: создание и вызывание вот этих в обоих смыслах искусственных эмоций — основной, если не единственный результат любой деятельности в области искусства.
Обычные эмоции человек получает, так сказать, в нагрузку, по ходу своего существования, или от природных явлений. То есть, это либо происходит само собой, либо как вторичный, побочный продукт каких-то действий. А в случае с искусством создание и переживание эмоций является основной и единственной целью. И если это удается, можно говорить — да, это оно.
— Можно ли в этой связи считать, например, социальные сети вещью, которая вызывает и заставляет переживать эмоции и, таким образом, творит искусство?
— На эту тему сейчас идет нехилое бодание. Прежде искусством считалась некая монополия на подобные вещи, что единственными, кто мог позволить себе тратить время, силы и ресурсы на то, чтобы целенаправленно вызывать такие эмоции, были художники, писатели, композиторы и так далее. И что если человек не является профессиональным художником, у него просто времени и сил не это не будет, а если он целенаправленно этим занимается, то уже все складывается.
Об этом хорошо говорил Алексей Шульгин, один из моих любимых художников и последние десятилетия тоже куратор (у них с Аристархом Чернышевым в Москве был замечательный Electroboutique). На одной из встреч он выкатил программный текст о том, что галереи остались просто социальным конструктом, и свою основополагающую роль если и выполняют, то скорее по инерции и потому, что там еще болтаются какие-то неплохие люди. А все самое интересное, самый жир происходит в совершенно других областях — в том, что обычно называют креативной индустрией. У него был даже слайд с перечислением основных областей, которые перехватили эту роль, вот эти области.
Идея понятна: это то, что называется casual creativity, то есть когда человек не постулирует себя профессиональным художником, который зарабатывает себе на жизнь только творчеством и выставляется в галереях. Это все уже не важно для того, чтобы максимально самовыражаться, и чтобы результаты были впечатляющими, и чтобы аудитория была серьезная.
— Что лично вам интересно делать в искусстве? С помощью тех же нейросетей?
— Это то, что я понимаю под термином creative coding, — применение специальных и профессиональных навыков к достижению неочевидных и неожиданных результатов. Своего рода хакинг, на стыке компьютера (производителя) и человека (потребителя), perception glitch, сбой восприятия. Крутые спецы prompt design, кстати, вполне подходят под эту категорию. Главное тут, наверное — блуждающее исследование, вместо планомерного достижения каких то заранее поставленных целей. Это путь.
Что касается общего подхода к тому, что я делаю — еще в молодости у меня сложилась такая посылка. Во-первых в качестве прелюдии были работы Питера Гринуэя, из которых у меня сложилось представление, что в мире есть всего два класса вещей: либо обычные, либо красивые, третьего не дано. Во всем, что необычно, есть определенная красота, ее надо уметь увидеть. Второй тезис — есть базовое, очень схематичное представление о том, как работает человеческое восприятие. Если идет некое воздействие до определенного предела, человек перерабатывает это на основе шаблонов, которые у него накопились в жизни, и он продолжает укладывать все в эти шаблонные представления. Слово «шаблон» здесь без негатива: просто, как человек начинает учиться в школе и в институте, так и учится дальше. Из разрозненных, хаотичных и аморфных вещей он пытается складывать некую понятную структуру. И до определенного момента это неплохо, но если человек ведет себя так всю жизнь, он становится просто «квадратиш, практиш, гут» — и это скучно. С какого-то момента нужно начинать «разучиваться», уметь разламывать эти структуры, видоизменять, идти наперекор шаблонам и еще чему-то.
Если человеку давать впечатления до определенной силы и понимания, которые укладываются в его внутренний мир, он их просто переработает. Если ему дать слишком сильные впечатления, у него включатся защитные механизмы, он просто закроет глаза, замажет уши и уйдет. А если пытаться давать буквально чуть-чуть больше, на 5-10% больше того, что человек еще способен переварить, и у него еще не включаются защитные механизмы, вот это, на мой взгляд, самый интересный интервал. В таком случае можно пытаться менять внутреннюю структуру человека, на логическом уровне ставить под вопрос то, к чему он привык, а на эстетическом — приоткрывать вот эту внутреннюю красоту чего-то, чего до этого не было.
Эксперимент, техника Deepdream (здесь и далее работы предоставлены автором)
— Возникает вопрос: «Чтобы что?» Чтобы человек стал другим? Допустим, человек изменится, и что?
— Хороший вопрос. Не знаю. Я его не раз себе задавал, учитывая, что я не то, чтобы рвусь изменить мир или людей. Я довольно давно сформулировал базовую структуру своих интересов как Myth & Math — сплав максимально иллюзорного и непостижимого с неким универсальным символьным практическим аппаратом. Миф и математика меня очень приятно греют своим балансом.
Чистая математика, или в широком смысле наука и техника — это круто и интересно, но как-то недостаточно. Отдельно люди сами по себе — слишком органическая штука, биомасса, а я не гуманитарий. А вот на стыке, когда мы технологиями начинаем эту «биомассу» немножко ворошить, когда схлестываются принципиально разные начала, структуры, тенденции и так далее, возникают как раз интересные, на мой взгляд, вещи. Я склонен думать, что зрители являются не потребителями креативного процесса, для меня они — часть произведения. То, как их, грубо говоря, корежит, их эмоции — это составная часть продукта.
Возвращаясь к вопросу — почему генератив, почему нейросети. Изначально у меня и не было никакого особого стремления заниматься именно генеративным искусством. Больше того, сначала я развлекался виджеингом с весьма брутальными и аналоговыми образами. Дальнейший интерес именно к алгоритмам и математике можно объяснить тем, что у меня отец был теорфизик, и меня он тоже пытался тащить по научной стезе. Я послушно пошел в институт, закончил его, опять пошел в институт, предполагая, что через какое-то время буду защищать диссертацию, но очень быстро оттуда соскочил. Потому что это было начало 90-х и только-только появились доступные персоналки PC/XT. И это оказалось для меня на порядок более интересно, чем двигать науку. А что наука меня привлекает меньше, чем искусство, как метод познания мира — это уже потом срослось.
Генеративное искусство — вид творчества, в котором инструментом автора является компьютерный код, программа, или иной алгоритм с определенной степенью свободы. По сути, генеративное произведение — это процесс, а не готовый объект. И в этом смысле каждый творческий акт становится экспериментом, результат которого в большой степени случаен, его нельзя достоверно предсказать или повторить. Генеративное искусство часто сравнивают с тем, что производят нейросети (AI-driven art), но между ними находят как сходства, так и различия.
«Что и как будет, когда каждый человек на Земле сможет создавать замечательные произведения?»
— А когда и почему появилось генеративное искусство?
— Генеративное искусство вполне закономерно возникло, когда появились компьютеры. Точнее даже, оно появилось лет на 20-30 раньше компьютеров, когда появились алгоритмические системы, у которых была какая-никакая свобода действий. Я когда-то для себя сформулировал, что сначала в реальной жизни все было аналоговое, потом появилось такое понятие как «цифра». Причем оно появилось заметно раньше того, как о нем начали говорить и в этом контексте начали действовать.
На эту тему есть один из любимых мной роликов: очень остроумная инсталляция, которая представляет собой экран с очень низким разрешением, грубо говоря, 10 на 10 пикселей, на который передается картинка с камеры, стоящей рядом. Но сам «экран» представляет собой механические штучки, к которым прикреплена черная пушистая меховая хрень и белая пушистая меховая хрень. И в зависимости от того, какой цвет подается на этот пиксель, штучка поворачивается либо черным боком, либо белым. И мы, с одной стороны, видим оцифрованную картинку очень низкого разрешения, черно-бело-пиксельную, с другой — это предельно аналоговая вещь, потому что она вся меховая и ее очень хочется потрогать.
Это лишь один остроумный пример, есть масса более известных: например, пианола, изобретенная в конце XIX века: брали пианино, засовывали в него механический прибор и «кормили» перфолентами. За пианолу садился музыкант, что-то наигрывал, в механизме протягивалась лента и пока он играл, в ней пробивались дырочки. И если ее потом зарядить в барабан, пианино само играло именно то исполнение.
— Выходит, если отсчитывать от конца XIX века, генеративному искусству уже почти пара столетий?
— Не совсем так: пара столетий или даже сильно больше — тому, что называется сейчас медиа-искусством. Когда совершенно разные среды, методы и так далее сплавляются воедино. Афанасий Кирхер в XVII веке устраивал первые шоу с дымом, световыми проекциями, музыкальным звуком и так далее — он, наверное, был первым медиа-художником. Потом появилась вышеупомянутая «цифра» (но еще не генератив). В XX веке были опыты с прототипами нынешних осциллографов, а после Второй мировой войны был такой Джон Уитни: он приспособил к графике установки зенитных пулеметов, которые вращались в трех степенях свободы. С них сняли пулеметы, но оставили механизм, которым можно было управлять с помощью аналогового компьютера, и поставили рисующие инструменты. Получалась очень интересная калейдоскопическая графика, он с ее помощью делал даже первую телевизионную генеративную рекламу, насколько я знаю.
Первая «честная» генеративка возникает, когда появляется понятие кода. Когда у нас есть не просто оцифрованный сценарий, ноты, партитура, не какой-то простенький алгоритм, а нечто, что можно назвать программой. Если А, то В, а если В, то С и так далее. Относительно сложный алгоритм действий, в котором могут возникать неожиданности. Когда ты можешь усложнить систему до такой степени, что не всегда угадываешь, что из нее вылезет на выходе.
И в этом смысле эти современные нейрики (нейронные сети. — Reminder) принципиально ничем не отличаются от старых методов, просто они сразу на столько порядков качественно рванули вверх. Человеку, который впервые их видит, трудно поверить, что это все звенья одной цепи и что получается мгновенно пролететь условные 20 километров, а не как раньше, когда все это было очень медленно.
Работа Вадима Эпштейна Ghosts на сайте Aeon
— Вы хотите сказать, что с точки зрения технологий в нейросетях типа Midjourney нет никакого прорыва, все было придумано раньше?
— Модель мозга, которая легла в основу нейросетей, разработана в 1960-е годы. И еще в 1980-х и в 1990-х годах она лежала на бумаге, потому что с ней вообще ничего сделать было нельзя, в практическом смысле. В 1990-х ее начали засовывать в компьютеры, но все равно это было очень медленно, очень небольшие размеры и объемы данных и так далее. Это был научный, игрушечный опыт.
А потом появилось нужное железо с массовым производством видеокарт, и произошло несколько очень интересных математических открытий. Например, появились диффузионные модели с совершенно другой математикой. Появились так называемые foundation models (базисные модели), которые поменяли всю парадигму.
Как было до этого? Если мы хотим что-то сделать с нейросетями, то надо подобрать архитектуру, собрать самим данные, обучить на этих данных нужную нам модель, и она будет делать то, что нам нужно. Одна нейросетка — одна модель — одна задача. А с развитием этих базисных моделей, которым скармливали сразу пол-интернета, гигантское количество данных, они сходу смогли решать самые разные задачи. Минус в том, что они требовали на много порядков больших вычислительных мощностей, объемов данных, которых у обычного человека в домашних условиях не будет.
Примерно с 2020 и до середины 2022 года складывалась грустная перспектива, что мы будем зависеть только от корпораций, которые будут нас кормить с ложечки тем, чем сочтут нужным — если сочтут. Но потом появились достаточно мощные комьюнити и конторы, которые были готовы кооперироваться с такими комьюнити.
Первая ласточка — Stable Diffusion, крутая и мощная модель, которая стала полностью опенсорсной. Для нее люди собирали опенсорсный гигантский датасет, который каждый может скачать, обучали модель, и она тоже доступна каждому. Обучить такую модель с нуля не каждый сможет, потому что там только за электричество счета будут в сотнях тысяч долларов.
Эмад Мостак [гендиректор Stability AI, сделавшей Stable Diffusion] основной их целью и задачей всегда называл Creativity for Billions, «Креативность для миллиардов». Им самим интересно посмотреть, что и как будет, когда внезапно каждый человек на Земле сможет создавать замечательные произведения, пока что визуальные, которые до этого были доступны только специально обученным, подготовленным людям, потратившим на это много времени и ресурсов. А тут — такое, бери и твори.
«"Человеческий" художник от "машинного" отличается только быстродействием»
— Как вы относитесь к дискуссиям среди художников, что использование нейросетей это нечестно, читерство, и что по крайней мере надо указывать, что была использована нейросеть. И что будет, когда миллиарды людей начнут творить свое искусство?
— У меня не особенно получается прогнозировать. Меня такие вопросы вгоняют обычно в ступор, я понятия не имею, что будет дальше. А по поводу читерства… Читерство означает, что человек недостаточно поработал над чем-то. Что до него люди пахали, им нужно было много лет учиться, тратить средства на карандаши, фломастеры и что-то еще, а тут человек с ноутбуком, который не учился десятилетиями, берет и делает такое же. ОК, в первую очередь таких людей нужно спросить: а что для них является, собственно, ценностью творчества? Если у людей цель жизни состоит только в том, чтобы поработать на износ, их можно только пожалеть. А если речь о ценности результата — так честь и хвала условному прогрессу, который резко увеличил КПД.
— Но речь идет еще и о том, что если человек пользуется чужими стилями, наработками, а потом продает работу, то он если не украл, то не заплатил за чужое, продавая его, как свое.
— Это вполне верный упрек. Но это немного другой, тоже важный вопрос — корректного использования наследия человечества. Кто бы что ни говорил, «человеческий» художник от «машинного» художника не отличается ничем, кроме быстродействия. Все странные заявления о том, что машина не создает ничего нового, а только повторяет готовое — а что, человек действует по-другому? Человек тоже в состоянии что-то сделать только на основании того, что в него вложили семья, школа, учителя и так далее. Или чего он нахватался по дороге.
Это очень старая дискуссия. Когда средневековые художники с хорошей фантазией пытались выдумать несуществующих зверей, в лучшем случае получалась компиляция уже известных нам зверей: приделать рог на лошадь и еще что-то. Никто не выдумал не то, что кенгуру, но даже жирафа. Выдумать что-то принципиально новое — с этим одинаково плохо или хорошо у всех механизмов, и кожаных, и не очень.
С другой стороны, как у любой технологии, у нейросеток есть своя довольно яркая специфика, своеобразный артистизм — начиная от пресловутого DeepDream и GANism’а, таких артефактов ранних генеративных сетей, вплоть до нынешних мутаций языка и в больших моделях. То есть обратный «технологический» креатив тут тоже присутствует, чем не новый кубизм?
Эксперимент, техника Stable Diffusion
— Но когда человек что-то создал, и это не выглядит плагиатом, мы признаем его право на работу. Можно ли в таком случае считать создателем машину? Понятно, что это просто инструмент, с помощью которого творит человек, с другой — это инструмент, который позволяет зарабатывать на работах других людей.
— Сначала разберемся с вопросом про заработки. Есть, например, художник Здзислав Бекшинский, на работах которого, по-моему, построена все система Midjourney (шутка, в какой-то степени). И естественно, нужно, чтобы люди, благодаря которым если не изобрели, то развили и популяризировали какой-то стиль, получали какие-то бонусы. Когда-то люди изобрели копирайт, авторские права, систему роялти, сейчас всю эту систему нужно перелопачивать и переделывать.
Я натыкался на пару достаточно стройных вариантов, как с помощью того же блокчейна автоматически учитывать каждую картинку, на основе которой сделана работа. Когда пять миллиардов картинок загружают в машину и она их перелопачивает, на выходе в каких-то долях процентов можно определять, что в этой картинке столько-то того-то, столько-то сего-то. И если картинка продалась за тысячу долларов, соответствующие доли распределяются по авторам.
— То есть, это по сути NFT-механика?
— Да, только NFT это штучный, разовый учет конкретного произведения, а учет роялти — это такая мета-мета-мета механика, с учетом вторых, третьих и десятых производных. И потому она должна быть адски дорогой.
— Только непонятно, как это организовать юридически, потому что мы совсем не готовы к этому.
— Не готовы это само собой. При каждом таком столкновении люди начинают разбираться и упираются в постулат, который вообще не учитывает изменившиеся реалии. Например, с тем же стилем — в авторском праве нет понятия стиля. Невозможно запатентовать стиль или идею, можно только поставить копирайт на конкретную вещь, произведение, продукт.
Еще момент: прямым текстом в понятии копирайта сказано, что автором может быть только человек, на худой конец — коллектив людей. Эта штука не подразумевает существования «нечеловеческих» агентов, а это тоже не подходит к реалиям.
Вы не слышали о проекте Botto Марио Клингемана (Botto — как сплав бота и, к примеру, Джотто. — Reminder)? Это автономный художник, современные крутые алгоритмы рисуют современные крутые картинки, процесс продакшна полностью автоматизирован. Люди в нем никак не участвуют, его просто запустили и все. Но люди — не авторы, а комьюнити — могут влиять на него, оценивая результаты деятельности. Механизм реагирует, и начинает рисовать больше того, что нравится коммьюнити. Он рисует и сам метит это в блокчейне как NFT, которые довольно неплохо продаются. Еще есть отдельный механизм распределения денег, чтобы поддерживать всю систему. Если я не путаю, он уже какие-то миллионы заработал (c момента запуска проекта объем продаж искусства, сгенерированного Botto, составил около 1214 эфиров или $2 млн по курсу на середину марта 2023 года. — Reminder).
«Топать ножкой и говорить: “Платите деньги мне, а не железке” — это луддизм»
— А не может ли все это обернуться тем, что корпорации, которые постоянно делают дизайнерам и художникам огромное количество заказов для производства рекламы, откажутся от услуг живых художников, режиссеров, музыкантов и запустят своего автоматического артиста, который будет генерить все по запросу и которому не нужно будет отдельно платить?
— Оно уже так работает. Это пока не стало массовым, но есть некоторое количество сервисов, которые ровно на такую экосистему и нацелены, практически на 100% заточены под корпорации. Например, есть стартап Synthesia, делающий синтетических дикторов: приятно выглядящие говорящие головы, которые не спеша, с артикуляциями и заигрыванием произносят написанный для них текст. Это чистейший корпоративный сектор, рядовому человеку такое не нужно.
Или, например, стартап Mubert, который делает генеративную музыку. У них есть отдельно полуфабрикаты для творцов, отдельно — для обычных людей, когда просто включил стрим и он тебе что-то играет. А отдельно — royalty free музыка, которую ты можешь собрать из конструктора: мне, пожалуйста, черный верх, белый низ, две с половиной минуты и поживее.
— Условно говоря, музыку для лифтов уже не надо никому поручать писать.
— Абсолютно. И я как раз в этом вижу гигантский плюс, потому что корпорации замкнутся сами на себя. Это будет минусом в том плане, что от них не будет идти поток бабла творцам и поляна заработка станет немножко победнее. Но есть надежда, что при этом высвободятся ресурсы, и будет возможность зарабатывать себе на жизнь не только подачками от корпораций. Если корпорации получат весь набор нужных им инструментов и перестанут трахать мозги людям, чтобы те делали им корпоративную нудянку, если ее будут делать автоматы, то это можно только приветствовать.
— Но это же огромный поток денег, который дизайнеры, художники, композиторы и другие креативщики перестанут получать. Хорошо ли это?
— Как художники будут жить без этого бабла, вопрос пока открытый. Но я ни какой-то алогичности, ни нарушения прав и свобод в этом не вижу. Понятно, что лучше быть здоровым и богатым, чем бедным и больным. Но если корпорация имеет возможность не тратить деньги на художников, то со стороны художников вставать в позу, топать ножкой и говорить: «Где мои деньги, платите мне, а не железке» — это такой, знаете ли, луддизм. Стань лучше железки — тебе заплатят.
А вот в том, что условный Здзислав Бекшинский, стиль которого сейчас на каждом втором экране, не получает за это ни копейки, есть определенный криминал. Человек действительно сильно повлиял на окружающий мир, ему за это нужно заплатить.
— Наверное, часть компаний, например, производители товаров роскоши, продолжат делать заказы живым художникам и будут это подчеркивать. Но если масс-маркет уйдет в генеративное искусство, чем зарабатывать творцам?
— Пока что нет этой антиутопической картины, когда корпорации полностью зациклены на себя, а художники вынуждены бегать по улицам и искать потребителей.
В моем понимании все упирается только в то, что мы уже получили инструментарий, который драматически поднял планку — то, на что раньше уходили гигантские усилия, делается одной кнопкой. Но это не значит, что одна кнопка приводит к идеалу. Все равно кто-то говорит, что это бездушно, кто-то справедливо указывает, что [на картинках] у всех по шесть пальцев и пять ног, и так далее — есть над чем работать.
Просто человек привык к одному балансу, а этот баланс внезапно и резко изменился. А чтобы все опять стало уравновешено, нужно успеть быстро подвинуть человеческие навыки и привычки к изменившемуся балансу технологий. Условным творцам, в первую очередь, не надо защищать, запрещать и пытаться остаться там, где мы есть — это в любом случае не получится. Скорее так — ОК, чувак использовал Midjourney, как им пользоваться, еще раз покажите? А с потребительской, оценочной стороны какое-то время понадобится на переосмысление того, что теперь считать шедеврами. Если вдруг все стало «очень красиво», это же не значит, что все потеряли свои оценочные критерии и будут одинаково радостно воспринимать Midjourney и шедевры из Лувра.
— Я вижу тревогу еще и в другом. Цифровые произведения искусства несложно копировать — вспомним историю с райткликерами и NFT — и это будет не просто копия, как в случае с физическими произведениями, это будет та же самая работа.
— У меня не очень хорошо получается думать в сторону коллекционирования, хранения, у меня обычно доминирует противоположная тенденция — избавляться от всего лишнего. Коллекционировать, собирать, тащить в норку — у меня такого механизма в голове нет.
Я в начале нашего разговора противопоставлял искусство как что-то внутреннее, глубинное, эмоционально необходимое человеку и искусство как набор внешних механизмов. Так и в случае с коллекционированием: есть эмоциональные потрясения от просмотра Мадонны, и есть удовлетворение от обладания ей. Эти вещи вообще никак не связаны, что самым вопиющим образом продемонстрировали эти самые райткликеры — когда нет разницы, остается только чувство собственности.
Я в этом смысле как раз условный райткликер. Мне глубоко непонятно, зачем платить много денег за то, что я могу посмотреть и так. Я не получу дополнительной разницы в переживаниях. Но это я, а есть люди, для которых это чувство собственности крайне важно. И то, что у нас получается отдельно творчество, а отдельно — спекулятивная пристройка, которая позволяет покупать, обмениваться и обладать, это, по-моему, весьма достойный результат прогресса.
Эксперимент, техника recursive pix2pix
«Мы уже подбираемся к тому, чтобы желание стало редким и ценным ресурсом»
— Я разговаривал с математиком, который разрабатывал алгоритмы для автоматической RTB-рекламы. У него была фраза: «современная реклама это не реклама, а разведка», в том смысле, что ее задача не столько показать нам какие-то вещи, сколько отследить наши реакции и затем пытаться изменить наше поведение, что мы больше покупали и так далее. Это, конечно, довольно цинично, но так было всегда, сейчас просто на другом технологическом уровне.
— Цинизм — это упрощение. Торговля всегда была циничной, потому что она была призвана упростить товарообмен. Но поскольку все усложняется, весь мир, его торговая составляющая, которая затем стала рекламой, становится бихевиористикой, влиянием на поведение, она пытается алгоритмизировать и упростить процессы.
Практический выхлоп — управление людьми, в той или иной форме. Уже сейчас человеческое внимание это универсальная валюта, а дальше, в моем понимании, если не не валютой, то каким-то важным ресурсом, над которым будут работать, станут человеческие желания.
Реклама и сейчас занята в основном тем, что вызывает желания, точнее, перепроецирует их. Она работает на основе базовых желаний, которые есть у всех — еда, секс и так далее — и трансформирует их в другие: показывает красивую девушку в бирюльках и все бегут покупать бирюльки. Но мы уже подбираемся к тому, что из-за перенасыщения возможностями количество и качество желаний будут сильно деградировать, и они сами могут стать важным и ценным ресурсом. Грубо говоря, либо людям будут платить за то, что они вообще что-то захотят, хоть что-нибудь. Либо люди, которые умеют хотеть, станут востребованными и высокооплачиваемыми специалистами: потому, что они это могут, а другие просто послушно за ними ходят.
— Здесь мы подходим к вопросу об интерфейсах мозг-компьютер и возможности напрямую из головы считывать мысли или эмоции, которые мы даже не всегда можем четко сформулировать в словах. Может быть, нам будет не нужно специально что-то желать, наши желания будут считываться через этот интерфейс.
— Да, конечно. Работа над такими интерфейсами ведется давно, но с началом бума нейросетей оказалось, что прямолинейный ход — вживлять электроды, как мышкам — слишком ломовой, интрузивный и далеко не самый эффективный. Не надо идти танками, если можно применять пару опытных диверсантов.
Не так давно была опубликована работа, в которой люди натренировали модельку, которая по данным с фМРТ воссоздавала картинку того, что человек видит. И там была пара иллюстраций: что показывают человеку и что нарисовала нейросеть, сканируя в это время его мозг. И они, в общем, неплохо совпадали, вплоть до композиции, цветовой гаммы, ну и базового содержания.
Сверху — изображения, которые показывали испытуемым. Снизу — реконструированные с помощью нейросети образы на основе данных фМРТ
— Могут ли будущие метавселенные и другие объекты расширенной реальности стать способом трудоустройства художников и других артистов? Метавселенные же как раз предполагают возможность создания любых миров, какие только можно придумать.
— Совсем базово — да. Но может быть, это применимо к тому метаверсу, который описал Нил Стивенсон в «Лавине», хотя он тоже не единственный и не предел мечтаний. А то, что сейчас называют метаверсом — немножко не о том, по-моему.
Мне в этом смысле очень близка формулировка Сергея Цыпцына. Это замечательный человек, который много лет работал в компьютерной графике, написал несколько книг, практически библию по 3D. А потом ушел в формирование движухи: проводил CG-ивенты в Москве и других городах, тусовки, конференции, форумы, короче, всячески развивал и популяризировал работу с компьютерной графикой. Не только и не столько с технической точки зрения, сколько и с философской.
С его точки зрения, если в двух словах: правильный метаверс — это Госуслуги, а не красивая 3D-картинка. Основная задача и цель метаверса — создать для человека параллельную реальность, где он может полноценно существовать, как в альтернативе внешнему миру. Для этого нужно наполнение процессами, в первую очередь, и уже в десятую очередь — какие-то 3Dшечки.
А отдельных технологий уже сейчас хватает: во время пандемии, два года назад, когда все сидели и боялись, и казалось, что уж что-что, а клубно-тусовочная жизнь похоронена надолго, пытались проводить VR-рэйвы. И был такой VR-фестиваль Lost Horizon от команды, которая делала сцены на фестивалях вроде Glastonbury и понимает, что такое правильная тусовка. Они пытались перенести это в VR и у них получилось.
Я решил одним глазком глянуть, что там вообще происходит, надел шлем в 11 вечера и снял в 6 утра, когда все закончилось. Очень крутой экспириенс. Но это была разовая акция, не последовало ни продолжения, ни развития. И то, в какую сторону сейчас пытаются это двигать — в сторону массовости и охвата, не предлагает массам ничего из того, что может их хоть как-то зацепить. Не говоря уже — заставить проводить там какое-то длительное время.
Помимо крутой графики и полноценного иммерсивного экспириенса, ощущения погружения, важно еще, чтобы человек не только и не столько отрывался, вертя головой в шлеме и наслаждаясь непривычными пространственными эффектами, а чтобы он мог делать там какие-то вещи, которые в принципе не может делать в реальной жизни, иначе зачем ему из реальной жизни выпадать.
— Много говорят о том, что генерация видео очень сильно изменит все отрасли, связанные с видео, в том числе кино и ТВ. Что самое интересное может произойти в этой области, как вы считаете? Что станет прорывом?
— Будут synthetic media, синтетические медиа. Интересно будет, когда и если люди наконец перестанут доверять любым медиа, как классу, когда станет повсеместным понимание, что любой message может быть поддельной атакой. Тупо защищаться от этого — это опять луддизм. Надо будет думать, как это использовать себе во благо. Хотя вряд ли это быстро случится, человечество очень инерционно и консервативно.
— Что такое синтетические медиа, сплав всего — кино, игр, музыки в одном?
— Не обязательно. В словах «синтетические медиа» акцент все-таки на слово «синтетические». Львиная доля контента, который мы потребляем, будь то изолированные медиа типа литературы или комплексные в духе похода в кино на фильмы Marvel, сейчас рукотворна. Объясню так: возьмем обычное советское кино 70-х годов, у режиссера априори есть условия, ограниченные техническими возможностями и бюджетом. Если он хочет изобразить марсианина, ему нужно очень постараться — комбинированными съемками, макетами, муляжами и так далее.
А в синтетических медиа нет никакой разницы, делать с нуля марсианина или реальную земную лягушку. Земную лягушку будет сделать даже сложнее, потому что все знают, как она выглядит, и есть, с чем сравнить. И при переходе на синтетический пайплайн правдоподобность становится всего лишь дополнительным бонусом, а весь процесс производства и создания продукта в любом случае будет отвязан от реальности.
В крипте есть понятие «air gap», когда есть компьютер, подключенный к интернету, а есть компьютер, в котором какие-то крипторесурсы. И они не должны быть соединены ни единым проводом, чтобы на эти ресурсы ничто не повлияло. Синтетические медиа, по-моему мнению, будут примерно так же дистанцированы от реальности: какая-то связь с ней будет, но ее можно будет в любой момент обрезать и продолжить генерить тот же контент, но уже без какой-либо реальности.
— Может ли во всем этом искусственный интеллект сам, без участия людей или с минимальным участием, создавать персонажей фильмов, писать сценарии, музыку и так далее? Творить сам?
— Тут мы возвращаемся к тому, что есть творчество и кто такой автор. В современной парадигме априори считается, что автор это тот, кто обладает полнотой инициативы, воли и ответственности за создание чего-либо. Это особенно хорошо проявляется в работах хорошо поставленных, раскрученных и дорогих художников, начиная от Дэмиена Херста. На них работают десятки людей, которые «виновны» в успехе продукта, глядя на который ты понимаешь, кто именно над ним работал. Но сами по отдельности они этого не сделали, а большой художник пришел, подумал и сказал: «А давайте сделаем вот это», собрал команду и заставил каким-то образом реализовать его идеи. На его стороне воля, инициатива и ответственность, а вся остальная работа — на других.
С искусственным интеллектом примерно та же ситуация: воли, ответственности и инициативы у него не будет еще очень долго. Хотя бы потому, что мы сами не понимаем, что это. Кроме того, в любых законах, канонах, правилах и морали человека фигурирует только другой человек, а «нечеловеческие» моменты рассматриваются лишь в качестве вспомогательных условий. И я не думаю, что в обозримом будущем возникнет ситуация, в которой общество признало бы, что нечеловеческий агент, нечеловеческая конструкция самостоятельно что-то сделала.
Отчасти потому, что мы исторически к этому не готовы, отчасти потому, что в нынешней парадигме у нас есть акцент на царя горы, главного актора, который за все отвечает. Просто из-за человеческого эго — человеку очень и очень сложно признать, что появилось нечто круче него, что его обошло и обскакало. Например, даже в очень современном искусстве почти невозможно признать автором стихийное бедствие — ибо оно не предполагает авторского жеста или высказывания. И нейросети в этой парадигме воспринимаются именно как этакая контролируемая стихия, не более (что, кстати, логично, если принять тот факт, что нейросети — это математические функции, а математика — язык природы).
Понятия и определения на ходу меняются, все это выглядит ровно так, как в мемчиках пишут — длинная череда событий и стрелочка «вы находитесь здесь». А сверху приписка — будет то-то, тогда и поговорим. И уже длиннющий список: тест Тьюринга пройден, во все возможные человеческие игры машины нас уже обыграли, но мы выкатываем новые требования — нет, это все еще неважно, вот когда машина сделает вот это, тогда и поговорим. И это бесконечный процесс: очевидно, что пока дело не дойдет до мифического AGI, «настоящего» искусственного интеллекта, к каким-то деталям всегда будут придирки.
Комментарии
Отправить комментарий