Нейросети – одна из самых быстро развивающихся технологий. Не замечать влияние нейросетей тяжело – они пишут тексты, рисуют изображения, генерируют песни и видео и даже копируют голоса. А раз нейросети могут обучаться прямо во время работы, удобным тренажёром для них могут стать видеоигры.
Изображение сгенерировано нейросетью Playground
Ключ к власти
Нейронная сеть в широком понимании – система, нацеленная на решение определённой задачи. Изначально «нейронная сеть» – термин биологический. Так называют совокупность нервных клеток живого организма. Искусственные нейросети в свою очередь представляют собой математические модели, которые работают аналогично биологическим нейронным сетям.
– Нейросети – инструмент двадцать первого века, который революционизирует всё – от банального поиска в интернете до сложнейших научных исследований, – рассказывает Сергей Зубарев, специалист по нейросетям, научный руководитель и генеральный директор компании Sistemma. – Нейросети превращают наши смартфоны в умных ассистентов, которые не только понимают команды, но и предугадывают желания. В науке и бизнесе нейросети – золотой стандарт анализа данных. Они позволяют учёным разгадывать тайны Вселенной – от прогнозирования климатических изменений до разработки новых лекарств. В бизнесе нейросети трансформируют маркетинг, производство и сферу обслуживания клиентов. Представьте себе: алгоритмы знают ваших клиентов лучше, чем они сами, и подсказывают, какие продукты нужно разрабатывать и как оптимизировать процессы. Мы живём в эпоху, когда данные правят миром, и нейросети – ключ к этим данным.
Эволюция цифрового разума
Появлению цифровых нейросетей предшествовали нейрокомпьютеры. Они представляли собой похожую систему, только содержалась она на конкретном машинном оборудовании, в то время как современные нейросети хранятся на цифровых носителях или в облачных хранилищах.
Первый нейрокомпьютер был создан в 1957 году Фрэнком Розенблаттом и получил название MARK 1. Его устройство описал советский учёный-механик Юрий Голубев в своей книге «Нейросетевые методы в мехатронике». Непосредственно компьютерная модель (то есть ранний прототип нейросети), составляющая систему, получила название перцептрон. Он состоял из трёх типов элементов: S, A и R (сенсорный, ассоциативный и реагирующий соответственно). Данные (в самом широком смысле) поступают на сенсорный элемент, который вырабатывает сигнал, передающийся далее на ассоциативный элемент, а с него – на реагирующий элемент, который формирует тот или иной выходной сигнал. Похожий процесс происходит при восприятии информации в мозге человека.
Дальнейшее развитие технологий привело к новым возможностям: возник вопрос об обучении нейросетей для решения более сложных задач. В 1980 году Кунихико Фукусима предложил компьютерную модель «неокогнитрон» (.pdf), способную распознавать написанные от руки японские иероглифы. Его принцип работы отличался более сложным устройством, предполагающим отслеживание системой не всех поступающих сигналов, а только соответствующих заданным критериям. Благодаря неокогнитрону стал возможен более точный подход к выделению значимых сигналов и их фильтрации относительно «помех». Неокогнитрон считается первой свёрточной нейронной сетью, положившей начало новому подходу к организации искусственного интеллекта.
Современные популярные нейросети (в том числе ChatGPT, BERT, GPT-4) появились совсем недавно. Большинство из них основано на разработанной Google системе Transformer. В 2017 году в статье «Внимание – это всё, что вам нужно» компания представила (.pdf) общественности инновационную архитектуру глубокого обучения нейронных сетей. Своё название она получила из-за внутреннего устройства, которое трансформирует любой поступающий сигнал в соответствующий токен (внутреннюю цифровую единицу данных) для последующей классификации и выходной реакции.
– Потенциал нейросетей огромен, однако не безграничен, – считает Никита Шуков, специалист по нейросетям, основатель платформы RoboGPT. – Один из ключевых факторов – это качество и количество данных, на которых обучаются нейросети. Недостаток данных или ошибки в них могут привести к некорректным результатам и снижению производительности моделей. Кроме того, эффективности нейросетей часто мешает сложность задач и необходимость наличия адекватных вычислительных ресурсов для их решения. Несмотря на эти ограничения, нейросети уже достигли значительного прогресса в автоматизации процессов. В нескольких областях, таких как обработка изображений, диагностика заболеваний и прогнозирование финансовых рынков, автоматизация на базе нейросетей достигла такой степени, что человеческое вмешательство требуется минимально. Однако полная автоматизация всех процессов в ближайшем будущем маловероятна.
Изображение сгенерировано нейросетью Playground
Как компьютеры играют в игры
Видеоигры – удобный полигон для испытаний нейронных сетей и искусственного интеллекта. Так, в StarCraft II разработчики нейронной сети Alfastar проанализировали её способность к самообучению в течение нескольких игр против профессионального киберспортсмена. StarCraft II – одна из самых сложных стратегических игр, в которой успех во многом зависит от эффективного планирования и правильного распределения ресурсов при игре «на дистанции». Тем не менее Alfastar обыграла киберспортсмена со счётом 5:0 – знаменательное событие в истории развития нейросетей.
Высоким потенциалом для тестирования и обучения нейросетей обладают так называемые «игры без игроков» (zero player game, ZPG). Их суть в том, что игрок либо вообще не задействован в процессе, либо задаёт лишь начальные условия, а дальнейшие решения машина принимает полностью самостоятельно. Подобные приложения подходят для анализа теоретических ситуаций и изучения возможностей тестируемой нейросети.
Progress Quest – яркий пример ZPG. Игрок создаёт персонажа, далее запускается игровой процесс (большая часть которого посвящена сражениям), а программа вычисляет способность персонажа сражаться с постоянно усиливающимися противниками. Игра в целом бесконечна, её продолжительность зависит лишь от того, как далеко сможет дойти созданный персонаж. Поскольку программа фактически не допускает стороннего вмешательства, её механизм может использоваться для исследования и поиска читерства (то есть «нечестного» вмешательства) или для создания полноценного, не допускающего обхода установленных правил программного обеспечения.
Ещё одну возможность нейросетей продемонстрировал пользователь YouTube, который поставил перед Midjourney задачу по хуманизации персонажей из серии Grand Theft Auto. Во многих играх старше двадцати лет графика достаточно схематична и не содержит ярких отличительных черт для успешной обработки нейросетью. Тем не менее результат работы Midjourney превзошёл ожидания: пользователь опубликовал быстро набравшее популярность видео, показывающее, как могли бы выглядеть персонажи одной из игр серии, если бы она была экранизирована.
Четверть века назад карманные персональные компьютеры с сотней разных функций были фантастикой. Сейчас крупные нейронные сети буквально за пару секунд создают изображения, тексты, сценарии, музыку и видео, пишут программный код. Возможно, совсем скоро они научатся генерировать полноценные масштабные видеоигры, а видеохостинги заполнят летсплеи, записанные нейросетями.