Материал представляет собой перевод статьи, подготовленный в рамках работы студенческого переводческого бюро Тольяттинского государственного университета.
В одном из недавних научно-фантастических фильмов перед главной героиней, лингвистом, поставлена сложная задача – расшифровать инопланетный язык. Он содержит фразы-палиндромы, написанные кольцеобразными символами и читающиеся одинаково в обоих направлениях. В то время как главная героиня постепенно приближается к разгадке, разные страны мира воспринимают инопланетные послания по-разному – некоторые видят в них угрозу.
Если бы человечество оказалось в подобной ситуации прямо сейчас, то, возможно, лучше всего было бы обратиться к научным исследованиям о том, как искусственный интеллект (ИИ) учится разрабатывать собственный язык. Но что такое язык?
Источник: freepik.com
Среди нас не найти того, кто бы не использовал по меньшей мере один язык, чтобы общаться с окружающими. Но откуда он у нас появился? Над этим вопросом лингвисты бьются уже несколько десятилетий, но выяснить это совсем не просто.
Язык эфемерен и не оставляет следов для археологов, поэтому мы не можем изучить, как развивались древние языки, проведя раскопки. Но если изучить эволюцию человеческого языка в материальном мире не представляется возможным, то имеет смысл поискать ответы в виртуальной реальности. Здесь нам на помощь приходит ИИ – а именно потрясающая область исследований под названием emergent communication (область, исследующая коммуникацию агентов в ходе передачи данных для решения некоторой задачи; часто упоминается в контексте глубокого обучения. – Прим. перев.), которой я занимался последние три года.
Чтобы смоделировать возможный процесс развития языка, мы даём так называемым агентам (ИИ) простые задачи, которые требуют речевого взаимодействия: например, игру, где один робот должен провести другого к заданной точке виртуального пространства, не показывая ему карту. Мы не устанавливаем для них практически никаких ограничений на содержание сообщений и способы их передачи, а просто даём им задание и позволяем решать его так, как они хотят.
Поскольку решение подобных задач требует от агентов общения друг с другом, мы можем проследить, как с течением времени развивается их коммуникация, чтобы получить представление о возможном развитии и нашего собственного языка.
Подобные эксперименты проводились и с участием людей. Представьте, что вы владеете только родным языком и работаете в паре с человеком, не говорящим на вашем языке. Ваша задача – попросить напарника взять зелёный кубик из набора предметов на столе. Можно, например, попытаться изобразить жестами форму куба и указать на траву за окном, чтобы обозначить зелёный цвет. В какой-то момент вы с напарником придёте к своего рода протоязыку: допустим, будете использовать определённые жесты или символы для обозначения понятий «куб» и «зелёный». Через некоторое количество повторений эти импровизированные сигналы станут более отточенными и устойчивыми, сформировав базовую систему коммуникации.
Подобным образом действует и искусственный интеллект. Путём проб и ошибок агенты учатся передавать информацию об объектах, которые видят, и понимать друг друга.
Но как мы поймём, о чём они говорят и что значит то или иное слово, если агенты используют свой язык только в общении друг с другом? Ведь какое-то слово может означать «зелёный», «куб» или, что ещё хуже, и то и другое. Проблема интерпретации как раз и составляет ключевую часть моего исследования.
Взлом кода
На первый взгляд понимание языка ИИ кажется невыполнимой задачей. Если бы я попытался поговорить на моём родном польском языке с коллегой, который говорит только по-английски, мы бы не поняли друг друга и даже не смогли бы определить, где заканчивается одно слово и начинается следующее.
С языками искусственного интеллекта проделать это ещё труднее, потому что они могут представлять информацию в форме, совершенно чуждой языковым паттернам человека.
Однако лингвисты разработали комплексные методы, прибегнув для интерпретации неизвестных языков к теории информации.
Для того чтобы понять структуру искусственного языка ИИ, мы изучаем закономерности речи агентов – так же, как археологи восстанавливают по разрозненным фрагментам древние языки. Иногда это приводит к обнаружению удивительных сходств с естественными языками, а то и совершенно новых способов общения.
Подобные исследования позволяют нам заглянуть в «чёрный ящик» ИИ и понять, как агенты вырабатывают уникальные способы обмена информацией.
Одна из моих недавних работ посвящена интерпретации языка агентов с помощью объектов, которые они наблюдают, и «фраз», которые они при этом произносят. Представьте, что у вас есть расшифровка разговора на неизвестном вам языке, где указано, на что смотрел каждый из говорящих в каждый момент речи. Мы можем сопоставить паттерны в расшифровке с объектами в поле зрения говорящего, основываясь на статистических связях между словами и объектами.
Например, фраза, звучащая как йайо может быть соотнесена с пролетающей мимо птицей, а значит, можно предположить, что йайо для говорящего – обозначение птицы. Внимательно анализируя подобные закономерности, можно приступить и к расшифровке всего разговора.
В одной из недавних работ мы с коллегами показываем, что подобные методы могут использоваться для расшифровки по крайней мере части языка и синтаксиса ИИ-агентов, что позволит нам понять кое-что о том, как они могут строить коммуникацию.
Искусственный интеллект и инопланетяне
Какое отношение к этому имеют инопланетяне? Дело в том, что методы, которые мы разрабатываем для понимания языков ИИ, в будущем смогут помочь нам расшифровать любые инопланетные сообщения.
Если нам удастся получить запись инопланетного текста вместе с контекстом его возникновения (например, визуальной информацией, относящейся к тексту), мы сможем применить аналогичные статистические инструменты для его анализа. Подходы, разрабатываемые сегодня, в будущем смогут стать полезными инструментами ксенолингвистики, то есть науки об изучении инопланетных языков.
Однако нам не обязательно дожидаться инопланетян, ведь извлечь пользу из этих исследований можно уже сейчас: начиная с совершенствования языковых моделей, таких как ChatGPT или Claude, и заканчивая совершенствованием коммуникации между автономными транспортными средствами или беспилотниками.
Расшифровывая искусственные языки, мы можем сделать будущие технологии более понятными. Анализируя, как автомобили с автопилотом координируют свои движения или как системы искусственного интеллекта принимают решения, мы не просто участвуем в разработке интеллектуальных систем – мы учимся понимать их.
Переводчик: Яна Телякова
Редактор: Александра Москалюк
12+