Материал представляет собой перевод статьи, подготовленный в рамках работы студенческого переводческого бюро Тольяттинского государственного университета.
Как выяснили учёные, даже мощной свёрточной нейронной сети ещё есть чему поучиться у «крысиного зрения».
Источник: freepik.com
Для продвинутых моделей искусственного интеллекта уже не составляет труда генерировать компьютерный код и оказывать помощь в создании новых лекарственных препаратов, но, когда дело доходит до распознавания простых объектов, им, возможно, всё ещё есть чему поучиться у обычной крысы. Таковы выводы статьи, опубликованной в журнале Patterns. Исследователи из итальянского научного института Scuola Internazionale Superiore di Studi Avanzati (SISSA) поставили перед моделью распознавания изображений следующую задачу: попытаться воспроизвести способность крыс узнавать знакомые объекты, повёрнутые к «наблюдателю» другой стороной, изменившиеся в размерах или частично заслонённые другими объектами.
Модель ИИ в конечном итоге смогла сравняться с подопытными крысами, но только после того, как использовала немалое количество ресурсов и вычислительной мощности. Хотя идентифицировать объекты в исходном положении было легко как для ИИ, так и для крыс, исследователям пришлось повысить производительность и мощность модели, явно уступавшей крысам в способности распознавать знакомые объекты в непривычном ракурсе. По словам исследователей, результаты свидетельствуют о том, что зрение крыс, отточенное за миллионы лет эволюции, по-прежнему куда более эффективно, чем мощные системы распознавания изображений.
Зрение крыс отличается уникальной эффективностью и адаптивностью
Крысиное зрение имеет несколько характерных особенностей, отличающих его от человеческого. Начнём с того, что, как у многих млекопитающих, глаза крыс расположены по бокам головы. Это даёт им более широкое поле зрения, позволяющее обнаруживать хищников и избегать встречи с ними. Другая, возможно, ещё более необычная особенность: согласно исследованиям, зрачки крыс могут двигаться в противоположных направлениях, в зависимости от положения головы. Именно поэтому крысы кажутся «косоглазыми», когда опускают голову.
Для проведения эксперимента с ИИ крыс обучили распознавать изображения объектов на экране. За выполнение задания крысы получали лакомство. При идентификации целевого объекта активировался сенсорный датчик.
Чтобы посмотреть, как крысиное зрение будет конкурировать с искусственным интеллектом, исследователи из SISSA использовали так называемую «свёрточную нейронную сеть» (англ. convolutional neural network, CNN). Этот тип модели глубокого обучения отчасти создан по образцу зрительной коры головного мозга млекопитающих. В данный момент он рассматривается инженерами как одна из самых передовых систем ИИ для распознавания изображений. Для идентификации объектов CNN использует структуру, основанную на свёрточных слоях. Начальный, самый элементарный слой может обрабатывать и распознавать такие простые параметры, как границы и контрастность изображения. На него накладываются новые свёрточные слои, позволяющие идентифицировать более сложные типы изображений. Для работы каждого дополнительного свёрточного слоя требуется больше ресурсов и вычислительной мощности. Можно сравнить свёрточную нейросеть с собранной из слоёв лазаньей, которую можно сделать выше и плотнее, добавляя в неё всё больше и больше ингредиентов.
Перед моделью CNN была поставлена цель: выполнить те же задания по распознаванию объектов в различных условиях, что и подопытные крысы. И крысы, и искусственный интеллект легко справились с задачей базового уровня сложности – идентифицировать ничем не заслонённый объект, который демонстрировался подопытным в своём обычном положении. На данном этапе модели ИИ потребовалось задействовать только первый свёрточный слой. Но всё изменилось, когда задачи стали сложнее. Когда объекты поворачивали другой стороной или изменяли в размере, модель CNN была вынуждена использовать всё больше свёрточных слоёв и ресурсов. Крысы каждый раз успешно идентифицировали изменившиеся объекты. Крысы узнавали предметы, даже если те были частично чем-то заслонены, с чем ИИ справлялся с трудом. Исследователи пришли к выводу, что зрение крыс в целом оказалось более гибким и адаптируемым, чем механизм распознавания изображений с помощью искусственного интеллекта.
– Крысы, которых часто считают неподходящими моделями для изучения зрения, на самом деле демонстрируют удивительные способности, что заставляет нас переосмыслить потенциал их зрительной системы и одновременно с этим осознать границы возможностей искусственных нейронных сетей, – поделился нейробиолог из SISSA и автор статьи Давид Зокколан. – Этот факт говорит о том, что крысы могли бы стать хорошей моделью для изучения зрительных способностей человека или приматов, у которых очень развита зрительная кора головного мозга. Изучать наши зрительные способности на модели зрения крыс эффективнее, так как искусственные нейронные сети имитируют зрение человека за счёт использования совсем иных стратегий.
ИИ ещё многому предстоит научиться, прежде чем его действительно можно будет считать «сверхразумным»
Исследование крысиного зрения должно послужить полезным напоминанием о том, что мощные модели ИИ, несмотря на демонстрацию впечатляющих решений некоторых специфических задач, по-прежнему несовершенны. В конце прошлого года Сэм Альтман, генеральный директор американской научно-исследовательской организации OpenAI, опубликовал в своём блоге пост, похожий на манифест. В нём говорилось, что мир может столкнуться со «сверхразумом» в виде ИИ в течение ближайшего десятилетия. В то же время миллиардер Илон Маск заявил, что сверхразумный ИИ, скорее всего, появится уже в этом году.
Но что на самом деле показал проведённый итальянскими исследователями сравнительный анализ? Да, большие языковые модели уже способны обойти людей в стандартизированных тестах в медицинских и юридических вузах (при этом ИИ всё ещё не может поставить официальный медицинский диагноз без участия врача; известен случай, когда нескольких профессиональных юристов оштрафовали и отстранили от работы за предоставление сгенерированных ИИ юридических документов, содержащих фальсифицированные факты). В то же время, например, человекоподобные роботы по-прежнему часто испытывают проблемы с равновесием, несмотря на оснащение продвинутыми системами искусственного интеллекта. И, как показывают исследования института SISSA, искусственный интеллект, по-видимому, не может превзойти крыс в распознавании объектов. Другими словами, ИИ ещё многому предстоит научиться и у людей, и у животных.
Переводчик: Елена Верютина
Редактор: Александра Москалюк