«Мировые модели» или «симуляторы мира» в искусственном интеллекте, как считают многие эксперты, могут стать следующим революционным прорывом. В подтверждение этому стартап World Labs, основанный пионером ИИ Фэй-Фэй Ли, собрал 230 миллионов долларов на разработку так называемых «мировых моделей», а DeepMind пригласила Сору, соавтора генератора видео от OpenAI, для работы над «симуляторами мира».
Что же представляют собой мировые модели и почему к ним столько внимания?
Мировые модели вдохновлены концепцией ментальных моделей, которые люди создают естественным образом. Наш мозг берет информацию от органов чувств и преобразует её в абстрактные представления, которые позволяют нам осмысленно взаимодействовать с окружающим миром. Эти «модели», на основе которых мозг делает прогнозы, определяют, как мы воспринимаем и реагируем на происходящее вокруг нас.
Как объясняют исследователи Дэвид Ха и Юрген Шмидхубер, к примеру, в бейсболе у отбивающих есть буквально доли секунды, чтобы среагировать на подачу мяча и решить, как именно они ударят по нему. Этот момент слишком короткий, чтобы сигнал успел достигнуть мозга, однако, благодаря «внутренней модели мира», они подсознательно предугадывают траекторию и направление удара.
Исследователи считают, что именно такие интуитивные, подсознательные процессы, основанные на мировых моделях, являются одним из важнейших факторов, которые приближают ИИ к человеческому уровню интеллекта.
Моделирование мира и его значение
Концепция мировых моделей существует уже десятки лет, но сейчас она переживает возрождение, благодаря развитию генеративного видео. Сложность большинства современных ИИ-моделей в том, что они часто не понимают, почему происходят определенные действия, даже если могут предсказывать их. Например, модель может предсказать, что баскетбольный мяч отскочит от пола, но не понимает, почему именно это происходит.
В отличие от этого, модель мира с базовым представлением о том, почему мяч подпрыгивает, будет намного более реалистично отображать такие процессы. Такие модели обучаются на разнородных данных — от изображений и видео до текстов и звуков, — чтобы научиться моделировать события, причины и следствия различных действий.
Применение и перспективы
Существуют обширные перспективы для использования мировых моделей. Например, главный научный сотрудник Meta Ян Лекун прогнозирует, что со временем такие модели смогут выполнять сложное прогнозирование и планирование. Модель, способная воспринять текущую реальность (например, грязную комнату) и цель (чистую комнату), могла бы составить план действий для достижения этой цели — прибираться, выносить мусор, мыть посуду, — основываясь не на заранее установленной схеме, а на глубоком понимании последовательности действий, необходимых для перехода от начального к конечному состоянию.
Как отметил Лекун, на создание таких моделей мира потребуется не менее десяти лет. Однако уже сейчас эти модели демонстрируют обещающие результаты, в частности, в симуляции базовых физических процессов и в генерации видео, более реалистичного и последовательного.
Ограничения и трудности
Создание и обучение моделей мира требует огромных вычислительных ресурсов, гораздо больше, чем у современных генеративных моделей ИИ. Модели мира также имеют склонность к ошибкам и подвержены предвзятости в данных, на которых они обучаются. Например, модель, обученная в основном на изображениях городов с солнечной погодой, может испытывать трудности с созданием зимних пейзажей или изображений корейских городов.
Для преодоления этих сложностей необходимо, чтобы обучающие данные были максимально разнообразными, охватывая множество различных сценариев. Кроме того, модели должны уметь создавать взаимосвязанные карты окружающей среды и взаимодействовать с ними, как отметил генеральный директор стартапа Runway Кристобаль Валенсуэла.
Будущее и потенциал
Если мировые модели преодолеют текущие трудности, они могут стать важной основой для развития робототехники и автоматизированного принятия решений. Такие модели позволят ИИ взаимодействовать с реальным миром более надежно и реалистично, что может привести к улучшению взаимодействия с виртуальной и физической средой.
Сегодняшние роботы ограничены в своей функциональности, так как у них нет полноценного осознания окружения. Мировые модели помогут им обрести это понимание, что позволит более точно интерпретировать происходящее вокруг и принимать соответствующие решения.
Таким образом, мировые модели ИИ предлагают огромные перспективы для создания высокоразвитых виртуальных миров, улучшения робототехники и значительного прогресса в понимании и симуляции физического мира, что в конечном итоге может привести к более человечному и интуитивному искусственному интеллекту.