Решения для бизнеса
Первые впечатления от OpenAI o1: Как многошаговое рассуждение меняет игру

Первые впечатления от OpenAI o1: Как многошаговое рассуждение меняет игру

OpenAI представила свои новые модели o1 в четверг, давая пользователям ChatGPT возможность оценить работу ИИ, который делает паузы для размышлений перед ответом. Эти модели, известные под кодовым названием «Strawberry», вызвали много интереса. Но стоит ли модель этой шумихи?

Возможно, но с оговорками.

По сравнению с GPT-4o, модели o1 демонстрируют как улучшения, так и недостатки. O1 лучше справляется с рассуждениями и сложными вопросами, но его использование обходится в четыре раза дороже, чем GPT-4o. Более того, последняя модель лишена мультимодальности, инструментов и скорости, которые были отличительными чертами GPT-4o. Даже сама OpenAI признает, что для большинства запросов GPT-4o по-прежнему остается предпочтительным выбором, отмечая, что модели o1 сложнее справляться с более простыми задачами.

«Это прогресс, но не революционный», — утверждает Равид Шварц Зив, профессор Нью-Йоркского университета, который занимается изучением ИИ. «Есть улучшения в некоторых аспектах, но не во всех».

Поскольку o1 предназначен для решения сложных вопросов, его использование для повседневных задач нецелесообразно. Однако для более глубоких и значимых запросов модель может стать ценным помощником.

Размышление над большими вопросами OpenAI o1 отличается тем, что разбивает сложные проблемы на отдельные шаги и оценивает правильность каждого из них. Хотя многозадачное рассуждение не является новой идеей, только теперь эта технология стала доступной для массового использования.

«Сообщество ИИ взволновано», — сказал Киан Катанфоруш, генеральный директор Workera и преподаватель Стэнфорда. «Если вы сможете объединить методы обучения с подкреплением с языковыми моделями OpenAI, то можно будет создавать ИИ, который будет рассуждать поэтапно и решать большие вопросы».

Но цена использования OpenAI o1 достаточно высока. В отличие от других моделей, которые взимают плату за входные и выходные токены, o1 добавляет дополнительные «токены рассуждения», которые увеличивают вычислительные ресурсы, но остаются скрытыми от пользователя. Таким образом, несмотря на мощь o1 в решении сложных задач, его использование может стать затратным для простых запросов.

Практическое использование В реальных примерах OpenAI o1 показывает свою полезность. Например, я попросил модель помочь спланировать семейный ужин на День благодарения. Через 12 секунд «размышлений» я получил подробный план на 750 слов, который объяснял, что двух духовок хватит для приготовления еды на 11 человек при грамотном планировании. Однако модель также предложила рассмотреть аренду переносной духовки, что выглядело несколько излишним.

Однако для менее сложных запросов o1 может показаться перегруженным. Например, на вопрос о местах, где растут кедры, o1 выдала ответ в 800 слов с излишними деталями, в то время как GPT-4o справилась с этим лаконичнее.

Оправданны ли ожидания? Разработчики OpenAI не смогли полностью оправдать разогретые ожидания от модели o1. Генеральный директор Сэм Альтман признал, что o1 — это не AGI (искусственный общий интеллект), и заявил, что о1 все еще несовершенна и остается впечатляющей только при первом использовании.

Тем не менее, для специалистов в области ИИ o1 представляет собой важный шаг вперед, особенно в решении сложных проблем, где GPT-4 не справляется.
Первые впечатления от OpenAI o1: Модели ИИ, которые останавливаются, чтобы обдумать ответ

Первые впечатления от OpenAI o1: Как многошаговое рассуждение меняет игру

ОСТАВЛЯЙТЕ ЗАЯВКУ БЕСПЛАТНО

Проверьте свои способности