OpenAI представила свої нові моделі o1 у четвер, даючи користувачам ChatGPT можливість оцінити роботу ШІ, який робить паузи для роздумів перед відповіддю. Ці моделі, відомі під кодовою назвою «Strawberry», викликали багато інтересу. Але чи варта модель цього галасу?
Можливо, але із застереженнями.
Порівняно з GPT-4o, моделі o1 демонструють як поліпшення, так і недоліки. O1 краще справляється з міркуваннями і складними питаннями, але його використання обходиться в чотири рази дорожче, ніж GPT-4o. Ба більше, остання модель позбавлена мультимодальності, інструментів і швидкості, які були відмінними рисами GPT-4o. Навіть сама OpenAI визнає, що для більшості запитів GPT-4o, як і раніше, залишається кращим вибором, зазначаючи, що моделі o1 складніше впоратися з більш простими завданнями.
«Це прогрес, але не революційний», - стверджує Равід Шварц Зів, професор Нью-Йоркського університету, який займається вивченням ШІ. «Є поліпшення в деяких аспектах, але не у всіх».
Оскільки o1 призначений для вирішення складних питань, його використання для повсякденних завдань недоцільне. Однак для більш глибоких і значущих запитів модель може стати цінним помічником.
Міркування над великими питаннями OpenAI o1 вирізняється тим, що розбиває складні проблеми на окремі кроки й оцінює правильність кожного з них. Хоча багатозадачне міркування не є новою ідеєю, тільки тепер ця технологія стала доступною для масового використання.
«Спільнота ШІ схвильована», - сказав Кіан Катанфоруш, генеральний директор Workera і викладач Стенфорда. «Якщо ви зможете об'єднати методи навчання з підкріпленням з мовними моделями OpenAI, то можна буде створювати ШІ, який буде міркувати поетапно і вирішувати великі питання».
Але ціна використання OpenAI o1 досить висока. На відміну від інших моделей, які стягують плату за вхідні та вихідні токени, o1 додає додаткові «токени міркування», які збільшують обчислювальні ресурси, але залишаються прихованими від користувача. Таким чином, незважаючи на міць o1 у розв'язанні складних завдань, його використання може стати витратним для простих запитів.
Практичне використання У реальних прикладах OpenAI o1 показує свою корисність. Наприклад, я попросив модель допомогти спланувати сімейну вечерю на День подяки. Через 12 секунд «роздумів» я отримав детальний план на 750 слів, який пояснював, що двох духовок вистачить для приготування їжі на 11 осіб за умови грамотного планування. Однак модель також запропонувала розглянути оренду переносної духовки, що виглядало дещо зайвим.
Однак для менш складних запитів o1 може здатися перевантаженим. Наприклад, на запитання про місця, де ростуть кедри, o1 видала відповідь у 800 слів із зайвими деталями, тоді як GPT-4o впоралася з цим лаконічніше.
Чи виправдані очікування? Розробники OpenAI не змогли повністю виправдати розігріті очікування від моделі o1. Генеральний директор Сем Альтман визнав, що o1 - це не AGI (штучний загальний інтелект), і заявив, що o1 все ще недосконала і залишається вражаючою тільки під час першого використання.
Проте, для фахівців у галузі ШІ o1 є важливим кроком уперед, особливо у вирішенні складних проблем, де GPT-4 не справляється.