OpenAI випустила нове сімейство моделей GPT-о1

Автор: Едуард Голодницький, Президент International Advisers Association, co-founder Firm24

OpenAI оголосила про випуск чергової базової моделі під кодовою назвою Strawberry, яка офіційно називається o1. Це сімейство моделей: o1-preview і o1-mini, менша, більш ефективна модель, призначена для генерації коду.

На сайті компанії вказують, що модель o1 перевершує рівень PhD у вирішенні задач з фізики, хімії, біології. Що відрізняє o1 від інших моделей генеративного ШІ, так це його здатність “перевіряти себе”, витрачаючи додатковий час на розгляд різних аспектів запиту перед тим, як відповісти. Ця здатність дозволяє моделі “думати” більш ефективно, що робить її придатною для складних завдань, які вимагають вищого рівня синтезу, таких як аналіз електронних листів на предмет привілейованої інформації або мозковий штурм маркетингових стратегій. За даними блогу OpenAI, o1 використовує навчання з підкріпленням, заохочуючи модель “думати”, перш ніж відповісти, імітуючи ланцюжок думок. Це підкріплюється системою заохочень і покарань, що допомагає моделі планувати наперед і виконувати кілька дій для отримання відповіді. Таким чином, в теорії, чим довше OpenAI o1 обробляє запит, тим кращою буде відповідь.

Новий алгоритм оптимізації OpenAI та спеціально підібраний навчальний набір даних, який включає наукову літературу та дані міркувань, ще більше розширюють можливості o1. В екзамені на відбір на Міжнародну Математичну Олімпіаду GPT-4о правильно розв'язує 13% задач, а GPT-о1 - нова модель - розв'язує 83% задач. В змагальних задачах з програмування GPT-4о вирішує правильно 11% задач, GPT о1 89% задач.

Хоча зауважують, що GPT о1 поки є досить недопрацьованим. На відміну від GPT-4o, попередника o1 поки що не може переглядати веб-сторінки або аналізувати файли. Модель має функції аналізу зображень, але вони відключені до додаткового тестування. Крім того, o1 обмежений у кількості повідомлень; наразі тижневий ліміт становить 30 повідомлень для o1-preview і 50 для o1-mini.

Ще одним недоліком є те, що o1 коштує дорожче. В API o1-preview коштує $15 за 1 мільйон вхідних токенів і $60 за 1 мільйон вихідних токенів. Це в 3 рази дорожче в порівнянні з GPT-4o для введення і в 4 рази дорожче для виведення. (Токени - це біти необроблених даних; 1 мільйон токенів еквівалентний приблизно 750 000 слів). OpenAI заявляє, що планує надати o1-mini доступ для всіх безкоштовних користувачів ChatGPT, але не встановила дату релізу. Щоб побачити o1 в ChatGPT - потрібна підписка на ChatGPT Plus або Team. Корпоративні та освітні користувачі отримають доступ на початку наступного тижня.

Хоча GPT-о1 перевершує можливості GPT-4o в сферах аналізу даних, наука та кодування - вона повільніша за інші моделі, відповідаючи на певні запити понад 10 секунд. Перші тестувальники повідомляли, що o1 може “галюцинувати” частіше, ніж GPT-4o, і менш схильна визнавати, що не знає відповіді.

OpenAI - далеко не єдиний постачальник ШІ, який досліджує покращення фактографічності моделей. Дослідники Google DeepMind нещодавно опублікували дослідження, яке показало, що, по суті, надаючи моделям більше обчислювального часу та інструкцій для виконання запитів у міру їх надходження, продуктивність цих моделей можна значно покращити без будь-яких додаткових налаштувань. OpenAI заявила, що вирішила не показувати необроблені «ланцюжки думок» o1 в ChatGPT частково через «конкурентну перевагу». (Замість цього компанія вирішила показати «згенеровані моделлю резюме» ланцюжків). Справжнім випробуванням для компанії буде зробити o1 широкодоступним - і дешевшим. Звідти ми побачимо, як швидко OpenAI зможе випускати оновлені версії o1. Компанія заявляє, що має намір експериментувати з моделями o1, які міркують годинами, днями або навіть тижнями, щоб ще більше підвищити їхню здатність до міркувань.

TechCrunch

Штучний інтелект (AI)