Моделі OpenAI o1 проти моделей GPT-4o: що нового і чим вони відрізняються?

Основні висновки

Моделі o1 — це вдосконалені системи штучного інтелекту, призначені для вирішення складних задач з логічного мислення. Вони використовують послідовний процес “ланцюг думок” для аналізу складних проблем.
Моделі o1 чудово показують себе у складних логічних задачах та тестах, таких як передові академічні та наукові питання, тоді як GPT-4o залишається сильною стороною для загальних мовних задач і швидких відповідей.
Моделі o1 надаються у версіях “попередній доступ” та “міні”, з певними обмеженнями доступу та цінами. GPT-4o залишається доступною ширшій аудиторії та більш бюджетною.
Моделі логічного мислення, такі як o1, рухаються до кращого розуміння контексту і вирішення складних проблем, обіцяючи більш витончені взаємодії та можливості прийняття рішень у майбутньому.

Штучний інтелект швидко еволюціонує, і OpenAI прокладає шлях із своїми інноваційними великими мовними моделями (LLM). Ви, мабуть, чули про GPT-4, але тепер з’явилося щось нове: давно очікуваний реліз моделі OpenAI o1 під назвою Strawberry. Тож у чому різниця і чому всі про це говорять?

GPT-4 відома своїми потужними можливостями у створенні тексту, відповідях на запитання та веденні розмов. Вона прекрасно справляється з мовними задачами, але нові моделі o1 додають щось більше: кращу логіку і обробку контексту.

З часом глибші аналітичні можливості цих моделей дозволять їм надавати більш розумні й точні відповіді.

Ці моделі знаходяться на початковій стадії розвитку, саме тому реліз моделей o1 від OpenAI називається «попереднім доступом». Важливо пам’ятати, що це лише початок — OpenAI може здивувати нас у майбутньому.

Давайте детальніше розглянемо моделі OpenAI o1, як працюють OpenAI o1-preview і OpenAI o1-mini, як до них отримати доступ, а також у чому їх відмінності від GPT-4.

Що таке моделі OpenAI o1? Пояснення o1-preview і o1-mini

Моделі OpenAI o1 створені для вирішення складних завдань із логічного мислення. Ці вдосконалені системи штучного інтелекту, випущені 12 вересня, «аналітично мислять» перед відповіддю, генеруючи детальний внутрішній процес замість простої миттєвої відповіді.

«Ланцюг думок» працює всередині моделі, що робить її ефективною у таких темах, як математика, програмування та наука. За словами OpenAI, ці моделі можуть демонструвати високий рівень в конкурентному програмуванні, досягати високих результатів у математичних змаганнях і навіть перевершувати експертів із науковими ступенями з деяких наукових питань.

Наразі доступні дві версії:

o1-preview: Наразі доступна у форматі попереднього доступу. Призначена для вирішення складних задач, що потребують широких знань.
o1-mini: Швидша та більш доступна версія, яка ідеально підходить для програмування, математики та наукових задач, не потребуючи загальних знань.

Можливо, вам здається, що моделі o1 роблять моделі GPT-4 застарілими. Але це не так. GPT-4 все ще краще працює для задач, що потребують швидкої відповіді або роботи з візуальними зображеннями. Але якщо ваш проект вимагає глибокої аналітики, o1 може бути кращим вибором!

Чи знали ви? Моделі o1-preview та o1-mini не мають кількох розширених функцій, таких як пам’ять, налаштовувані інструкції і веб-перегляд. Для цих функцій вам знадобиться GPT-4.

Що нового і чим відрізняються моделі OpenAI o1?

Вивчення моделей штучного інтелекту — це захоплююче! Давайте розберемося з деякими унікальними особливостями моделей OpenAI o1:

Розширена логіка «ланцюг думок»: Моделі o1 використовують послідовний процес логіки, розбиваючи проблему на етапи до надання відповіді на запит.
Поліпшена академічна продуктивність: Моделі o1 демонструють високі досягнення, посідаючи 89-й відсоток у Codeforces та входячи у топ-500 у відбіркових змаганнях USA Mathematical Olympiad.
Покращена безпека: Ці моделі забезпечують безпечніше використання в чутливих сферах, показуючи гарні результати в тестуванні на заборонений контент і протидію джейлбрейкам. Особливо, o1-preview має високий рейтинг безпеки завдяки вдосконаленій логіці і дотриманню етичних правил.
Зниження рівня «галюцинацій»: У сфері ШІ створення помилкової або необґрунтованої інформації називається «галюцинацією». Використовуючи складну логіку і методичний процес думок, моделі OpenAI o1 зменшують ці помилки і прагнуть досягти більш точної інформації.
Ретельне тестування red teaming для підвищення безпеки: Моделі o1 від OpenAI пройшли широке тестування red teaming та оцінювання перед впровадженням для забезпечення високих стандартів безпеки та етики. Red teaming у великих мовних моделях передбачає тестування, моделюючи атаки або складні запити для виявлення вразливостей та гарантування безпеки.

Чи знали ви? Джейлбрейк моделей ШІ передбачає обходження їх функцій безпеки для створення небезпечного контенту. Цей новий ризик безпеки вирішується вдосконаленими моделями, такими як OpenAI o1, які демонструють підвищену стійкість до таких атак.

Як отримати доступ до моделей OpenAI o1

Ось як ви можете отримати доступ до моделей OpenAI o1:

Доступ для користувачів ChatGPT

Якщо ви користуєтеся ChatGPT Plus або працюєте в командному обліковому записі чи робочому просторі, ви можете спробувати моделі o1 у ChatGPT. Доступні як o1-preview, так і o1-mini. Ви можете вручну обрати потрібну модель у програмі.

Станом на 13 вересня існують деякі обмеження щодо кількості повідомлень, які ви можете надіслати за допомогою цих моделей:

o1-preview: 30 повідомлень на тиждень.
o1-mini: 50 повідомлень на тиждень.

Якщо ви користувач Free-версії ChatGPT, не хвилюйтеся — OpenAI також планує надати доступ до o1-mini для всіх користувачів Free-версії. Слідкуйте за майбутніми оновленнями.

До того ж, у майбутньому ChatGPT зможе автоматично вибирати ідеальну модель для вашого запиту, позбавляючи вас необхідності робити це вручну.

Доступ для користувачів ChatGPT Enterprise та Edu

Якщо ви користуєтеся ChatGPT через обліковий запис Enterprise або Education, з 16 вересня ви отримуєте доступ до моделей o1-preview та o1-mini.

Доступ через API для розробників

Розробники з рівнем API Tier 5 можуть негайно створювати та тестувати додатки, використовуючи моделі o1. Поки що моделі обмежені 20 запитами за хвилину (RPM), але OpenAI планує підвищити цю межу після подальшого тестування.

Проте API для цих моделей o1 поки що позбавлений деяких функцій, до яких ви могли звикнути, таких як виклики функцій, стримінгові відповіді чи підтримка системних повідомлень. Як розробник, ви можете почати з вивчення документації API.

Чи знали ви? Моделі o1-preview і o1-mini мають таку ж дату відсічення знань, як і GPT-4o, станом на жовтень 2023 року.

o1 проти GPT-4o: що краще?

І o1, і GPT-4o є потужними мовними моделями з унікальними сильними та слабкими сторонами.

Обидві моделі базуються на нейронних мережах архітектури Transformer, яка зробила революцію в обробці природної мови. Вони однаково здатні генерувати текст, перекладати між різними мовами, створювати креативний контент і надавати обґрунтовані відповіді на запити. Завдяки великому обсягу навчання на текстових даних, обидві моделі можуть розпізнавати мовні шаблони та відносини.

Однак моделі o1 стабільно перевершують GPT-4o за всіма складними логічними тестами та питаннями, включаючи тести машинного навчання (ML), різні екзамени, наукові питання рівня PhD та категорії багатозадачного мовного розуміння (MMLU).

З іншого боку, використання моделей o1 через API є дороговартісним для розробників. Модель o1-preview коштує $15 за мільйон вхідних токенів (текст, який ви надсилаєте) і $60 за мільйон вихідних токенів (текст, який генерує модель). Для порівняння, GPT-4 набагато дешевше: $5 за мільйон вхідних токенів і $15 за мільйон вихідних токенів. Хоча результативність відповідей може відрізнятися через глибину аналітики o1.

Отже, вибір між моделями o1 та GPT-4o залежить від ваших очікувань стосовно продуктивності та доступності. Також пам’ятайте, що моделі o1 все ще нові та еволюціонують, тоді як GPT-4o залишається дуже потужною LLM.