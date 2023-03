14 березня компанія OpenAI офіційно представила свою нову модель штучного інтелекту (ШІ) GPT-4.

За кілька днів до презентації в соціальних мережах активно обговорювався можливий потенціал нового ШІ. GPT-4 пророкували статус технології, як назавжди змінить правила гри для всього суспільства.

Очікувалось, що GPT-4 буде в 500 разів потужніший за свого попередника та зможе працювати з візуальним контентом, не просто його аналізуючи, але й створюючи нові фото та відео.

Проте реліз вже п’ятого покоління в сімействі GPT не виправдав в повній мірі очікування користувачів.

Популярний ChatGPT базувався на GPT-3.5, який має 175 млрд параметрів. GPT-4 вивчав значно більші обсяги даних. Однак керівництво OpenAI відмовилося розкрити, скільки саме даних отримала мова моделі та назвати число її параметрів.

Головна відмінність – GPT-4 є мультимодальним і може сприймати зображення як вхідні дані. Тобто, відтепер чат-бот не просто читає текст але й аналізує зображення. Це нововведення стало одним з найголовніших в презентації GPT-4.

Що може новий GPT-4

У своїй презентації OpenAI скромно заявляє про досягнення своєї нової моделі, акцентуючи увагу на стабільності, безпеці та прогнозованості. Перш за все в компанії відзначають, що виправили помилки, які були виявленні під час використання GPT-3.5.

Загалом розробники виділяють три напрямки прогресу нової моделі від OpenAI. Перше – це творчі здібності. GPT-4 став більш креативним і придатним для співпраці, ніж його попередник GPT-3,5.Він може генерувати, редагувати та виконувати з користувачами творчі та технічні письмові завдання, такі як створення пісень, написання сценаріїв або вивчення стилю письма користувача.

Друге – це візуальний вхід.

Новий GPT-4 здатний приймати зображення як вхідні дані. Зокрема, нова мовна модель здатна генерувати свої відповіді на основі вхідних даних, що складаються з тексту і зображень.

Тобто, ви можете завантажити йому документ з текстом і фотографіями, діаграмами або скріншотами і GPT-4 зможе їх проаналізувати та дати відповіді на даних, що складаються не лише з тексту.

Ще одним цікавим варіантом роботи ШІ з фото є те, що ви можете просто поділитися з ним фото продуктів, які є у вас дома, і GPT-4 запропонує вам варіанти, що можна з них приготувати.

With its multimodal capabilities, GPT-4 can take images as input and generate captions, classifications, and analyses. pic.twitter.com/B62zTKDpXS — elvis (@omarsar0) March 14, 2023

Однак в компанії додають, що вхідні дані у вигляді зображень поки що є дослідницькою версією і не є загальнодоступними.

Третє – це можливість працювати з великими текстами. GPT-4 здатний обробляти понад 25 тисяч слів тексту, що дозволяє використовувати його для створення довгих текстів, розгорнутих розмов, а також для пошуку та аналізу документів.

Чат-бот здатний набагато краще резюмувати великі тексти, і навіть коли ви зміните резюме, додавши випадкове речення, ШІ вкаже на неточність.

Також GPT-4 покращив свої аргументаційні здібності і розуміння контексту. Він тепер здатен створювати більш оптимізовані відповіді, які нагадують розмову з реальною людиною.

GPT-4 – успішний студент

GPT-4 у звичайній розмові може не сильно відрізнятись від свого попередника GPT-3.5. Однак в компанії запевняють, що при більш поглибленій взаємодії з чат-ботом GPT-4 є більш надійним, креативним і здатним обробляти набагато більше нюансів, ніж GPT-3.5.

Для демонстрації різниці між двома моделями, OpenAI протестували їх на різних тестах, включаючи імітацію іспитів, які спочатку були розроблені для людей.

Іспити, які використали в компанії, складались з тестів та розгорнутих питань з різних напрямків науки – від гуманітарних до технічних дисциплін.

Складаючи іспити, GPT-4 продемонстрував значно кращі результати за GPT-3.5. Загалом, його результати на більшості професійних та академічних іспитах відповідають рівню успішних студентів.

Наприклад, ШІ склав симульовану версію єдиного адвокатського іспиту з результатом, що входить до 10% найкращих учасників тестування. Також він практично ідеальною складає стандартизований тест, який перевіряє навички аналітичного письма, кількісного та вербального міркування для вступу до магістратури та докторантури різних університетів.

Крім цього, GPT-4 оцінили за традиційними тестами, розробленими для моделей машинного навчання. Вказані результати значно перевищують існуючі великі мовні моделі ШІ.

Більше того, в OpenAI вирішити перекласти один з таких тестів MMLU — набір із 14 тисяч задач із множинним вибором, що охоплює 57 тем — різними мовами за допомогою Azure Translate. Відтак, у 24 із 26 протестованих мов GPT-4 перевершує англійську продуктивність GPT-3.5 та інших LLM (Chinchilla, PaLM), зокрема серед таких рідковживаних мов як латиська, валлійська та суахілі.

Все ще має обмеження

В OpenAI відзначають, що попри свої можливості, GPT-4 має ті ж обмеження, що й попередні моделі GPT, оскільки він все ще не є абсолютно надійним. У компанії це називають "галюцинцинаціями" фактів і відповідно помилкових міркувань.

Розробники запевняють, що хоч "галюцинації" все ще залишаються реальною проблемою, GPT-4 значно зменшує їх кількість порівняно з попередніми моделями. Так нова модель ШІ отримала на 40% більше балів, ніж GPT-3.5, за внутрішніми оцінками компанії.

GPT-4, як і попередня модель, не має знань про події після вересня 2021 року. Також в компанії додають, що ШІ не вчиться на власному досвіді.

Безпека

Окрему увагу творці GPT-4 приділяли питанням безпеки.

"Ми витратили 6 місяців, щоб зробити GPT-4 безпечнішим і більш узгодженим. За нашими внутрішніми оцінками, GPT-4 на 82% рідше реагує на запити щодо забороненого контенту і на 40% частіше надає фактичні відповіді, ніж GPT-3.5", – запевняють в компанії.

Саме під час навчання нейромережі розробники додавали додаткові сигнали, щоб знизити ймовірність давати небезпечні поради. GPT-4 тепер має краще пропрацьовані межі безпеки, що має унеможливити шкідливе використання чат-боту.

GPT-4 з’явиться не тільки в ChatGPT Plus

Скористатись GPT-4 через чат-бот, як це були з його попередником, зможуть не всі. Мовна модель поки буде доступна тільки на платній версії чат-боту ChatGPT Plus за 20 доларів на місяць і як API для розробників для створення програм і служб.

На презентації GPT-4 розробники заявили, що нова модель ШІ вже інтегрована в низку про проєктів поза межами компанії.

Так, Microsoft підтвердила, що її інтернет пошуковик Bing вже працює на GPT-4.

Крім цього, OpenAI вирішила розширити свою технологію на інші продукти, зокрема застосунок для вивчення мов Duolingo. У ньому GPT-4 виконуватиме дві функції: співрозмовника та роз’яснювача правил, коли користувач робить помилку у відповіді.

Данський стартап Be My Eyes, який створює технологію для допомоги людям з проблемами зору, також використовуватиме GPT-4. Be My Eyes розпочав розробку Virtual Voluntee на базі GPT-4 у додатку, який може генерувати той самий рівень контексту та розуміння, що й людина-волонтер.

Банківський холдинг Morgan Stanley, який займається управлінням капіталу, використовуватиме нову модель від OpenAI для роботи внутрішнього чат-бота.

Некомерційна організація Khan Academy, мета якої забезпечити безкоштовну освіту по всьому світу заявила, що використовуватиме GPT-4 для роботи Khanmigo. Це помічник на основі ШІ, який функціонує як віртуальний репетитор для студентів та асистент у класі для вчителів.

Також уряд Ісландії використовуватиме GPT-4 для збереження своєї мови.

Американська технологічна компанія Stripe, що розробляє рішення для прийому і обробки електронних платежів, скористається можливостями GPT-4 для оптимізації взаємодії з користувачем і боротьби з шахрайством.