DeepMind представила нову модель штучного інтелекту Gemini 2.0
Дослідницька лабораторія штучного інтелекту Google DeepMind оголосила, що їхня нова модель штучного інтелекту Gemini 2.0 стане основою для створення більш просунутих AI-агентів.
AI-агент, який працює на базі Gemini 2.0 та був представлений 11 грудня, здатний розуміти складні інструкції, планувати, міркувати, діяти на різних веб-сайтах та навіть допомагати з стратегічними питаннями у відеоіграх, заявили генеральний директор Google DeepMind Деміс Хасабіс і головний технологічний директор Корей Кавукчуоглу в блозі від 11 грудня.
“Практичне застосування AI-агентів є дослідницькою сферою, наповненою захоплюючими можливостями”, – зазначили Хасабіс та Кавукчуоглу.
“Ми досліджуємо цей новий фронт за допомогою серії прототипів, які можуть допомогти людям виконувати завдання та досягати цілей.”
За словами Хасабіса і Кавукчуоглу, існує декілька експериментальних проектів AI-асистентів на базі Gemini з різними функціями.
Один з них, відомий як Deep Research, може допомогти користувачам досліджувати складні теми, створюючи багатоступеневі дослідницькі плани; він проводить пошук в Інтернеті, а потім генерує об’ємні звіти про свої знахідки.
Проект Astra – це універсальний AI-асистент, призначений для щоденних завдань, таких як надання рекомендацій та порад на основі запитів користувача, наприклад, як прати одяг або більше інформації про конкретний об’єкт.
Проект Mariner зосереджений на створенні AI-агента, який може контролювати ваш браузер Chrome, переміщати курсор, натискати кнопки, заповнювати форми та навігувати по веб-сайтах.
За словами Хасабіса і Кавукчуоглу, ці проекти “ще перебувають на ранніх стадіях розвитку”, але вони сподіваються зробити їх “широко доступними в продуктах у майбутньому” після тестування і подальшого розвитку.
“Ми ще на початку, але проект Mariner показує, що стає технічно можливим навігувати в браузері, хоча це не завжди точно і повільно виконується, проте з часом це швидко покращиться.”
Тим часом, проект Jules розробляється як асистент для розробників, котрий може інтегруватися безпосередньо в робочий процес GitHub і допомагати з такими завданнями, як кодування та планування.
Хасабіс та Кавукчуоглу також зазначили, що вони створили агенти за допомогою Gemini 2.0 для відеоігор, які можуть пропонувати поради гравцеві щодо того, що робити далі, у режимі реального часу та шукати “безліч знань про ігри” в Інтернеті.
“Ми співпрацюємо з провідними розробниками ігор, такими як Supercell, щоб дослідити, як працюють ці агенти, тестуючи їх здатність інтерпретувати правила та виклики в різноманітних іграх, від стратегій до симуляторів сільського господарства”, – зазначили вони.
У листопаді Марк Беніофф, CEO американської компанії Salesforce, що спеціалізується на програмному забезпеченні для хмарних технологій, заявив, що майбутнє штучного інтелекту полягає в автономних агентів, а не у великих мовних моделях (LLMs).
“Я насправді думаю, що ми досягли верхньої межі LLM наразі”, – сказав він у подкасті Future of Everything в газеті The Wall Street Journal 23 листопада.
Компанія Nvidia також займає позицію в цьому тренді.
“Ми спостерігаємо, як число компаній, заснованих на AI, продовжує зростати. І, звісно, ми починаємо бачити, що прийняття агентного штучного інтелекту на підприємствах дійсно є останнім модним напрямком”, – сказав CEO Nvidia Дженсен Хуанг під час корпоративної телефонної конференції з приводу результатів за третій квартал у листопаді.
На додачу, Хасабіс та Кавукчуоглу зазначили, що команда “експериментує з агентами, які можуть допомагати у фізичному світі” через робототехніку.
На даний момент AI-агенти Google доступні лише тестувальникам і розробникам.