ИИ-модель Gemini от Google превзошла ChatGPT в большинстве тестов

3.67k

ИИ-модель Gemini от Google превзошла ChatGPT в большинстве тестов

07.12.2023

Google представила новую модель искусственного интеллекта под названием Gemini, которая, по утверждению компании, превосходит ChatGPT от OpenAI в большинстве тестов. Gemini выходит в трех версиях — Nano, Pro и Ultra — и является мультимодальной, что означает, что она может одновременно воспринимать текст, аудио, изображения, видео и компьютерный код.

Модель в ближайшее время будет интегрирована в продукты Google, включая поисковую систему. Две уменьшенные версии Gemini, Pro и Nano, уже выпущены. Gemini Pro появится более чем в 170 странах в виде обновления чат-бота Google Bard (в России Google Bard не поддерживается, а в Европе обновление пока не вышло, так как требуется разрешение от регулирующих органов). А версия Gemini Nano будет доступна на мобильных телефонах с использованием системы Android от Google. Самая мощная версия, Ultra, проходит внешнее тестирование и не будет выпущена публично до начала 2024 года — ее интегрируют в версию Bard под названием Bard Advanced.

Модель Gemini была анонсирована в прошлом месяце после глобального саммита по безопасному использованию ИИ, на котором технологические компании согласились сотрудничать с правительствами в тестировании передовых систем до и после их выпуска. Самая мощная версия Gemini — Ultra — пройдет внешнее тестирование на безопасность, и Google поделится результатами с правительством США в соответствии с указом, изданным Джо Байденом в октябре. Также компания ведет переговоры с недавно созданным в Великобритании Институтом безопасности ИИ по поводу проверки Ultra.

По заявлениям Google, Ultra превзошла современные модели искусственного интеллекта, включая самую мощную модель ChatGPT, GPT-4, в 30 из 32 тестов производительности, в том числе в рассуждении и понимании изображений. Модель Pro опередила GPT-3.5, технологию, лежащую в основе бесплатной версии ChatGPT, в шести из восьми тестов.

В Google также отмечают, что Ultra стала первой моделью искусственного интеллекта, которая обошла экспертов-людей с результатом 90% в многозадачном тесте под названием MMLU, охватывающем 57 предметов, включая математику, физику, право, медицину и этику. Ultra теперь будет использоваться в новом инструменте для написания кода под названием AlphaCode2, который, по утверждению компании, может превзойти 85% программистов-людей конкурентоспособного уровня.

Однако представители Google сообщают, что «галлюцинации» или ложные ответы по-прежнему остаются проблемой модели.

«Я бы сказал, что это все еще нерешенная исследовательская проблема», — подчеркнул Эли Коллинз, руководитель отдела продуктов Google DeepMind.

Кроме того, хотя все версии Gemini являются мультимодальными с точки зрения подсказок, которые они могут воспринимать, версии Pro и Nano в настоящее время могут отвечать только в текстовом формате или формате кода.

Компания Google выпустила видеоролики о возможностях Gemini, в которых показано, как модель Ultra понимает рукописные ответы ученика на домашнее задание по физике и дает подробную информацию.

Источники: Google; The Guardian

Изображения: Google

Подписывайтесь на каналы Let AI be в Telegram и «ВКонтакте» — оставайтесь в курсе главных новостей в сфере искусственного интеллекта!