ИИ-модель Gemini от Google превзошла ChatGPT в большинстве тестов
Google представила новую модель искусственного интеллекта под названием Gemini, которая, по утверждению компании, превосходит ChatGPT от OpenAI в большинстве тестов. Gemini выходит в трех версиях — Nano, Pro и Ultra — и является мультимодальной, что означает, что она может одновременно воспринимать текст, аудио, изображения, видео и компьютерный код.
Модель в ближайшее время будет интегрирована в продукты Google, включая поисковую систему. Две уменьшенные версии Gemini, Pro и Nano, уже выпущены. Gemini Pro появится более чем в 170 странах в виде обновления чат-бота Google Bard (в России Google Bard не поддерживается, а в Европе обновление пока не вышло, так как требуется разрешение от регулирующих органов). А версия Gemini Nano будет доступна на мобильных телефонах с использованием системы Android от Google. Самая мощная версия, Ultra, проходит внешнее тестирование и не будет выпущена публично до начала 2024 года — ее интегрируют в версию Bard под названием Bard Advanced.
Модель Gemini была анонсирована в прошлом месяце после глобального саммита по безопасному использованию ИИ, на котором технологические компании согласились сотрудничать с правительствами в тестировании передовых систем до и после их выпуска. Самая мощная версия Gemini — Ultra — пройдет внешнее тестирование на безопасность, и Google поделится результатами с правительством США в соответствии с указом, изданным Джо Байденом в октябре. Также компания ведет переговоры с недавно созданным в Великобритании Институтом безопасности ИИ по поводу проверки Ultra.
По заявлениям Google, Ultra превзошла современные модели искусственного интеллекта, включая самую мощную модель ChatGPT, GPT-4, в 30 из 32 тестов производительности, в том числе в рассуждении и понимании изображений. Модель Pro опередила GPT-3.5, технологию, лежащую в основе бесплатной версии ChatGPT, в шести из восьми тестов.
В Google также отмечают, что Ultra стала первой моделью искусственного интеллекта, которая обошла экспертов-людей с результатом 90% в многозадачном тесте под названием MMLU, охватывающем 57 предметов, включая математику, физику, право, медицину и этику. Ultra теперь будет использоваться в новом инструменте для написания кода под названием AlphaCode2, который, по утверждению компании, может превзойти 85% программистов-людей конкурентоспособного уровня.
Однако представители Google сообщают, что «галлюцинации» или ложные ответы по-прежнему остаются проблемой модели.
«Я бы сказал, что это все еще нерешенная исследовательская проблема», — подчеркнул Эли Коллинз, руководитель отдела продуктов Google DeepMind.
Кроме того, хотя все версии Gemini являются мультимодальными с точки зрения подсказок, которые они могут воспринимать, версии Pro и Nano в настоящее время могут отвечать только в текстовом формате или формате кода.
Компания Google выпустила видеоролики о возможностях Gemini, в которых показано, как модель Ultra понимает рукописные ответы ученика на домашнее задание по физике и дает подробную информацию.
Источники: Google; The Guardian
Изображения: Google
Подписывайтесь на каналы Let AI be в Telegram и «ВКонтакте» — оставайтесь в курсе главных новостей в сфере искусственного интеллекта!