Let AI be

Яркий онлайн-журнал про искусственный интеллект (Artificial Intelligence, AI)

 

Свяжитесь с нами

Пресс-релизы, предложения об инфопартнерстве и сотрудничестве,
в том числе запросы на рекламу, присылайте на почту редакции:

Ждем вас в соцсетях

«Всё в одном»: модель GPT-4о работает с текстом, голосом и изображением

«Всё в одном»: GPT-4о работает с текстом, голосом и изображением

OpenAI представила новую модель популярной нейросети — GPT-4 Omni, или просто GPT-4о. Omni на латыни означает «всё в одном»: модель одновременно работает с текстом, голосом и изображением.

К другим особенностям GPT-4о относятся:

✓ интеллект уровня GPT-4,

✓ улучшенные языковые возможности: модель поддерживает более 50 языков,

✓ ответы не только из базы знаний модели, но и из интернета,

✓ среднее время реакции на голосовые запросы 0,3 секунды, как у человека,

✓ определение эмоций пользователя и изменение интонаций при общении,

✓ хорошая память: модель запоминает беседы с пользователем;

✓ скорость работы через API в два раза быстрее, чем у GPT-4 Turbo, и стоимость на 50% меньше,

✓ возможность синтеза 3D-объектов,

✓ анализ данных и создание диаграмм,

✓ загрузка файлов для подготовки краткого изложения (саммари), помощи в написании или анализе текста,

✓ обсуждение изображений.

Возможные сценарии использования модели GPT-4о

◉ Cфотографировать меню на другом языке и попросить нейросеть перевести его, узнать об истории и значении блюда, а также получить рекомендации для его приготовления.

◉ Пообщаться с ChatGPT через видео: например, показать нейросети спортивную игру в прямом эфире и попросить ее объяснить вам правила (голосовой режим с новыми возможностями будет запущен в ближайшие недели).

◉ Изучать языки: можно демонстрировать модели различные объекты и спрашивать, как они называются на разных языках.

◉ Оценить образ: сотрудник OpenAI спросил у чат-бота, хорошо ли он выглядит для собеседования. Нейросеть рекомендовала ему причесаться, а когда он надел шляпу – посмеялась, отметив, что у него теперь несерьезный вид.

Модель GPT-4o также может сочинить и исполнить песню, провести игру, помочь в обучении, перевести разговор в режиме реального времени и так далее.

Кто сможет воспользоваться моделью GPT-4o

Компания уже начала открывать доступ к новой модели пользователям ChatGPT Plus и Team, а скоро его получат и корпоративные клиенты по подписке Enterprise (лимиты на число запросов обещают сделать довольно высокими).

В бесплатной версии ChatGPT Free тоже можно будет попробовать новые возможности GPT-4o, но меньшее количество раз (например, в пять раз меньше, чем в ChatGPT Plus). При достижении лимита ChatGPT автоматически переключится на версию GPT-3.5.

Кроме того, OpenAI запускает новое приложение ChatGPT для macOS (для пользователей Plus). На макбуке вызвать чат-бота можно с помощью простого сочетания клавиш (Option + Пробел). В будущем в приложении появятся новые аудио- и видеовозможности GPT-4o. Выпустить версию приложения для Windows компания планирует позднее в этом году.

Текст: Наталья Травова

Источник: OpenAI

Изображение: Freepik

Подписывайтесь на каналы Let AI be в Telegram и «ВКонтакте» — оставайтесь в курсе главных новостей в сфере искусственного интеллекта!

 

You don't have permission to register