Skip to main content

Компания xAI Илона Маска, занимающаяся искусственным интеллектом (ИИ), собирается представить версию своей языковой модели Grok, которая может обрабатывать визуальные эффекты, о чем компания сообщила на этой неделе.

В пресс-релизе, опубликованном на своем веб-сайте в пятницу, xAI анонсировала Grok 1.5V или Grok 1.5 Vision, свою первую модель искусственного интеллекта, которая обрабатывает видео наряду с обработкой текста. Эта новость означает, что Grok теперь может обрабатывать визуальную информацию, такую ​​как документы, фотографии, диаграммы и многое другое, а также делает модель конкурентоспособной по сравнению с другими мультимодальными платформами.

«Представляем Grok-1,5V, нашу мультимодальную модель первого поколения», — пишет xAI в релизе. «В дополнение к своим мощным текстовым возможностям Grok теперь может обрабатывать широкий спектр визуальной информации, включая документы, диаграммы, диаграммы, снимки экрана и фотографии. Grok-1.5V скоро будет доступен нашим первым тестерам и существующим пользователям Grok».

Хотя он еще не выпущен публично, xAI сообщает, что Grok 1,5V скоро станет доступен первым тестерам и существующим пользователям Grok.

Сообщение также содержит подробную информацию о сравнительном тестировании Grok 1.5V с мультимодальными конкурентами, такими как ChatGPT-4V от OpenAI, Claude 3 Sonnet и Claude 3 Opus от Anthropic, а также Gemini Pro 1.5, принадлежащий Google. Кроме того, в релизе представлены семь различных примеров того, как Grok 1.5V может использовать визуальную информацию, включая использование реальных изображений или перевод диаграмм в код.

Ниже вы можете увидеть диаграмму тестирования Grok 1,5 В, а также два примера визуальной обработки.

Мультимодальная модель появилась после того, как Маск ранее в этом году заявил, что xAI готовится к запуску Grok 1.5. В интервью, состоявшемся ранее на этой неделе, Маск также сказал, что, по его мнению, к концу 2025 года у нас будет ИИ, который будет умнее любого человека, а вычислительная мощность ИИ превзойдет человека всего за пять лет.

В прошлом месяце xAI официально открыла исходный код базовой модели Грока и сетевой архитектуры после многочисленных критических замечаний Маска и даже судебного иска к бывшей некоммерческой организации OpenAI за отказ от своей некоммерческой миссии и отказ от создания собственных моделей GPT с открытым исходным кодом.

После январских сообщений о том, что xAI привлекала капитал, Маск опроверг эти обвинения, добавив, что в настоящее время компания не планирует привлекать финансирование. Маск дебютировал с xAI в июле прошлого года, а в ноябре компания выпустила Grok в качестве своего первого продукта.

Что ты думаешь? Дайте мне знать в .

Компания xAI под руководством Илона Маска представила Grok 1,5V с визуальной обработкой

Оставить комментарий