Google выпустила Gemini 3.1 Pro с рекордными результатами тестов

Фабио Де ЛукаИИ и автоматизация3 месяца назад52 Просмотры

Делиться

Главная страница
ИИ и автоматизация
Google выпустила Gemini 3.1 Pro с рекордными результатами тестов

Google продолжает наращивать темп в гонке языковых моделей. В четверг компания представила обновлённую версию своей флагманской модели — Gemini 3.1 Pro, которая уже доступна в режиме предварительного просмотра. Полноценный релиз запланирован на ближайшее время.

Что показывают тесты

По данным независимых бенчмарков, новая модель заметно превосходит предшественницу Gemini 3, которая вышла в ноябре 2025 года и уже тогда считалась одним из наиболее способных инструментов. Среди тестов, где gemini 3.1 pro продемонстрировала значительный прогресс, — Humanity's Last Exam, один из самых сложных экзаменов для языковых моделей.

Отдельного внимания заслуживает оценка от Брендана Фуди, CEO AI-стартапа Mercor. Его система бенчмаркинга APEX измеряет, насколько хорошо модели справляются с реальными профессиональными задачами. По словам Фуди, новая модель заняла первое место в рейтинге APEX-Agents, и её результаты демонстрируют, «как быстро агенты улучшаются в реальной интеллектуальной работе».

Контекст: конкуренция обостряется

Релиз не происходит в вакууме. OpenAI и Anthropic тоже недавно обновили свои модели, и борьба за лидерство в сегменте агентных систем и многоэтапного рассуждения становится всё более жёсткой. Каждый новый релиз поднимает планку — и gemini 3.1 pro на данный момент задаёт новый стандарт по результатам тестов.

Что это значит на практике

Высокие баллы в бенчмарках — штука полезная, но далеко не всегда они напрямую транслируются в бизнес-результат. Вопрос в том, как конкретная модель работает в ваших задачах: генерация контента, анализ данных, автоматизация процессов. Мы в Фабио Де Лука активно используем модели Google Gemini при создании автоматизаций — от автоматического ведения блогов до AI-агентов, которые самостоятельно выполняют многоступенчатые бизнес-процессы. Появление более мощной модели открывает возможности для более точной и сложной работы таких систем.

Стоит ли ждать полного релиза

Пока модель доступна только в preview-режиме, и финальная версия может отличаться по производительности. Если вы планируете внедрять AI-решения в бизнес или обновлять существующие, имеет смысл протестировать gemini 3.1 pro уже сейчас — хотя бы чтобы понять, насколько она подходит под ваши сценарии.

Новая модель Google подтверждает общий тренд: разрыв между поколениями языковых моделей сокращается по времени, но растёт по возможностям. Следить за этой динамикой можно в нашем блоге и Telegram-канале.

Делиться