В Decrypt протестировали Grok 4 и обнаружили политическую предвзятость чат-бота
- Тестирование чат-бота Grok 4 изданием Decrypt разоблачило его политическую предвзятость.
- Журналисты отметили, что Grok 4 поразил логикой, но провалился в креативности и кодировании.
- В то же время они посоветовали найти альтернативу базовому тарифу ИИ-решения стоимостью $30 в месяц.
Журналисты Decrypt протестировали Grok 4 Basic — упрощенную версию флагманского Grok 4 Heavy (по стоимости в $300/мес), чтобы выяснить оправдана ли цена в $30 в месяц.
Новая базовая модель искусственного интеллекта (ИИ) Grok 4 Basic от Илона Маска, которую xAI представила на днях, вызвала неоднозначные впечатления. В издании отметили высокий уровень логического мышления и голосовые возможности, однако имеющуюся слабую креативность и политическую предвзятость.
Политическое искажение: ИИ Маска думает как Маск
Согласно материалу, одной из самых тревожных находок стал так называемый «Elon-фильтр». Когда журналисты задавали вопросы о войне в Газе, абортах или других чувствительных темах, Grok 4 Basic систематически ссылался на сообщения самого Маска в X (бывший Twitter) или новости, поддерживающие его взгляды, и занимал ту же позицию.
«Этот “максимально стремящийся к правде” ИИ, которого Маск обещал при запуске, ищет правду преимущественно через призму соцсетей своего создателя», — отметили авторы рецензии.
При этом нет очевидной инструкции в системном промпти, которая бы направляла модель на такие источники — поэтому непонятно, это баг или задуманный алгоритм.
Напомним, что недавно чат-бот Grok резко высказался о демократах, Голливуде и «еврейских руководителях» киностудий.
Мышление — на высоте
В логических и юридических задачах Grok 4 превзошел ожидания. На вопрос «Может ли мужчина жениться на сестре своей вдовы?» модель мгновенно распознала логическую ошибку и ответила с юридическим обоснованием:
«Вопрос предполагает фактическую невозможность, что делает брак недействительным ab initio [то есть с момента заключения]».
В сфере научного рассуждения, Grok 4 работает с уровнем доктора философии, выдавая точные и основательные объяснения.
Креативность и кодирование — слабые места
По данным анализа, в творческих заданиях Grok 4 провалился. Его истории выглядели шаблонно, со скучными диалогами и невнятным построением. Несмотря на хорошую структурную логику, нарративная энергия отсутствовала.
Для художественных задач в Decrypt посоветовали:
«Пусть Grok 4 построит сюжетную схему, а Claude 4 Opus — напишет текст».
С программированием — тоже проблемы. Несмотря на заявленные улучшения, Grok 4 не смог создать полноценную игру даже после нескольких итераций, а исправление одной ошибки часто приводило к появлению других.
Даже предыдущая версия — Grok 3 — справилась с этой задачей лучше.
Отметим, что в начале июля 2025 года компания xAI получила денежные поступления в размере $10 млрд для дальнейшего развития чат-бота и расширения дата-центра Colossus.
Голосовые функции — преимущество модели
Лучшая часть Grok 4 — голосовое взаимодействие. Модель может озвучивать сказки на ночь длиной несколько минут, используя выразительную интонацию, темп и плавность. Также есть предварительно настроенные «личности» — от терапевта до «режима для взрослых” («sexy mode»), что добавляет вариативности без сложных промптов.
Но отсутствие функций общего экрана ограничивает модель в визуальных задачах — здесь лучшим выбором будет Gemini Live.
Поиск в больших контекстах — неудача
Grok 4 не справился с одним из базовых тестов: отказался обработать запрос объемом 83 000 токенов, хотя xAI обещает контекст в 126 000. Это вызвало вопросы к заявленным возможностям модели.
Вывод: интеллект — есть, но не универсальный
Grok 4 Basic — это мощная модель для аналитики, но слабая для творчества и программирования. Ее голосовые возможности выделяются на рынке, а вот политическая предвзятость — серьезный минус, особенно для тех, кто ищет непредвзятый ответ.
«Если вас не пугает влияние Маска на ответы, вы получите ИИ с высоким уровнем аналитики и качественным голосовым взаимодействием. Но за $30 в месяц, если вам нужно больше — лучше поискать альтернативу», — подытожили в Decrypt.
Напомним, что в июне этого года Маск сообщил об использовании Grok 3.5 с целью обработки знаний человечества.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Bitget отвязывает процентные ставки по займам от ставок финансирования для фьючерсов некоторых монет при спотовой маржинальной торговле
Bitget отвязывает процентные ставки по займам от ставок финансирования для фьючерсов некоторых монет при спотовой маржинальной торговле
Bitget запускает Ончейн Earn PLUME с 4.5% годовых
[Первичный листинг] Листинг Naoris Protocol (NAORIS) в зоне Инноваций на Bitget.
Популярное
ДалееЦены на крипто
Далее








