
Каждый, кто проводит хотя бы полчаса в интернете ежедневно, наверняка замечал: что-то изменилось. Тексты на сайтах стали подозрительно гладкими, позитивными и похожими друг на друга. Свежее исследование, проведённое специалистами из Imperial College London, Стэнфордского университета и Internet Archive, наконец подкрепило эти ощущения цифрами.
Исследование, препринт которого опубликован в апреле 2025 года, проанализировало сайты, появившиеся в период с 2022 по 2025 год. Для выборки использовался Wayback Machine от Internet Archive, а для детекции применялись инструменты компании Pangram Labs, показавшие наиболее стабильные результаты среди четырёх протестированных подходов. Стоит, правда, оговориться: ни один детектор ИИ-текстов пока не является идеальным.
Главный вывод: примерно 35 процентов всех новых веб-ресурсов либо полностью сгенерированы, либо существенно дописаны с помощью языковых моделей. Это уже не единичные случаи, а треть нового интернета. Ии контент, по сути, стал нормой для значительной части веба.
Исследователи применили анализ тональности (sentiment analysis), разделяя слова на позитивные, нейтральные и негативные. Результат оказался впечатляющим: средний показатель позитивной тональности у ИИ-сайтов был на 107 процентов выше, чем у сайтов, написанных людьми. Учёные связывают это с так называемой «подхалимской природой» современных языковых моделей, которые стремятся угодить пользователю. Этот эффект перетекает в публичное пространство, делая общий тон онлайн-текстов приторно-радостным.
Ещё один тест показал, что ии контент снижает разнообразие точек зрения в сети. Сайты, созданные с помощью ИИ, набрали примерно на 33 процента больше баллов по параметру «семантическое сходство» по сравнению с человеческими ресурсами. Проще говоря, тексты стали похожи друг на друга по содержанию и идеям.
Любопытно, что четыре из шести гипотез исследователей не нашли подтверждения. Команда предполагала, что ИИ-тексты будут распространять больше дезинформации, не содержать внешних ссылок и отличаться стилистической шаблонностью. Ни одно из этих предположений данные не поддержали. Как отметил исследователь из Стэнфорда Мати Богачек: «Все в команде ожидали, что стилистическая однородность подтвердится. Но у нас просто нет значимых доказательств этого».
Перед анализом исследователи провели опрос обычных пользователей. Оказалось, что большинство людей тоже ошибались в своих прогнозах: ожидали роста фейковых новостей и исчезновения ссылок. Реальность оказалась несколько другой. «Интересно, что люди склонны ожидать наихудших сценариев», заметил Богачек.
Если вы используете ИИ для создания контента, эти данные стоит учитывать. Искусственная позитивность и однообразие идей могут снижать доверие аудитории. Грамотная настройка автоматизации позволяет избежать этих ловушек. Например, в наших решениях по автоматическому блогингу мы настраиваем тональность и стилистику под конкретный бренд, чтобы тексты не превращались в типичный «ИИ-шлак». Подробнее о возможностях автоматизации контента можно узнать на странице наших AI-услуг.
Это исследование, как признают сами авторы, лишь первый шаг. Но оно даёт полезную отправную точку: мы теперь лучше понимаем, как именно ии контент меняет интернет, и не всегда эти изменения совпадают с нашими ожиданиями. Иногда самое сложное в прогнозах то, что реальность упорно отказывается им соответствовать.