В наши дни онлайн-энциклопедия Википедия отмечает заметное падение количества прямых посещений, поскольку множество людей теперь предпочитает получать необходимые сведения из этого глобального источника знаний через специализированные чат-боты, функционирующие на принципах генеративного искусственного интеллекта.
Представители Фонда Викимедиа подчеркивают, что ИИ-чат-боты и поисковые сервисы, которые опираются на материалы Википедии для анализа и обобщения данных, освобождают пользователей от прямого перехода на сайт энциклопедии. Это создает серьезные вызовы для будущего стабильности и развития проекта.
В Фонде Викимедиа настаивают на том, что чат-боты, поисковые платформы и социальные сети, которые используют информацию из Википедии, обязаны направлять больше трафика для обеспечения повсеместного распространения ценнейших знаний. Как указал старший директор по продуктам Фонда Викимедиа Маршалл Миллер, уменьшение потока посетителей на Википедию осложнит работу волонтеров и спонсоров, занимающихся улучшением и расширением контента в этой онлайн-энциклопедии.
Хотя генеративные модели ИИ и различные поисковые системы приводят к сокращению прямого трафика на Википедию, контент оттуда продолжает оставаться ключевым ресурсом для их функционирования. Материалы из Википедии широко применяются для обучения ИИ-моделей, и компании вроде Google на протяжении лет используют их в своих информационных блоках и панелях, что перераспределяет аудиторию в сторону этих платформ.
«Почти все ведущие языковые модели ИИ строятся на базах данных, включающих Википедию, а поисковые системы и социальные платформы отдают предпочтение ее контенту при ответах на запросы. В результате люди знакомятся с материалами, подготовленными волонтерами Викимедиа, не заходя на сайт wikipedia.org. Эти человеческие знания обретают еще большую значимость для поддержания достоверной информации в сети», — акцентировал Маршалл Миллер.
Миллер также отметил, что в мае текущего года Википедия зафиксировала аномально высокий объем трафика, по всей видимости, из-за активности пользователей из Бразилии. Это событие вынудило Фонд пересмотреть и укрепить свои механизмы для выявления бот-активности.
«После внедрения этих изменений мы констатируем снижение числа просмотров страниц Википедии реальными пользователями за последние месяцы, которое достигло примерно 8% по сравнению с тем же периодом в 2024 году. Мы полагаем, что это снижение обусловлено влиянием генеративного ИИ и социальных сетей на способы поиска информации, особенно когда поисковые системы предлагают ответы прямо на запросы, часто опираясь на данные из Википедии», — пояснил Миллер.
Кроме того, он упомянул, что Википедия имеет специальные меры для контроля внешних ботом, сканирующих ее ресурсы. К примеру, существуют требования к указанию идентифицирующей информации, соблюдению файла robots.txt, а также ограничения по частоте и объему запросов.
В последние месяцы мы столкнулись с неожиданным ростом трафика сверх прогнозов, особенно в определенном регионе, и не смогли сразу определить причину. Наши инженеры и аналитики, изучив данные, распознали новую схему поведения ботов, которая имитировала действия обычных пользователей. После этого мы доработали системы обнаружения и применили их заново к накопленным данным. Поскольку наша система для выявления ботов эволюционировала со временем, мы не в состоянии провести точные сравнения, но эти корректировки демонстрируют падение количества просмотров страниц реальными посетителями», — поделился Миллер.
Наблюдения Фонда перекликаются с выводами других свежих исследований. Так, в июле Центр исследований Пью установил, что всего 1% поисковых запросов в Google заканчивались переходом по ссылке в ответе ИИ, которая направляла на соответствующую страницу, обработанную Google.
Поисковые сервисы все чаще интегрируют генеративный ИИ для предоставления ответов непосредственно пользователям, минуя оригинальные источники. Молодежь предпочитает искать информацию на платформах с видео-контентом в соцсетях, а не в открытом интернете. Этот эволюционный сдвиг затрагивает не только Википедию. Многие другие издатели и платформы контента сообщают о схожих тенденциях, поскольку аудитория все больше времени тратит на поиск информации в поисковиках, ИИ-чат-ботах и социальных сетях.