6 июля 2024
USD 88.13 +0.01 EUR 95.57 +0.59
  1. Главная страница
  2. Статьи
  3. Спроси по-человечески: как нейросети изменят систему поиска информации в интернете
искусственный интеллект Наука и Технологии

Спроси по-человечески: как нейросети изменят систему поиска информации в интернете

Впервые за почти 30 лет существования интернет-поисковиков (Yahoo, Google и «Яндекс», с которых в середине 1990-х начиналась история Сети) они переживают серьезную трансформацию. В ближайшем будущем, чтобы найти что-то в интернете, не нужно будет специально формулировать запросы и пролистывать страницы поисковой выдачи, достаточно будет просто спросить.

Мобильные браузеры

©Jonathan Raa/NURPHOTO via Reuters

Содержание:

Останется только поиск

Причиной всему – генеративный искусственный интеллект (ИИ), который ворвался в технологическую повестку полтора года назад. Google подсчитал, что еще в 2022-м популярность поискового запроса generative ai («генеративный ИИ») была близка к нулю, а в марте 2024-го достигла максимума (сервис показывает относительные, не абсолютные значения). Теперь, что иронично, именно благодаря новой технологии количество «обычных» поисковых запросов будет снижаться.

Этому поспособствует в числе прочего все более глубокая взаимная интеграция поисковиков и веб-браузеров. Тут надо оговориться: поисковая система и браузер – конечно, разные и не взаимозаменяемые вещи. Но все же тренд очевиден, особенно на мобильных устройствах. На персональных компьютерах (ПК) важными инструментами для работы остаются Chrome, Safari, Edge (лидеры глобального рейтинга браузеров StatCounter), а также «Яндекс Браузер» (единственный заметный представитель рейтинга из России) и другие веб-браузеры.

В смартфонах все иначе. Чем дальше, тем меньше мобильные браузеры используются аналогично десктопным: для интернет-серфинга, чтения больших материалов, просмотра галерей в Сети и т. д. Все это либо уходит на большие экраны, либо по большей части упаковывается в отдельные приложения. Для браузеров остается практически единственная задача – поиск информации (ну и просмотр тех сайтов, для которых нет мобильного приложения, что пока не такая уж редкость).

Тренд на размытие границ подтверждают следующие примеры. Молодой зарубежный стартап The Browser Company, основанный в 2019 году, уже вывел на рынок и довольно успешно продвигает два своих продукта: десктопный браузер Arc (для macOS и Windows) и мобильное приложение Arc Search – «Поисковик Arc» (пока только для iOS). Поисковик после одного из недавних обновлений синхронизируется с десктопной версией и, по сути, является мобильным браузером, но акцент в нем делается именно на поиске, в основе которого лежат генеративные нейросети.

Больше не игрушки: в чем парадокс современной гейм-индустрии

Продукты компании, надо сказать, весьма уверенно чувствуют себя на рынке: без доходов от рекламы компания привлекла $50 млн в рамках последнего раунда в этом году, а в общем получила уже $128 млн. Растет и число пользователей: по разным данным, сейчас их может быть уже до 1 млн.

Arc – история пока, скорее, нишевая, но в России есть и более заметный пример – «Яндекс». Компания развивает «Яндекс Браузер», и именно в него встроен новый поисковый сервис «Нейро» в десктопной версии. На мобильных устройствах новинка с тем же функционалом используется в поисковом приложении, хотя «Яндекс Браузер» для Android и iOS также доступен.

«Нейро» не заменяет привычный поиск, а расширяет его возможности за счет новых сценариев работы с информацией в интернете с помощью нейросетей, – подчеркивает директор по продукту «Нейро» компании «Яндекс» Наталия Савинова. – В «Яндекс Браузере» много нейросетевых функций, не связанных с поиском. Поэтому «Браузер» и «Нейро» не взаимозаменяемы, так же как в целом любой браузер и поисковик».


Как работает генеративный поиск

Нейросети, в том числе генеративные, в поисковиках применяются давно. Несмотря на всю техническую сложность, формулируется их задача очень просто: предсказать ожидание пользователя (следующее слово в запросе или текст, который юзер хочет получить в результате). Так, нейросети анализируют, какие ссылки человек рассчитывает увидеть. Какие ресурсы больше всего соответствуют его ожиданиям? Как правило, по итогу пользователь получает поисковую выдачу – список ссылок.

Новые ИИ-модели работают на все более производительном оборудовании, растут число данных для обучения и параметры нейросетей (количество внутренних настроек, которые корректируются для получения точного результата). Благодаря им поисковые системы могут самостоятельно прорабатывать ссылки поисковой выдачи, собирать релевантные данные в связанный текст или список (в зависимости от запроса) и уже его возвращать пользователю. В хорошем поисковике – вместе со ссылками, чтобы человек мог при желании перейти на сайт и перепроверить, не «соврала» ли нейросеть.


Корпорации, которые не смогли

«Хотя интеллектуальные поисковые системы и браузеры могут значительно трансформировать текущий ландшафт, полная замена традиционных поисковиков, браузеров и операционных систем не кажется ближайшей перспективой, – рассказал «Профилю» директор по продуктам ИИ-разработчика «Наносемантика» Григорий Шершуков. – Принципиальные различия в архитектуре и функционале означают, что новые системы будут, скорее, дополнять существующие, чем полностью их заменять».

Со словами эксперта трудно не согласиться. В начале 2023-го корпорация Microsoft встроила генеративные нейросети в свой поисковик Bing, заставив заметно нервничать лидера и монополиста – Google. Но пока напрасно: Bing не сумел отвоевать существенной доли рынка и неоднократно вызывал критику из-за неточных ответов. А одному из журналистов поисковый чат-бот даже признался в любви и настаивал на том, чтобы он развелся с женой, – такие вот поисковые технологии.

Упреждающая защита: кому и зачем нужны учения в сфере информационной безопасности

Ответный ход Google сделал в мае, запустив открытое тестирование своих генеративных нейросетей в поиске. Спустя полгода эксперимент был масштабирован на 120 стран, но из режима тестирования система до сих пор не выведена.

Как уже было сказано, «Нейро» тоже доступен не вместо, а вместе с классическим поисковиком в виде дополнительной опции. «Генеративные технологии в целом не заменяют, а обогащают уже существующие продукты и за счет этого позволяют удобнее и быстрее решать более широкий спектр задач», – объясняет Наталия Савинова. В качестве примера эксперт приводит возможность «Нейро» понимать естественный язык: пользователю не нужно подбирать формулировки, можно писать вопрос, что называется, прямо из головы.

Ответы таких поисковиков тоже формируются в удобном формате: «живым» текстом, со ссылками на источники, с возможностью уточнить запрос и получить более полный результат или ответ на сопутствующие вопросы. Казалось бы, зачем тогда все еще нужны обычные поисковики?

Галлюцинации нейросетей

Большие языковые модели (LLM), лежащие в основе генеративных поисковиков, проходят достаточно долгое по времени обучение. То есть к моменту полноценного запуска нейросетей их знания неизбежно устаревают, поэтому на вопрос, связанный с сегодняшним днем (например, кто победил во вчерашнем футбольном матче), они, вероятнее всего, не будут знать ответа.

Разработчики придумывают обходные пути: стараются определять такие запросы и пересылать их обычным поисковым алгоритмам. Те транслируют вопрос другой генеративной нейросети, которая соберет ответ в формате, нужном пользователю, и он ничего не заметит. Такая задача стояла, например, перед создателями «Нейро».

«Сервис использует релевантную и актуальную информацию не из памяти модели, а из интернета, даже если она появилась там всего несколько часов назад, – объясняет Наталия Савинова. – Это была ключевая задача в проекте, которую решали кропотливо и долго: по-особенному обучали и настраивали нейросети».

Определить подобный запрос – действительно проблема для ИИ-моделей, и удается им это далеко не всегда. Если не получается, нейросеть может честно признаться: извини, пользователь, не знаю ответа. В лучшую сторону отличается от своих конкурентов поисковик-новичок Perplexity: его алгоритмы достаточно точно (но далеко не идеально) определяют нерелевантные для пользователя данные.

От смартфона до авто: самые концептуальные устройства выставки MWC 2024

Когда нейросеть не справляется с задачей, она начинает «галлюцинировать» – с абсолютной уверенностью нести чушь. Пример с признаниями в любви показателен, но это результат длительного, в несколько часов, экспериментального диалога. Обычные поисковые сессии намного короче, и в этих случаях отличить ерунду от реальных данных может быть сложнее. Например, в ответ на тот же запрос о футбольном матче нейросеть может пересказать события другого матча, который случился намного раньше. И за счет «естественности» ответа пользователь даже не поймет, что закралась ошибка.

«Исследователи в области искусственного интеллекта активно занимаются решением проблемы ошибок и «галлюцинаций» в генеративных системах, – рассказывает Григорий Шершуков. – Одним из подходов является разработка более продвинутых методов проверки и коррекции результатов работы ИИ, например, с помощью уточненных алгоритмов обучения и валидации. Ведется работа над созданием систем, способных к критическому самоанализу и адаптации, что позволит им корректировать свои ошибки на основе обратной связи от пользователей».

Со временем можно ожидать значительного уменьшения частоты и серьезности таких недочетов, считает эксперт, но, несмотря на новые разработки, полное исключение ошибок в ближайшее время маловероятно. А посему пользователям все еще необходимо будет проявлять критическое мышление при использовании генеративных систем.

Рекламные войны

Добавим к этому, что некоторые крупные игроки рынка на самом деле не так уж сильно хотят технологических нововведений – ведь это неприбыльно.

Начиная примерно с 2019 года пользователи Google стали говорить о том, что поисковик со временем работает все хуже. Поначалу все можно было списать на причуды поисковых алгоритмов, но со временем выяснилось: компания намеренно ухудшала работу поисковика, чтобы пользователь проводил больше времени на страницах. В частности, один из топ-менеджеров Google, руководивший сначала рекламным, а затем поисковым подразделением корпорации, в процессе «обновления», по сути, откатил поисковик на несколько лет назад. Пользователь получает более релевантную выдачу? Информация хорошо структурирована? Реклама помечается яркими лейблами? Отменить все! Ведь так юзер быстрее уходит с сайта, не смотрит на вторую и третью страницы поисковой выдачи, а значит, видит меньше рекламы, которую к тому же легко распознает (как следствие, с меньшей вероятностью переходит по ссылке). Неудивительно, что выручка падает.

С развитием генеративных технологий сложнее будет собирать и нужную для показа «правильной» рекламы информацию о пользователе. «Сейчас, когда пользователь переходит по ссылке, сохраняется информация о предпочтениях, предыдущих запросах, пути клиента – обо всем, что используется в контекстной рекламе в интернете, – объясняет Григорий Шершуков. – В новом виде «просмотр» ссылок станет выполнять робот, и информация, связывающая клиента с источниками рекламы в Сети, будет меняться».

Удивительное вероятное: какие технологические и научные открытия нас ждут в 2024 году

Таким образом, из-за развития ИИ Google в 2023 году оказался между молотом и наковальней. С одной стороны – Microsoft с его многомиллиардными инвестициями в прорывной ИИ-разработчик OpenAI и интеграция ChatGPT в этот поисковик. Плюс на рынок выходят новые игроки, которые постепенно переманивают пользователей, особенно тех, кто недоволен некачественной поисковой выдачей.

С другой стороны – владельцы крупных медиапорталов, которые тоже могут считать себя пострадавшими от генеративных нейросетей. Ведь если пользователь получает удобную информационную выжимку с нескольких ресурсов прямо в поисковике, идти на сайт ему незачем, тот самый робот все за него уже посмотрел. Кому же тогда показывать рекламу – источник дохода не только Google, но и тех самых медиапорталов?

Решение нашлось легко: не пускать поисковых ботов на медиаресурсы задаром. Как следствие, Google пришлось раскошелиться. В апреле корпорация договорилась платить Wall Street Journal от $5 млн до $6 млн ежегодно, чтобы иметь возможность индексировать ее материалы для работы ИИ. Сумма для компании, конечно, невелика: недавно выяснилось, что в 2022-м Google заплатил Apple $20 млрд (не миллионов!), просто чтобы быть поисковиком по умолчанию в ее устройствах. Тем не менее шесть миллионов – WSJ, еще столько же – другим, третьим претендентам на эксклюзивность, да и Apple что-то там придумывает с генеративными нейросетями… Как бы тут опять прибыли сокращаться не стали.

Когда мастодонт оступится

Недостатки Google – именно то, на чем играют сейчас конкуренты. Речь не только и даже не столько о Microsoft, сколько о молодых компаниях вроде разработчиков Arc и Perplexity, которые весьма уверенно выходят на рынок. Конечно, они живут не сами по себе: в основе их инструментов большие нейросетевые модели, разработанные OpenAI, Anthropic, Meta (признана экстремистской и запрещена в РФ) – компаниями со своими интересами, в том числе финансовыми.

Впрочем, не так важно, что будет с Google (не будем забывать, что корпорации принадлежит и самый популярный браузер в мире Chrome) и другими маститыми разработчиками поисковиков и браузеров. Уйдут они, как в свое время погибла Yahoo (к слову, этим поисковиком в период заката руководил тот же менеджер, который ответствен за ухудшение поисковых выдач Google), – на их место встанут новые лидеры с передовыми ИИ-двигателями «под капотом».

Важно, что на технологию есть спрос. Генеративный ИИ способствует увеличению производительности пользователя и более глубокой интеграции с другими сервисами и приложениями, убежден Григорий Шершуков. «Все знают, что если ответ на запрос находится на второй странице поисковика, то до него очень редко доходит обычный пользователь. Даже промотать до конца первую страницу поисковика – уже заслуга, – отмечает эксперт. – С развитием ИИ данный подход к поиску информации будет еще больше сводиться к одному действию: уточнению основного запроса. К этому изменению нужно будет подстраиваться».

«Развитие нейросетей и их использование в самых разных сервисах, в том числе в поиске, – долгосрочный тренд во всем мире и логичный этап развития технологий. В этом процессе крайне важно учитывать интересы и пользователей, и интернет-площадок», – резюмирует Наталия Савинова.

Подписывайтесь на все публикации журнала "Профиль" в Дзен, читайте наши Telegram-каналы: Профиль-News, и журнал Профиль