Информационное агентство Деловой журнал Профиль

Главное об ИИ: нейросети создают видео, делают покупки, учат роботов и набирают популярность

OpenAI продолжает заключать многомиллиардные сделки, прочие крупные игроки разрабатывают новые ИИ-модели и пытаются обогнать лидера. Кто-то фокусируется на финтехе, другие – на умной робототехнике. Российские игроки стараются не отстать от мировых трендов. «Профиль» систематизировал вал новостей в сфере генеративного искусственного интеллекта (ИИ) за последний месяц.

Искусственный интеллект

Иллюстрация создана нейрогенеративной сетью

©Shutterstock AI/Shutterstock/Fotodom
Содержание:

ChatGPT: от умного диалога до экосистемы

Мировой лидер ИИ-гонки OpenAI как из пулемета выдал череду анонсов. Для большинства пользователей самыми полезными в перспективе станут обновления нейросети ChatGPT, которую компания системно превращает во многофункциональный практический сервис, а не просто умную диалоговую систему.

Друг сердечный: эмоциональная привязанность к ИИ становится масштабной проблемой

В частности, дайджест «Пульс» (Pulse) каждое утро направляет пользователю персонализированную ленту с рекомендациями и полезными напоминаниями (при желании можно подключить почту и календарь Google), а также другой полезной информацией. Запущена функция оформления заказа в магазине прямо в интерфейсе чата (Instant Checkout). Пользователь может, не выходя из сервиса, не просто выбрать нужный товар, но сразу же оформить заказ, пока, правда, с рядом ограничений. Это уже весьма сильная демонстрация потенциала агентного ИИ, способного выполнять сложные задачи, но OpenAI ею не ограничилась.

На мероприятии DevDay 2025 компания анонсировала возможность подключать к ChatGPT внешние приложения. В качестве примеров были названы дизайн-системы Canva и Figma, сервисы поиска и бронирования жилья Zillow и Booking, музыкальный стриминг Spotify. Для более продвинутых пользователей и разработчиков выпущен набор инструментов AgentKit, позволяющий самостоятельно, без знания кода собирать ИИ-агентов со сложными сценариями под личные задачи.

Браузеры нарастают ИИ-ассистентами

Главное, до чего пока не дотянулась OpenAI, – собственный браузер. А в этом сегменте тем временем разворачивается нешуточная борьба.

Google начал более глубокое встраивание своего ИИ-ассистента Gemini в главный браузер на рынке Chrome. Его умная версия доступна части пользователей в США. Стартап Perplexity, который уже несколько месяцев проводил закрытое тестирование своего решения Comet, также выпустил его в открытый доступ.

Обманываться рад: почему люди склонны слишком доверять искусственному интеллекту

Концептуально и функционально решения схожи. Пользователям прямо в веб-интерфейсе доступна возможность задать вопросы ИИ-ассистенту, который быстро проанализирует открытый сайт (или сразу несколько) или решит сложные задачи, допустим, найдет и забронирует отель с лучшим расположением и минимальной стоимостью. В обоих случаях заявлена возможность интеграции почтовых клиентов, календарей и других сервисов для большей полезности и персонализации.

Российский «Яндекс» подобное обновление для своего «Браузера» показывал в конце августа. Теперь же компания подключила «Алису» на базе YandexGPT 5.1 Pro к мессенджерам Telegram и Max. Через них можно решать базовые задачи: создавать и редактировать тексты и картинки, искать информацию.

Новый для российского рынка сервис на базе ИИ запустил телеком-оператор МТС. «Звонок в чат» позволяет перевести разговор в текстовый формат, если пользователю неудобно вслух отвечать на вызов. Звонящий при этом продолжает общаться голосом – нейросеть расшифровывает текст и отправляет его второму собеседнику. Тот отвечает текстом, который затем озвучивается.

Видеообманки и оживление фотографий

С развитием моделей генерации видеороликов началась активная трансформация соцсетей с видеоконтентом. В TikTok, YouTube Shorts и аналогичных сервисах все чаще встречаются очень реалистичные короткие ролики, созданные нейросетями. Это стало возможным благодаря нынешнему поколению генеративных ИИ вроде недавно представленного Veo 3 (и уже обновленного до 3.1) от Google. OpenAI показала новинку и в этом сегменте – Sora 2. Нейросеть способна создавать очень реалистичные видео: в некоторых случаях отличить их от настоящих почти невозможно, по крайней мере, на первый взгляд. Она способна запоминать образы и контекст, сразу озвучивать ролики, грамотно их сочетать.

ИИ стремительно растет: главные новости нейросетей за последние недели

Отдельного внимания заслуживает функция «Камео» (Cameo) – возможность загружать свой виртуальный образ для использования в роликах, а также применять чужие образы из общедоступной библиотеки. Пополняется она с помощью приложения Sora, которое OpenAI выпустила вместе с новой моделью. Это подобная TikTok соцсеть, где публикуются исключительно ИИ-ролики. Менее чем за пять дней приложение загрузили более миллиона раз, быстрее, чем этой отметки достиг собственно ChatGPT.

Аналогичное решение за несколько дней до OpenAI представила и Meta*. В приложении Meta AI она запустила Vibes, который также представляет собой ленту со сгенерированными видео. Раздел задуман как «песочница», демонстрирующая возможности генеративных моделей от компании.

xAI обновила Grok Imagine до версии 0.9. Нейросеть стартапа Илона Маска генерирует до шести секунд видео, но заметно быстрее конкурентов (десятки секунд вместо нескольких минут). Поддерживается озвучка текста на русском языке.

Российские ИИ-разработчики стараются держаться в мейнстриме. «Яндекс» обучил «Алису» оживлять фотографии – делать четырехсекундные ролики на основе пользовательского снимка и описания сюжета. А Сбер выложил в открытый доступ ИИ-модель Kandinsky Video Lite. Ее можно развернуть локально и создавать видео длиной до 10 с. с памятью об объектах и контексте.

ИИ-агентам разрешили тратить деньги

Доверие как бизнеса, так и рядовых пользователей к ИИ постепенно растет: нейросетям осторожно начинают позволять управлять деньгами – медленно и с ограничениями. Instant Checkout, например, уточняет у человека каждый шаг, прежде чем действительно оформить заказ на покупку.

OpenAI публикует открытый Agentic Commerce Protocol (ACP) – технический протокол в основе функции платежей, разработанный совместно с финтех-компанией Stripe. Любой ретейл и ИИ-разработчик сможет внедрить аналогичную возможность у себя с привязкой к ChatGPT или (потенциально) другому чат-сервису.

ИИ бояться – в нейросеть не ходить: как обрести баланс между развитием цифровых технологий и защитой данных

Google сделал шаг дальше и в середине сентября представил протокол агентных платежей – Agent Payments Protocol (AP2). Это также открытый стандарт, который позволяет полностью автоматизировать процесс покупки с заранее четко заданными условиями. Пользователь подписывает криптографические разрешения (при желании можно по старинке, вручную) ИИ-агенту на поиск продуктов или услуг с определенными условиями (диапазон цен, сроки предоставления и прочее) и на их покупку.

Заявлена как поддержка обычных банковских переводов, так и работа со стабильными криптовалютами. Весь процесс должен быть прозрачным и прослеживаемым для восстановления цепочки в спорных ситуациях. В числе партнеров уже более 60 глобальных торговых компаний, включая Mastercard, PayPal.

Собственное агентное решение для платежей – Agent Payment Solution – показала в сентябре Antom (дочерняя компания международной финтех-корпорации Ant International, владеющей среди прочего системой Alipay). Это открытая платформа, на базе которой маркетплейсы и иные компании также могут строить приложения с применением ИИ-агентов.

Alipay же начал на практике тестировать собственную разработку на базе многофункционального открытого протокола MCP (Model Context Protocol – протокол контекста для моделей). В сети кофеен Luckin Coffee можно совершать покупки через ИИ-чат в приложении, начиная от выбора товаров и заканчивая оплатой.

Как нейросеть будет учить роботов

В сегменте генеративного ИИ для робототехники сформировалась явная монополия, и принадлежит она Nvidia. Впрочем, постепенно на арену выходят и другие компании, которые ранее занимались преимущественно софтверными разработками.

Изменится всё: во что превратят нашу жизнь искусственный интеллект и умные роботы

Самый красноречивый анонс – две новые модели от Google DeepMind: Gemini Robotics 1.5 и Gemini Robotics-ER 1.5, универсальные решения для роботов различного типа. Нейросети, получив доступ к камерам и сенсорам, сами обучаются выполнять различные типы задач. ER 1.5 отвечает за «обдумывание», в том числе разбивку на подзадачи и формирование алгоритма, а модель 1.5 реализует эти шаги, переводя их в команды для моторов робота.

Meta*, со своей стороны, присматривается к гуманоидным устройствам. Технический директор компании назвал работу в этом направлении «ставкой уровня дополненной реальности», то есть туда будет вложено много ресурсов. Сфокусируется Meta* исключительно на программной платформе: в компании рассчитывают, что она станет стандартом для индустрии аналогично ОС Android для мобильных устройств.

Nvidia – признанный лидер в этой области на сегодня – тем временем продолжает укреплять свои позиции. Совместно с TII (государственный научно-исследовательский институт в Абу-Даби, ОАЭ) корпорация открыла в Эмиратах технологический центр ИИ – NVIDIA AI Technology Center (NVAITC). Лаборатория будет заниматься изучением связки ИИ и передовой робототехники. Корпорация таким образом выходит на рынок Ближнего Востока, укрепляя свои глобальные амбиции, а ОАЭ подтверждает статус одного из ведущих инновационных государств.

Четыре новичка в семье нейросетей

За месяц вышло немало новых ИИ-моделей, отметим несколько самых интересных.

Цифры, факты, тенденции ИИ-индустрии в октябре

5,6 млрд руб. может достичь объем российского рынка образования в сфере ИИ по итогам 2025-го, подсчитали в Smart Ranking. Это почти на четверть больше, чем годом ранее (4,5 млрд руб.).

Четыре из пяти российских игровых студий используют ИИ (преимущественно генеративный), согласно данным профильных ассоциаций. Алгоритмы применяются для написания кода, создания графики, сценариев, звуков и прочего.

Китайские бигтехи Alibaba и Baidu переходят на собственные процессоры для обучения интеллектуальных алгоритмов. Компании системно стремятся уйти от зависимости от американской Nvidia.

470 тыс. сотрудников Deloitte в 150 странах получат доступ к ИИ-решениям Anthropic Claude. Компания будет создавать «персоны» для различных специалистов (бухгалтеры, разработчики и так далее). Для Anthropic это пока крупнейший корпоративный контракт.

Бенчмарк для проверки эффективности моделей ИИ представила OpenAI. GDPval дает возможность сопоставить работу ИИ с профессионализмом человека и качественно оценить, могут ли алгоритмы превзойти реальных специалистов.

Пять крупных сделок OpenAI за последний месяц:

Читать предыдущий выпуск дайджеста «Главное об ИИ»

Meta - физическое лицо или организация, признанная экстремистской и запрещенная в России;

Самое читаемое
Exit mobile version