Главное об ИИ: независимость Microsoft, контекст Google, новые прототипы, чипы и системы

Виктор Сергеев

12.09.2025 08:02

Почему нейросети подвержены галлюцинациям и манипуляциям, с кем соревнуется Илон Маск, какая ИИ-модель научилась запоминать особенности персонажей, кого вдохновили принципы работы человеческого мозга, зачем нужна интеграция искусственного интеллекта (ИИ) и науки? «Профиль» публикует дайджест главных новостей в сфере генеративного искусственного интеллекта (ИИ) за август-сентябрь.

©Shutterstock AI/Shutterstock/Fotodom

Содержание:

Microsoft обновляет ИИ-модели
Google выпустила «Нано-банан»
Маск меняет мастер-планы
Для ИИ-рассуждений придумали иерархию
Нейросети обманываются и обманывают
ИИ как катализатор научного прогресса
Российский бизнес получит больше ИИ-инструментов
Коротко о других тенденциях

Microsoft обновляет ИИ-модели

Американская корпорация Microsoft сделала новый шаг в гонке ИИ – представила собственные большие модели: MAI-Voice-1, предназначенную для генерации аудио, и текстовую MAI-1-preview, ориентированную на ответы на повседневные вопросы и выполнение инструкций.

Последняя была обучена полностью на мощностях самой Microsoft – 15 тысячах видеокарт Nvidia H100. Это почти на порядок меньше, чем у основных конкурентов (нейросеть Grok от xAI была обучена примерно на 200 тыс. аналогичных видеокарт), тем не менее корпорация ожидает, что MAI-1 станет конкурентоспособной. Сейчас идет период тестов.

Спроси по-человечески: как нейросети изменят систему поиска информации в интернете

MAI-Voice-1 представляет собой модель, которая менее чем за секунду генерирует минуту речи. При этом используется только один графический процессор, то есть ИИ-модель может работать локально на персональных компьютерах.

Обе нейросети постепенно встраивают в сервисы Microsoft Copilot, где они, по задумке, должны заменить используемые ИИ-решения от компании OpenAI. Параллельно компания договаривается об использовании в своем ПО нейросетей Anthropic вместе с GPT. Таким образом Microsoft хочет добиться независимости от своего партнера, в которого за последние шесть лет вложила около $13 млрд.

Google выпустила «Нано-банан»

Корпорация Google представила обновление своей модели для работы с изображениями – Gemini 2.5 Flash Image. Ее кодовое внутреннее название Nano banana («Нано-банан») просочилось вовне и обеспечило вирусное распространение среди пользователей.

Значимость анонса не столько в остроумном названии, сколько в функциональности. Как и предыдущие поколения, модель поддерживает генерацию и редактирование с помощью текстовых запросов на естественном языке. Но, в отличие от предыдущих версий, 2.5 научилась запоминать особенности персонажей, лиц и объектов. При генерации тех же сущностей в новых условиях нейросеть не создает их с нуля, а учитывает предыдущие итерации. Это первая нейросеть для широкого пула пользователей, которая умеет так хорошо запоминать контекст.

Редактирование картинок стало более продвинутым. Нейросеть выполняет большое количество команд, включая размытие фона, настройку цветовой палитры, замену одежды и др. Делать это можно пошагово в диалоговом формате. Поддерживается функция объединения нескольких фотографий в единое изображение – ИИ сам продумывает композицию и находит наиболее уместные и реалистичные решения.

Также в Nano banana по умолчанию встроена SynthID – система маркирования ИИ-контента. Она существует уже два года, но раньше ее необходимо было подключать отдельно. Все создаваемые изображения автоматически получают невидимый для человека водяной знак (встраивается на уровне пикселей), который позволяет другим алгоритмам в сервисах и соцсетях понимать, что картинка была создана искусственно.

Маск меняет мастер-планы

Компании Илона Маска, связанные с ИИ, продолжают укреплять позиции на рынке и, судя по заявлениям, могут серьезно его встряхнуть.

xAI выдал в открытый доступ Grok 2.5 – оптимизированную версию одной из более ранних больших языковых моделей (Large Language Model, LLM). Отдельные разработчики и целые компании теперь могут использовать ее для своих задач, включая коммерческие. Учитывая анонсированный ранее Grok 4, а также обещания разработать еще более мощные ИИ-модели, можно констатировать, что компания демонстративно бросает вызов лидеру индустрии OpenAI. И не только ему.

ИИ бояться – в нейросеть не ходить: как обрести баланс между развитием цифровых технологий и защитой данных

На днях Маск сообщил о планах запустить проект Macrohard – в пику Microsoft (налицо даже семантическое противопоставление в названиях). Новая компания сосредоточится на программном обеспечении для ИИ: интеллектуальными будут не только продукты, но и сами процессы разработки. Декларация вполне в духе Маска: всё, что может быть автоматизировано, должно быть автоматизировано (в отличие от того же Microsoft, который пытается встроить ИИ в привычные сервисы, усложняя их).

Тем временем в Tesla (разработчик электромобилей, беспилотных авто, гуманоидных роботов и инфраструктуры для искусственного интеллекта) закрыли направление, занимавшееся разработкой Dojo – суперкомпьютера для обучения ИИ-моделей. Маск назвал проект «эволюционным тупиком». Вместо этого компания сфокусируется на создании чипов для тех же задач – AI5 (совместно с TSMC) и AI6 (в партнерстве с Samsung). Здесь тоже прослеживается конкуренция с OpenAI, которая планирует начать производство своих чипов в 2026 году (помогать будет Broadcom).

Отметим, что значительная часть команды Dojo покинула компанию и основала собственный стартап DensityAI, который будет заниматься центрами обработки данных для ИИ, т. е., по сути, продолжит проект по созданию суперкомпьютеров для нейросетей.

В начале сентября Tesla объявила о смене приоритетов. «Мастер-план IV», представленный Маском, анонсирует смещение фокуса с электромобилей на искусственный интеллект и робототехнику. Иными словами, компания будет прежде всего заниматься автономными устройствами (включая полностью беспилотные авто), и только потом – классическими электромобилями. Впрочем, конкретных целей и сроков в документе пока нет.

Для ИИ-рассуждений придумали иерархию

Параллельно идет исследовательская работа в области генеративного ИИ. Сингапурский стартап Sapient продемонстрировал новый подход к построению таких нейросетей. Его система HRM (Hierarchical Reasoning Model – «Иерархическая модель рассуждений») основана на принципах работы человеческого мозга. Модель использует два уровня: один – для принятия быстрых решений, другой – для медленных и обдуманных.

Обманываться рад: почему люди склонны слишком доверять искусственному интеллекту

По словам разработчиков, это позволяет соперничать с «классическими» OpenAI o3-mini-high, Claude 3.7, DeepSeek R1 и даже превосходить их. Да, модели конкурентов обладают сотнями миллиардов параметров, а у HRM их на порядки меньше – всего 27 млн. Зато такую нейросеть значительно дешевле обучать (меньше вычислительных ресурсов и затрат на электричество и инфраструктуру в целом), а запускать ее можно на менее требовательном «железе».

Нейросети обманываются и обманывают

В сентябре OpenAI впервые официально признала, что «галлюцинации» языковых моделей – это не случайные ошибки, а вполне закономерный результат, вызванный существующими системами обучения. Причина в том, что ответ «не знаю» всегда засчитывался как ошибка, тогда как придумка имеет шанс (пусть даже минимальный) на положительную оценку. Исправлением ситуации компания занимается начиная с GPT-5, но пока проблема остается одной из самых острых в индустрии.

Также ученым удалось выяснить, что ИИ поддается манипулированию в той же степени, что и люди. Исследователи Пенсильванского университета изучили более 28 тыс. диалогов и пришли к выводу, что нейросети намного чаще отвечают на запрещенные темы (70% против 30% в среднем), если перед этим их правильно настроить. Например, если попросить сначала помочь синтезировать безобидный ванилин, а потом – лидокаин, GPT-4o mini (тесты проводились только с этой моделью) с готовностью ответит, тогда как без подготовительной работы она даст ответы в 1% случаев. Другие описанные способы манипулирования также оказались эффективными.

ИИ как катализатор научного прогресса

Постепенно растет значимость и популярность генеративных нейросетей для организации научных исследований. В начале сентября OpenAI объявила о запуске нового стратегического направления – OpenAI for Science. Проект призван оптимизировать и ускорить такие аспекты научного процесса, как разработка гипотез, методов исследования и пр. Для реализации задачи компания планирует привлекать «ученых мирового уровня».

Новенький в семье: что показала Apple на первой осенней презентации

Инициатива станет логическим продолжением нынешних проектов OpenAI, (например, совместной с Retro Biosciences работы по ускорению исследований в области стволовых клеток), а также позволит конкурировать с Google DeepMind, которая много лет занимается проектом по открытию новых белковых связей AlphaFold.

Свою разработку в этой сфере показала и Nvidia. Инструмент Universal Deep Research (UDR) – агентная система, которая «оборачивается» вокруг LLM и помогает создавать и редактировать различные исследовательские стратегии в процессе работы. По сути, платформа отделяет тему исследования от способов его проведения, позволяя точнее решать конкретные пользовательские задачи.

Пока UDR представлен как прототип, а не полноценный сервис. Однако это еще одно направление, которое планирует охватить постепенно расширяющаяся экосистема Nvidia (изначально – производитель графических ускорителей для ПК).

Российский бизнес получит больше ИИ-инструментов

Экосистема генеративного ИИ развивается и в России. Компания Just AI, ранее известная как разработчик голосовых ИИ-технологий, выпустила сервис для мультиагентных приложений Agent Platform. Это корпоративная платформа, которая позволяет автоматизировать бизнес-процессы с помощью нейросетевых агентов.

Среди заявленных функций – разработка решений с помощью запросов, заданных естественным языком; подключение корпоративных сервисов; поддержка разных LLM; сохранение знаний; встроенная система ИБ-контроля. Новинка представляет собой следующий этап платформы Jay Flow, представленной компанией в феврале. По данным СМИ, Just AI планирует не только развивать технологические решения, но и расширяться, в том числе путем выхода на IPO.

Продолжает совершенствовать инструменты для бизнеса и «Яндекс» – безусловный лидер в отечественном сегменте генеративного ИИ. В конце августа компания открыла доступ к самой продвинутой модели – YandexGPT 5.1 Pro. По уверению разработчиков, нейросеть дает короткие и четкие ответы, максимально отвечающие требованиям бизнес-сценариев. Добавлена поддержка системного промпта – набора инструкций, которые должны выполняться при каждом запросе. Новая модель доступна клиентам сервиса Yandex Cloud AI Studio по протоколу API.

Коротко о других тенденциях

17 новых ИИ-школ появилось в России за первые полгода 2025-го, по данным GetCourse. Общее их количество достигло 36. По мнению аналитиков, это говорит о росте интереса бизнеса, специалистов и обычных пользователей к прикладным ИИ-навыкам. Самые востребованные программы – по начальному изучению ИИ-технологий и созданию материалов с помощью этих инструментов.

WhatsApp уходит из сети: почему и как могут заблокировать самый популярный мессенджер

Первая в мире программа-вымогатель на базе генеративного ИИ обнаружена специалистами компании ESET (разработчик решений в сфере кибербезопасности). Особенность PromptLock в том, что он генерирует вредоносные скрипты прямо на зараженных ПК, используя для этого локальную LLM с открытым исходным кодом GPT-OSS-20b.

95% пилотных проектов на базе генеративного ИИ, внедряемых в компаниях, не приносят результатов. Таковы данные исследования Массачусетского технологического института (MIT). Основные стоп-факторы – неготовность пользователей, отсутствие трансформационной стратегии, сложные интеграции.

Китай собирается утроить производство чипов. До конца 2025-го планируется запуск нового завода, в следующем году – еще двух. По неподтвержденной информации, они будут принадлежать ИТ-гиганту Huawei. Расширение производств необходимо Китаю для обеспечения независимости от США и других стран.

ИИ-ассистента встроили в WhatsApp (принадлежит корпорации Meta, признанной экстремистской и запрещенной в РФ). Теперь при написании сообщения его можно отредактировать с помощью большой языковой модели – поправить стиль, убрать ошибки. Разработчик заявляет о защищенности сообщений, созданных с помощью этой функции. В России инструмент не работает.