Ноябрь открытий: на что способна генеративная нейросеть
2023-й можно смело назвать годом генеративного искусственного интеллекта (ИИ) – по крайней мере, с технологической точки зрения. Кажется, будто IT-корпорации сговорились и решили доказать: технология не просто развивается, но скачет вперед семимильными шагами, перекраивая большую часть привычных процессов. Всего за пару ноябрьских недель в сфере генеративного ИИ случился ряд событий, по отдельности на революцию не претендующих, но в совокупности четко дающих понять: как раньше уже не будет.
Внедрение длиною в год
В январе 2023-го стало достоверно известно, что Microsoft вложит $10 млрд в OpenAI – компанию-разработчика генеративной нейросети ChatGPT. На протяжении года создатели самой популярной операционной системы (ОС) в мире – Windows постепенно внедряли ИИ-инструменты в свои сервисы и приложения, и ноябрьская конференция Microsoft Ignite показала: ИИ теперь пронизывает всю экосистему корпорации насквозь. Одно только изучение перечня анонсов может занять добрый час, и большая часть посвящена как раз новым ИИ-возможностям.
На пути к суперчеловеку: кому и зачем нужны разработки нейроинтерфейсов
Из основного можно назвать, пожалуй, Copilot – интеллектуальный ассистент для решения широкого спектра задач с помощью «естественных» текстовых запросов, который внедряется в подавляющее большинство сервисов Microsoft. Для обычных пользователей и офисных работников расширен функционал в подписке Microsoft 365, в частности, для текстового редактора Word, почтового клиента Outlook, пространства коллективной работы Teams. Список возможностей широк: оптимизация текстов (в том числе стилистическая и смысловая), интеллектуальное выстраивание расписания, поиск изменений в документах, построение дашбордов и другое.
Оптимизированные версии Copilot обещают выпустить для специалистов в сфере продаж, поддержки, клиентских менеджеров. Для разработчиков будет расширен функционал работы с данными. Также анонсирован AI Studio – инструментарий для упрощенного запуска сторонних ИИ-моделей в Windows. Он в том числе позволит «тренировать» собственных «вторых пилотов» под конкретные задачи.
Кроме того, компания заявила о выпуске двух собственных процессоров, что позволит снизить зависимость от других игроков рынка, в первую очередь от глобального монополиста Nvidia. Центральный процессор Azure Cobalt 100 и графический Maia 100 построены на Arm-архитектуре и производятся по 5-нанометровому техпроцессу. Это предыдущее поколение: производственные линии TSMC на 4 нм и экспериментальные на 3 нм, по-видимому, заняты производством чипов для Apple, Nvidia и других вендоров. Оба процессора будут использоваться в «облаке» компании для обработки растущего количества ИИ-задач.
Буря вокруг OpenAI
На днях в OpenAI чуть не случился «гражданский переворот». 17 ноября совет директоров уволил главу и основателя компании Сэма Альтмана. Это вызвало бурю протестов. События развивались стремительно. Глава Microsoft объявил, что Альтман возглавит у них новую ИИ-команду. Более 500 человек пригрозили покинуть OpenAI вслед за руководителем, если совет директоров не вернет Альтмана на прежнюю должность, а сам не отправится в отставку. В итоге договорились: OpenAI объявила о возвращении Сэма Альтмана, совет директоров компании сменится (вероятно, в него войдут представители Microsoft).
Судя по данным СМИ, ключевой причиной раскола стало расхождение по вопросу ChatGPT. Альтман, будучи инноватором, выступал за ускоренное развитие ИИ, тогда как совет такой подход счел бесконтрольным и не заслуживающим доверия. Вероятно, ситуация оказалась критической для существования одного из самых востребованных технологических решений, и для спасения ChatGPT Альтмана вернули, а заодно Microsoft получила еще больший контроль над этим перспективным инструментом.
Битвы за власть в OpenAI сопровождались проблемами с самим ChatGPT. За несколько дней до увольнения Сэм Альтман сообщил о приостановке приема заявок на платные подписки ChatGPT Plus – компания оказалась не готова поддерживать их технически. На фоне бурных событий нейросеть вообще перестала работать, но вместе с возвращением Альтмана также вернулась в строй. Сразу после этого компания объявила о расширении функционала: ChatGPT Voice – возможность общаться с ассистентом голосом, ранее доступная только платным подписчикам, – теперь будет доступна всем.
Искусственный интеллект для соцсетей, игр и путешествий
Другие американские IT-компании не отставали от повестки и тоже разработали в этом году ряд интересных ИИ-продуктов, причем по большей части не совсем профильных для себя.
Пойманные в нейросети: как ИИ "захватил" человечество и почему всем это выгодно
Meta (признана в России экстремистской и запрещена) начала развивать свою ИИ-экспертизу и представила EMU Video и EMU Edit – две нейросети для создания и обработки контента. Первая позволяет генерировать видео на основе текстовых запросов: сначала алгоритм создает статическое изображение, а затем, опираясь на него, анимирует в соответствии с запросом пользователя. Также с помощью EMU Video можно анимировать пользовательские фотографии.
EMU Edit некоторые пользователи назвали «убийцей фотошопа»: нейросеть позволяет редактировать изображения с помощью обычных текстовых запросов. Можно добавить или убрать надпись в стилистике иллюстрации, заменить объект (например, апельсиновый сок на коктейль) или фон («поставить» бокал на край бассейна) и так далее.
Платформа YouTube совместно с ИИ-подразделением материнской компании Google DeepMind представила Music AI Tools. У сервиса две функции. Первая – возможность «напеть» голосом мотив и на основе записи сгенерировать музыкальную партию на выбранном инструменте (в качестве примера приводится саксофон). Вторая – генератор коротких музыкальных треков в стилистике известных исполнителей (тех, кто дал YouTube разрешение на подобные эксперименты). А еще видеоплатформа теперь будет обязывать авторов контента помечать свои ролики, если в них что-то сгенерировано нейросетями.
Как кванты мир завоюют: есть ли у России шанс стать лидером новой технологической революции
Компания Unity, создатель одноименного игрового движка (одного из самых востребованных в гейм-индустрии), открыла разработчикам доступ к анонсированному еще летом инструменту Muse. Он позволяет с помощью текстовых запросов генерировать элементы игры: текстуры, модели объектов и персонажей, а также их анимации. По сути, инструмент способен заменить львиную долю рутинной работы программиста и позволить ему сфокусироваться на проработке сложных и интересных игровых механик.
Наконец, «мода» на генеративный ИИ добралась и до совсем уж специализированных платформ: Airbnb, один из ведущих мировых онлайн-сервисов по аренде жилья, анонсировал первую сделку в качестве публичной компании. Ни много ни мало за $200 млн компания приобретет ИИ-стартап Gameplanner.AI. С его помощью она рассчитывает внедрить интеллектуального ассистента, который сможет помогать путешественникам в различных аспектах (например, более точно подбирать жилье).
Компьютер прикрепили к одежде
Недавно в США начались предзаказы на AI Pin – устройство, слухи о котором ходили еще год назад. Официально оно было представлено только в ноябре. Девайс от стартапа Humane позиционируется как полная замена смартфону. Это небольшой компьютер, который с помощью магнитного зажима крепится к одежде и сочетает в себе проектор, сенсорную панель, датчик распознавания жестов и объектов, а также главный инструмент управления – генеративный ИИ.
Девайс разработан таким образом, чтобы владелец максимально использовал возможности ИИ от OpenAI и других разработчиков: поиск информации (включая музыку, стоимость товаров и другое), отслеживание здоровья (например, подсчет калорий в съеденных продуктах), перевод на разные языки в режиме реального времени и так далее.
Развитие ИИ-экосистем в России
Россия не осталась в стороне от всеобщего тренда. «Яндекс» в ноябре провел регулярную конференцию YaC 2023, где также упоминался генеративный ИИ – YandexGPT. Компания постепенно внедряет его в свои сервисы, и самым заметным изменением стало обновление «Яндекс.Карт». Теперь ИИ на основе пользовательских отзывов создает краткие описания места (например, «вьетнамская кухня» или «авторские коктейли» – применительно к ресторанам и барам соответственно). Также добавлены карточки в формате «сторис»: YandexGPT, опять же на основе самых характерных моментов из отзывов, генерирует более подробные описания плюсов и минусов того или иного заведения.
Помимо этого компания запустила продажи «Станции Миди» и анонсировала скорый выпуск устройства «Дуо Макс». В обеих новинках установлен нейропроцессор, который позволяет быстрее обрабатывать пользовательские команды, но развития в сторону именно генеративного ИИ пока не было. В колонках доступен отдельный навык «Давай придумаем», позволяющий поработать с YandexGPT второго поколения, однако нативно в ассистента «Алису» он пока не вшит (как, например, это реализовано в AI Pin).
Ума палаты: под интеллектуальный дом подведут фундамент стандартов
Свою ИИ-экосистему продолжает развивать «Сбер». Летом компания выпустила SaluteSpeech App – приложение с функциями перевода голоса в текст и наоборот, куда встроен генеративный ИИ – GigaChat. Он позволяет загрузить в приложение короткие тезисы, которые будут автоматически расширены до полноценного текста, или, наоборот, сделать из текста смысловую выжимку. После чего нейросеть сразу может перевести текст в аудиоформат.
На днях банк провел свою ежегодную ИИ-конференцию AI Journey, где представил целый список нововведений. Была обновлена генеративная нейросеть Kandinsky: при генерации изображений у нее повысилась точность обработки пользовательских запросов. Также «Кандинского» обучили генерировать видео – пока только простые 8-секундные ролики. А разработчик офисных программ «МойОфис», повторяя опыт зарубежного конкурента Microsoft, объявил о внедрении «сберовского» GigaChat (аналог ChatGPT) в свое ПО. Сейчас разработчики обсуждают монетизацию возможностей нейросети. К слову, ИИ-модель GigaChat тоже обновилась: теперь она поддерживает 29 млрд параметров и за счет этого точнее работает на русском языке.
Другие крупные российские IT-компании, также развивающие свою ИИ-экспертизу, – VK и МТС – пока не включились в гонку. Но уже понятно, что развитие генеративного искусственного интеллекта будет идти по нарастающей, хватало бы мощностей.
Meta - физическое лицо или организация, признанная экстремистской и запрещенная в России;
Читайте на смартфоне наши Telegram-каналы: Профиль-News, и журнал Профиль. Скачивайте полностью бесплатное мобильное приложение журнала "Профиль".