Эпоха больших данных
К 2025 году основными поставщиками цифровых данных будут не обычные пользователи, как сейчас, а коммерческие предприятия. К таким выводам пришли авторы доклада «Эпоха данных – 2025». По их мнению, за 10 лет изменится и тип информации, и способы взаимодействия всех участников инфосферы, включая устройства интернета вещей и интеллектуально-развитые машины. А это значит, что наступает «эпоха больших данных». «Профиль» опросил экспертов, чтобы выяснить, что это значит для людей, компаний и развития экономики в целом.
За последние пару недель произошло несколько событий, наглядно продемонстрировавших то, как потеря данных может повлиять на нашу жизнь. Ошибка в программном обеспечении ИТ-инфраструктуры мобильного оператора «МегаФон» привела к одному из самых крупных сбоев в сети, из-за чего без связи остались абоненты в разных регионах России.
Другая история – массовое распространение вируса-шифровальщика WannaCry. Ущерб, нанесенный этой зловредной программой, посчитать невозможно. Да, можно оценить примерную упущенную выгоду компаний из-за простоя, затраты на восстановление инфраструктуры и т. д. Но сколько стоит, скажем, ваш архив фотографий? Если вовремя не была сделана резервная копия, то эти данные не скачаешь и не купишь ни за какие деньги. Именно поэтому атака WannaCry оказалась столь успешной.
Незадолго до этих событий аналитическая компания IDC совместно с компанией Seagate подготовила любопытнейший доклад, получивший название «Эпоха данных-2025» (The Data Age 2025). В нем, например, говорится о том, что к 2025 году общемировой объем данных вырастет на порядок и достигнет 163 зеттабайт, причем большая их часть будет создаваться не частными пользователями, а предприятиями. Несмотря на то, что документы, книги и другие данные оцифровываться начали давно, процесс этот продолжается. Десятилетие, прошедшее под знаком преобразования аналоговых данных в цифровые, уступит место эпохе данных как самостоятельной ценности.
Из документа IDC и Seagate следует, что создание и использование жизненно важных данных, а также управление ими будет в равной степени значимо для поддержания нормальной повседневной деятельности как потребителей, так и коммерческих предприятий и госструктур. Количество потребителей и предприятий, создающих и обменивающихся данными между любыми устройствами и облачными хранилищами, будет увеличиваться и приобретет колоссальные масштабы, превосходящие предыдущие прогнозы. В принципе, все это можно наблюдать уже сегодня. И в этом свете на первое место выходит проблема безопасности.
Что надежнее
«Сегодня абсолютно надежных средств для защиты информации не существует. «Взломать» можно практически любую систему, – считает Александр Антипов, директор по развитию бизнеса компании «Ай-ФОРС» (ГК ФОРС). – Возможно, принципиально иной уровень безопасности дадут квантовые технологии, но до их практической реализации пока далеко. Высоким классом надежности обладают технологии блокчейн, однако и они используются еще довольно редко. Классический подход к решению этой проблемы состоит в том, чтобы обеспечить надежное хранение информации в пределах защищенного периметра и не допустить утечки за его пределы. При этом следует помнить, что, по данным аналитиков, большинство инцидентов происходит в результате влияния человеческого фактора, а проще говоря – «инсайдеров», т. е. сотрудников, имевших доступ к важной информации и по незнанию, легкомыслию либо злому умыслу ставших виновниками ее утечки. Если данные хранятся в «облаке», тогда ответственность за обеспечение безопасности переносится на провайдера облачных услуг в соответствии с Договором об уровне услуг (SLA)».
Вопрос выбора места хранения данных не столь однозначен. Так, Юрий Барабанщиков, руководитель отдела ЦОД компании «ЛАНИТ-Интеграция», считает, что «на текущий момент наиболее надежным способом защиты критически важных данных для компании будет строительство хранилища у себя». «Обеспечить защищенность помогут закрытый контур и физическая изоляция, шифрование и аудит доступа, а также строгая политика безопасности и реализация мер защиты от социальной инженерии, – продолжает эксперт. – Не стоит забывать о защите от техногенных катастроф и банальных поломок оборудования, например, резервировании и хранении копий данных на отчуждаемых носителях».
С ним согласен руководитель направления инфраструктурных решений ИБ «Астерос» Кирилл Уголев: «Сложно одержать победу в игре, где правила меняешь не ты. Это выражение особенно актуально в отношении хранения информации с помощью облачных сервисов. Пользователь не может полностью контролировать то, что происходит с его данными в «облаке»: информация может быть утрачена, скомпрометирована, ограничена в доступе и т. д. Когда вопросы безопасности полностью зависят от сторонней структуры, в данном случае облачного провайдера, то надеяться на полноценную защиту крайне сложно».
С другой стороны, «если каждый будет выстраивать частные «облака», в этом нет большого смысла, так как с точки зрения управления и поддержания работоспособности требует определенных ресурсов, и для этого необходимо множество инструментов», считает Михаил Саркисов, руководитель направления «Системы резервного копирования и восстановления данных» Dell EMC в России и странах СНГ.
«Для комплексного решения нужна политика, сочетающая оба метода, так как каждый из них имеет свои преимущества и недостатки. Доступность облачной копии является и недостатком, ведь скорость ее восстановления и выгрузки напрямую зависит от возможностей вашего интернета, и, кроме того, присутствует небольшой шанс повреждения данных, – считает Кирилл Каширин, менеджер пользовательских проектов Paragon Software Group. – Например, при облачном хранении данные всегда находятся у вас под рукой, но до тех пор, пока у вас есть доступ к Сети. В случае, если Сеть недоступна, лучше иметь резервную локальную копию. И, наоборот, при утере локальной копии подстрахуйтесь облачным хранилищем».
Мы предоставим оборудование для развертывания в дата-центре заказчика публичного «облака» Oracle, что даст три главных преимущества: перевод капитальных затрат в операционные, соответствие требованиям российского законодательства и внутренней безопасности и исключение влияния каналов связи на производительность систем. Даже при очень больших объемах данных и серьезных пиковых нагрузках необходимые вычислительные мощности будут предоставляться бесперебойно. Мы окажем помощь в интеграции такого «облака» в корпоративный дата-центр, адаптации, конфигурации и переносе баз данных и приложений на новую облачную платформу. Специальные разработанные нами модели покажут, какие именно фрагменты ИТ-инфраструктуры следует перенести в облачную среду для получения максимального экономического эффекта».
Эволюция данных
Раньше основными производителями данных в мире были частные пользователи. К 2025 году, согласно докладу IDC и Seagate, ситуация изменится: 60% информации в мире будут генерировать коммерческие предприятия. Благодаря огромному количеству данных у их руководителей появится множество полезных возможностей для роста и расширения бизнеса. Однако организациям придется решать, какие из данных сохранять и каким образом ими управлять. «Исследование подтверждает, что эпоха «больших данных» – на пороге расцвета. Однако основная ценность данных не в том, что мы знаем, а в том, чего мы не знаем, и этот потенциал мы на сегодняшний день серьезно недооцениваем», – подчеркивает генеральный директор Seagate Стив Луццо (Steve Luczo).
«Увеличившийся объем данных позволяет производить более точный анализ информации о мире вокруг нас, способствует выявлению шаблонов поведения пользователей, помогает автоматизации рутинных операций в быту, позволяет улучшить качество медицины, а также применять автоматизированный поиск закономерности среди событий окружающего мира», – считает Юрий Барабанщиков.
«Само появление и дальнейшее развитие нейронных сетей является следствием постоянно увеличивающегося объема данных: в науке, производстве, бизнесе, здравоохранении и т. д. Зависимость здесь прямая. Для того чтобы в огромном потоке разрозненной информации находить важные, наиболее востребованные данные, без механизма самообучения не обойтись. Сами того не замечая, мы ежедневно пользуемся результатами практической реализации технологии искусственного интеллекта: голосовыми интернет-помощниками, электронными переводчиками, сервисами рекомендаций и многим другим. Например, на основе нейронных сетей Яндекс вывел на новый уровень персонализацию выдаваемого контента в соответствии с интересами пользователя. Но это достаточно простой пример. В мире уже появились первые беспилотные автомобили с искусственным интеллектом, которые способны автономно передвигаться с помощью машинного зрения. И это лишь малая часть того, как сегодня реализуется потенциал искусственного интеллекта, области применения которого гораздо шире и разнообразнее», – дополняет картину Кирилл Уголев.
Согласно исследованию IDC и Seagate, масштабные тенденции, связанные с наступающей эпохой «больших данных», затрагивают практически все существующие компании. Первенство в области создания информации переходит от потребителей к предприятиям благодаря нескольким факторам:
– Превращение данных из «фона» бизнес-деятельности в жизненно важный актив. К 2025 году почти 20% всей информации в глобальной инфосфере будут играть критически важную роль в повседневной жизни, а примерно 10% этих данных будут «сверхкритичными».
– Встроенные системы и интернет вещей. К 2025 году среднестатистический житель Земли будет взаимодействовать с подключенными в сеть устройствами примерно 4800 раз в день: по одной процедуре взаимодействия каждые 18 секунд.
– Обучение машин меняет экономический ландшафт. По прогнозу IDC, доля глобальной инфосферы, подвергаемой анализу, к 2025 году вырастет по сравнению с нынешней в 50 раз, достигнув 5,2 Збайта.
– Мобильные данные и информация, получаемая в режиме реального времени. К 2025 году почти 20% генерируемых данных будут представлять собой информацию, получаемую в режиме реального времени, причем более 95% составят данные, поступающие от устройств интернета вещей.
– Технологии автоматизации и межмашинного взаимодействия – главные конкуренты традиционных источников в области создания данных. Если в предыдущую декаду данные создавались преимущественно за счет роста объемов развлекательного контента, то в предстоящее десятилетие главными источниками информации станет бизнес-деятельность, а также производство изображений и видеозаписей неразвлекательного характера – например, генерируемых системами видеонаблюдения и производимых рекламодателями.
Такой рост объема данных дает колоссальные возможности по использованию нейронных сетей и других инструментов, но и ставит человечество в зависимость от этих самых данных.
Есть что терять
«В век, где информация на вес золота, тенденция к шифрованию данных – следствие вопроса безопасности облачного хранилища, – отмечает Кирилл Каширин. – Все больше пользователей обеспокоены тем, что их персональная информация попадет к третьим лицам, поэтому каждая уважающая себя компания, работающая в области ИТ, занимается работой над шифрованием своих данных».
«Среди предлагаемых решений Dell EMC – платформы защиты данных на основе продуктовой линейки Data Domain, которые обеспечивают прозрачную интеграцию с существующей средой и осуществляют резервное копирование на диски, архивирование и аварийное восстановление при помощи высокоскоростной дедупликации (технология, при помощи которой обнаруживаются и исключаются избыточные данные в дисковом хранилище. – «Профиль»), – говорит Михаил Саркисов. – Эти платформы дополняются программным обеспечением и операционной системой Data Domain, а также аппаратными и программными решениями для долгосрочного хранения данных Elastic Cloud Storage».
«Потеря информации приведет к революционной деградации человечества», – дает нерадостный прогноз Илья Вислоцкий, руководитель департамента разработки Stack Group. «Благодаря тому, что информация многократно задублирована, вероятность наступления этого события крайне мала. Это событие подойдет для темы заголовка постапокалиптической книги: «Вся информация была в марсианском «облаке», и тут человечество забыло заплатить…».
«Как и любая зависимость, она повышает нашу уязвимость – ментальную, психологическую и эмоциональную», – комментирует Александр Антипов из «Ай-ФОРС». «Мы зависим не столько от данных, сколько от желания оставаться постоянно «включенными» – иметь возможность выйти в интернет, общаться в соцсетях, отвечать на мгновенные сообщения и электронную почту. В истории человечества никогда еще не было такой жажды социальной включенности вне зависимости от места и времени, – считает он. – А посредником выступают электронные носители, гаджеты, которые могут теряться, выходить из строя, шпионить и доставлять весьма ощутимые неприятности своим владельцам. Цифровой мир таит массу опасностей, начиная с выхода из строя систем жизнеобеспечения и заканчивая массовой утерей данных, что грозит полным коллапсом, например, в финансовой системе».
Безусловно, прав Дейв Рейнсел (Dave Reinsel), старший вице-президент IDC, когда говорит, что «данные – это двигатель современного цифрового мира и его составляющих, от интеллектуальных персональных программных агентов до беспилотных автомобилей. Создаются новые возможности, которые раньше трудно было даже представить. Ключевую роль в анализе гигантских объемов доступной информации и извлечении максимальной пользы из нее будут играть технологические инновации. Особенно значимой станет роль средств хранения, которые являются фундаментом множества современных аналитических технологий».
Но при всей этой тенденции Александр Антипов сделал очень точное замечание: «Важно на пути цифровизации не доходить до предела, сохранять какие-то материальные носители, пока мы не стали цифровыми копиями самих себя».
Читайте на смартфоне наши Telegram-каналы: Профиль-News, и журнал Профиль. Скачивайте полностью бесплатное мобильное приложение журнала "Профиль".