Закрыть [x]

Перейти на мобильную версию

Ткань данных: особенности и перспективы

06.10.2021

Что такое «ткань данных» (data fabric) и нужна ли она каждому предприятию? Портал InformationWeek рассказывает об особенностях этой технологии, а также приводит прогнозы ведущих аналитических компаний по поводу ее развития и ориентировочные сроки, когда она начнет применяться в бизнесе.

Данные на предприятиях – это топливо, которое генерирует инсайты. Они позволяют быстрее предупреждать о мошенничестве, лучше понимать клиентов и глубже проникать в потенциальные источники ценности для бизнеса. Однако рост объемов данных ограничивает возможности хранилища данных, и анализировать их становится все сложнее. Сегодня существует много источников данных в разных местах. Часть информации поступает в режиме реального времени, другая –с задержкой. Часть данных – структурированна, часть – нет. Они хранятся как на серверах компании, так и в облаке.

Чтобы задействовать данные в аналитике и машинном обучении, их необходимо предварительно очищать и проверять, ими нужно управлять. Они должны быть интегрированы с приложениями, которые будут их использовать. Кроме того, вся эта работа «за кулисами» должна выполняться очень быстро. Ткань данных становится интеграционной концепцией, которая потенциально может связать источники данных.

Что такое ткань данных?

Говоря простым языком, ткань данных – это технологический слой, который находится между большим объемом всевозможных данных и приложениями, потребляющими эти данные, и позволяет им работать вместе без необходимости интеграции каждого отдельного потока данных с каждым приложением. Аналитик Omdia Брэдли Шиммин описывает этот термин как уровень API или уровень «данные как услуга» и отмечает, что ткань данных зависит от многих вещей, которые находятся под ней – принципов и практик DataOps.

Возможно, в прошлом для выполнения одной и той же работы специалисты по анализу данных или инженеры по данным управляли и поддерживали несколько конвейеров данных. По словам Шиммина, сейчас вся нагрузка ложится на каталоги данных. Но растущая сложность корпоративных данных и скорость, с которой организации хотят работать с ними, вызвали спрос на создание промежуточного слоя для управления этой работой. Однако насколько идея data fabric реально применима на типичном современном предприятии?

Полезная идея или хайп?

Хотя эта концепция, возможно, сейчас находится в центре внимания руководителей высшего звена, ориентированных на технологии, это не значит, что она в скором времени воплотится в реальность. В отчете Gartner 2021 Hype Cycle for Emerging Technologies ткань данных находится прямо на «пике завышенных ожиданий».

Организации признают ценность концепции ткани данных. Но это развивающаяся технология. Поставщики работают над решениями и встраивают ее компоненты в существующее ПО. Некоторые из них могут предложить решения, которые включают в себя многое из того, что должна делать ткань данных. Однако, по прогнозам Gartner, data fabric достигнет «плато продуктивности» только через 5-10 лет. А пока поставщики будут совершенствовать свои решения, а предприятия – тестировать их.

Согласно отчету «Enterprise Data Fabric Forrester Wave, Q2 2020» ткань данных представляет собой «горячий, развивающийся рынок». По мнению Forrester, лидерами на нем являются Talend, Oracle, SAP, Denodo Technology, Cambridge Semantics и IBM. В число сильных игроков вошли Qlik, Cloudera, DataRobot, Syncsort, Hitachi Vantara, TIBCO Software и InfoWorks. Претендентами оказались Informatica и Solix Technologies.

В то же время Gartner в своем «Magic Quadrant for Data Integration Tools-2020» года назвал лидерами следующие компании: Informatica, IBM, Talend, SAP, Oracle, Denodo и SAS.

Ткань данных в облаке

Игроки публичного облака тоже присматриваются к рынку. В мае Google объявила о предварительной версии Dataplex, которую она описывает как «интеллектуальную ткань данных, позволяющую организациям централизованно управлять, контролировать и регулировать свои данные в озерах, хранилищах и базах данных, создавая единый интегрированный опыт для автоматизации управления данными и масштабной аналитики». И эксперты, и бизнес хорошо понимают, почему это так важно. Дело не в самих данных. Речь идет о том, что данные могут сделать для предприятия. «Превращение данных в возможности – это ключ к цифровой трансформации», – заявил вице-президент и генеральный директор Google по базам данных и аналитике Геррит Казмайер.

Источник: itweek

Комментарии
Скрыть комментарии
Текст сообщения:
Защита от автоматических сообщений
Отправить