Смерть «больших данных». Кто на новенького?

Смерть «больших данных». Кто на новенького?
Mr. Pixel
Mr. Pixel
7 апреля
0
1 110

«Больших данных» больше нет. Они пали жертвой спекуляции. Лидеры индустрии, как, впрочем, и весь цифровой мир, тоже постарались, но основная доля вины за медленную и мучительную смерть одного из самых раскрученных, переоцененных, но недопонятых терминов (после фразы «облачное программирование») лежит именно на тех, кто продавал под ярлыком «Big Data».

Любой поставщик ПО или хранилищ для больших и малых объемов информации сегодня заявляет, что он специализируется на больших данных, даже если технология устарела лет на пять. Что интересно, это срабатывает (спасибо маркетингу!). Стартапы тоже активно приобщаются к big data-культуре, в обязательном порядке добавляя эти волшебные слова к названию любого своего продукта.

Словосочетание «big data» полностью утратило свой смысл. Одно только упоминание больших данных вызывает у старичков индустрии большую головную боль и потребность в большом количестве анальгина.

Вот несколько подтверждений:

«Время от времени появляется термин, который всем настолько нравится, что из «информативного» он сначала превращается в «избитый», а потом становится попросту «никчемным». «Big data» – яркий тому пример», Роджер Эренберг.

«Каждый продукт любого бренда сегодня поддерживает «большие данные»… А каждый «лидер индустрии» непременно включает эту фразу в название доклада и считает своим долгом повторять ее каждые 5 минут», Роб Клопп.

«Термин «большие данные» перестал быть технологической категорией. Сегодня это пустой звук», Барри Девлин.

Одним словом, прощай, Big data, здравствуй, новая жизнь.

С уходом в небытие больших данных исчезнет и господство их главных атрибутов - так называемых, «трёх V»: объема (volume), скорости (velocity) и разнообразия (variety). Уже не нужно будет стремиться совместить в одном процессе всё и сразу. На смену этим принципам придут нишевые технологии для решения узкоспециализированных задач. Можно сказать, что это будут различные срезы «больших данных», только более детальные и направленные.

Что это за технологии и ниши? Какие новые жаргонизмы, скорее всего, будут на слуху в 2013? Читаем ниже.

Умные данные

Многие теоретики, писатели, докладчики и исследователи индустрии используют сегодня этот термин для обозначения продуктизации данных с помощью предсказательной аналитики.

Суть в том, что компаниям бывает недостаточно обычной бизнес-аналитики, они хотят монетизировать огромные объемы машинных данных методами предсказательной аналитики (основанной на компьютерном моделировании и последних разработках из сферы статистики). Использование этой модели в конечном итоге увеличивает прибыль для брендов, поскольку отвечает за такие возможности как борьба с мошенничеством, рекомендации, персонализированные кампании, таргетированная реклама и т.д. Среди компаний, использующих умные данные, можно назвать Netflix, Amazon, Rich Relevance, Gravity, LinkedIn, SailThru и многие другие.

Наука о данных (Data Science)

Это новая сфера знания, интегрирующая продвинутые методы статистики, машинной и ручной обработки данных и компьютерных технологий с целью выявления закономерностей (иногда – с целью получения новых информационных продуктов, что, возможно, и легло в основу создания Data science). Термин пока не потерял своей значимости, хотя процесс обесценивания уже пошел. Metamarkets, к примеру, позиционируют себя как data science-платформу, хотя их главная технология сводится к обычной сегментации данных. То же самое делают все, кто знаком с SQL и MicroStrategy. В общем, риск того, что науку о данных постигнет участь big data, есть.

Новый SQL

NewSQL – термин, описывающий широкомасштабные SQL-системы с горизонтальной направленностью, такие как Drawntoscale, VoltDB, SpliceMachine, SQLFire, Impala, Redshift, Clustrix, NuoDB, Hadapt и многие другие. Эти решения объединяют возможности NoSQL-платформ с SQL в строгом соответствии с ACID-требованиями.  Появление NewSQL не означает, что NoSQL будет списан со счетов, просто теперь можно сделать обработку данных в рамках этой технологии более интегрированной. При этом, многим компаниям удобнее работать с нереляционной моделью и без гарантий ACID.

Предсказательная аналитика

Зная будущее, можно его изменить. Предсказательная аналитика, на которой держатся и умные данные, и data science, наконец обретает заслуженное признание. На самом деле, на ней основаны все последние разработки - от сервисов рекомендаций и обнаружения угрозы мошенничества в социальных сетях до прогнозирования поведения преступников после отбывания наказания. Предсказательная аналитика применяет методы статистики, машинного моделирования и другие алгоритмы выявления закономерностей.

Среди трендов, не вошедших в список, но заслуживающих внимания, стоит отметить нейролингвистическое программирование, потоковую обработку данных, анализ изображений и видео, машинное обучение, IMDB, грид-вычисления и графовые базы данных.

Жизнь после больших данных

Несмотря на то, что многие задачи, поставленные в свое время перед big data, актуальны и сегодня, принцип накопления и структурирования разноплановой информации в неограниченных объемах полностью утратил свою новизну.

Более того, спекуляция термином и его необоснованное использование сделали понятие шаблонным и почти бессмысленным.

Появление новых, более сложных и совершенных технологий хранения, обработки и использования данных говорит о том, что единого термина, который смог бы занять место «big data», скорее всего, не будет. Новая терминология должна отличаться более высокой точностью, сужать и конкретизировать понятия, делая их более информативными.

Добро пожаловать в новую эру! (И не забудьте пристегнуть ремни).

Комментарии к статье (0)