Новости

2014 / 24.01

ПО для «больших данных»: десять самых заметных продуктов 2013 года

Объем информации, ее разнообразие и скорость поступления в информационные системы организаций росли экспоненциально. И соответственно рос спрос на передовые технологии сбора, анализа данных и управления ими.

Неудивительно, что это сопровождалось бурным ростом предложения новаторских продуктов для обработки «больших данных» как со стороны молодых стартапов, так и более известных вендоров.

Ниже кратко представлены продукты, которые привлекли внимание Тест-центра CRN в прошлом году. Надеемся, они будут полезны VAR`ам и их заказчикам.

0xdata H2O 2.0

Компания 0xdata разрабатывает ПО для проведения углубленного статистического анализа данных, накопленных в распределенной файловой системе Hadoop. В октябре компания представила вторую версию своего движка машинного самообучения и прогнозного анализа H2O. Компания стремится предоставить средства статистического анализа Big Data широким кругам бизнес-пользователей, возможно, не имеющих специальной подготовки. Ее учредителем является Шрисатиш Амбати (SriSatish Ambati) - сначала инженер в DataStax, а потом соучредитель Platfora; обе эти компании – ведущие разработчики ПО для Big Data.

ClearStory Data Intelligence

Компания ClearStory - разработчик платформы и прикладного ПО, которые помогают бизнес-пользователям в их повседневной работе с «большими данными», собранными из внутренних информационных систем организации и внешних источников, включая корпоративные базы данных, Hadoop и Интернет. Ее ПО, включающее функции коллективной работы и визуализации данных, дебютировало в октябре и в настоящее время доступно через программу пробного релиза.

Cloudera Enterprise 5

В октябре компания выпустила открытый бета-релиз своей платформы Cloudera Enterprise 5, а также новую версию дистрибутива Hadoop, CDH 5. Оба продукта включают последнюю версию набора свободного ПО Hadoop 2 от Apache. Среди самых заметных расширений в новой версии Enterprise 5 - объединенное администрирование для приложений третьей стороны, возможность кэширования-в-памяти массивов данных из распределенной файловой системы Hadoop (HDFS), а также улучшенное управление ресурсами для запуска нескольких платформ обработки и анализа данных на одном кластере. Последняя версия ПО включает ряд новых возможностей для администрирования и изучения «больших данных»; улучшена также защита данных благодаря поддержке «мгновенных снимков» в HDFS и HBase.

DataStax Enterprise 3.2

Появляется всё больше стартапов, оспаривающих позиции традиционных вендоров СУБД (прежде всего Oracle и Microsoft) своими предложениями баз данных следующего поколения на базе NoSQL. Компания DataStax стала одним из самых заметных игроков со своей БД DataStax Enterprise (DSE) на базе Apache Cassandra. В ноябре вышла ее новая версия DSE 3.2 - первая, как заявляет компания, СУБД NoSQL-типа со встроенными сервисами автоматического администрирования, которые позволяют ИТ-администраторам более эффективно управлять кластерами баз данных и оптимизировать их с учетом спроса пользователей. Компания подчеркивает и другие новшества на фоне баз данных NoSQL - впервые предложены обширные функции защиты и инструмент визуальной разработки для NoSQL.

Hortonworks 2.0

В октябре компания Hortonworks (главный соперник Cloudera в мире Hadoop) объявила о полной готовности своей платформы Hortonworks Data Platform (HDP) 2.0. Новый релиз ее коммерческого дистрибутива Hadoop для «больших данных» построен на последней версии Hadoop 2, недавно выпущенной сообществом Apache Software Foundation (ASF).
Существенным новшеством в этом релизе Hortonworks стало включение новой технологии Hadoop под названием YARN (Yet Another Resource Negotiator - «еще один согласователь ресурсов»), которая позволяет разработчикам использовать другие платформы программирования помимо MapReduce. В релизе Hortonworks 2.0 использована также технология из проекта Stinger того же ASF, увеличивающая скорость и объем поддержки семантики SQL средствами Apache Hive.

SQL on Hadoop (JethroData)

После двух лет разработки компания JethroData в октябре представила свою технологию SQL on Hadoop, которую называет первой аналитической СУБД, выполняемой прямо в среде Hadoop. Эта среда с ее распределенной файловой системой HDFS прекрасно справляется с хранением больших объемов данных, однако она не предназначалась для их анализа. СУБД от JethroData привносит индексирование и столбчатую структуру, которая требуется для осуществления запросов к этим данным. ПО уже готово к выпуску.

Platfora 3.0

После двух с лишним лет разработки и бета-тестирования компания Platfora в марте выпустила «родную» платформу бизнес-аналитики-в-памяти для Hadoop. За ней последовал крупный новый релиз, Platfora Big Data Analytics 3.0, в октябре. Главная ценность предложения в том, что эта технология дает возможность работать с данными непосредственно в Hadoop, без использования сложных систем хранилищ данных и средств извлечения, преобразования и загрузки (ETL). В версии 3.0 добавлена аналитика последовательности событий для анализа веб-журналов, журналов приложений, записей колл-центров и других аналогичных источников. Появился также каталог данных по объектам, позволяющий сгруппировать данные по каждому из них - заказчику, направлению бизнеса или продукту.

Splice Machine

Компания Splice Machine, учредителем и главным управляющим которой является Монт Цвебен (Monte Zweben), разрабатывает «единственную в отрасли», как она заявляет, базу данных SQL-on-Hadoop, выполняемую в реальном времени. В октябре компания предложила свое новое ПО в рамках программы ограниченного релиза. Splice Machine разрабатывает свою СУБД как альтернативу традиционным реляционным базам данных, таким как Oracle и IBM DB2, для транзакционных приложений обработки Big Data в реальном времени. На текущий момент лишь ограниченное число заказчиков оценивают данную технологию; они проверяют конкретные варианты использования, охват SQL и производительность, после чего продукт будет предложен всему рынку.

Splunk Enterprise 6 и Hunk

В октябре компания Splunk выпустила Splunk Enterprise 6, новый крупный релиз своей платформы оперативной аналитики в реальном времени для машинных данных. Благодаря новой технологии сводных таблиц и интерфейсу с «перетаскиванием» средства анализа и визуализации данных становятся доступны бизнес-пользователям, далеким от ИТ, и профессиональным аналитикам. Последняя версия включает расширения, которые ускорят выполнение, новые модели данных для представления исходных машинных данных и связей между ними, а также новый склад высокопроизводительных аналитических функций, которые, утверждает компания, позволят выполнять обработку почти в 1000 раз быстрее, чем в прежних версиях. Также, в октябре компания представила свой новый продукт Hunk (Splunk Analytics for Hadoop) для изучения и анализа данных, хранимых в кластерах Hadoop.

Sqrrl Enterprise 1.1

Компания Sqrrl была в центре внимания в прошлом году - отчасти благодаря своим учредителям, которые пришли из сверхсекретного Агентства национальной безопасности США, где принимали участие в создании мощной базы данных. Сама компания разрабатывает СУБД, масштабируемую и защищенную (с защитой на уровне ячеек), которая предназначена для обработки «больших данных». С выпуском версии 1.1 в июне продукт перешел со стадии ограниченного предложения в разряд общедоступных; были расширены его средства безопасности и аналитические функции.

http://www.crn.ru/news/detail.php?ID=88134

К списку новостей