Увидела свет открытая система обработки терабайтных массивов информации - CloudB

Автор turbo, 23 Ноября 2008, 17:42

« предыдущая тема - следующая тема »

0 Пользователей и 1 Гость просматривают эту тему.

turbo

Разработчик CloudBase, высокопроизводительного менеджера данных с открытым исходным кодом, компания Business.com объявила о выходе под лицензией GPLv2 релиза CloudBase. Система спроектирована для работы на «обычном железе» и поддерживает распределенную сетевую архитектуру. Основное ее предназначение -- это предоставление малобюджетным компаниям высокоэффективных сервисов бизнес анализа.

Построенная с использованием технологии Map-Reduce, CloudBase может обрабатывать терабайтные и петабайтные массивы информации, и позволяет составлять запросы к обычным плоским текстовым log-файлам в формате ANSI SQL. Текущая реализация алгоритма Map-Reduce основана на базе наработок проекта Apache Hadoop. CloudBase имеет в своем составе драйвер JDBC, что позволяет выбрать любую подходящую графическую оболочку, позволяющую формировать SQL-запросы.

Среди других возможностей заявлена поддержка следующих функций:

    * Возможность сохранения результатов выборок в СУБД.
    * Реализованы функции String, Date и Time как описано в спецификации JDBC.
    * В запросы с LIKE можно вставлять регулярные выражения.
    * Возможность использовать подзапросы и представления (VIEW).
    * Возможность использовать условные модификаторы Order by, Group By и Having.

Подобная открытая система в сегодняшних экономических условиях может оказаться востребованной как малыми интернет и e-commerce бизнесами, которые не могут себе позволить содержать сложные RDBMS системы, так и крупными провайдерами интернет сервисов. Существующие решения для бизнес анализа, использующие ANSI SQL могут начинать использовать CloudBase без необходимости внесения изменений в существующее ПО.
http://www.opennet.ru/opennews/art.shtml?num=19041