Nova
Flex Loader
Cluster Manager
Lakehouse-платформа данных нового поколения решает задачи по работе с данными
Инструмент для быстрого наполнения хранилища или озера данных на базе GreenPlum, Hadoop или S3
Программное обеспечение для администрирования кластеров и анализа запросов
Узнайте больше о решениях Data Ocean
Ответим на все ваши вопросы и поможем определиться с выбором
Пишите нам:

Lakehouse
платформа данных нового поколения

/
Продукты
/
Nova

Преимущества

Ниже чем у MPP и Hadoop, но при кратно большей производительности
Самое низкое ТСО на рынке
Создавайте и масштабируйте оперативный слой данных (ODS) в режиме реального времени
Готовое решение для real-time задач
Lakehouse — это замена классических систем массивных параллельных вычислений и озёр данных на базе экосистемы Hadoop
Универсальность
Независимое масштабирование за счёт разделения слоя хранения и слоя вычислений
Гибкость
Data Ocean Nova обеспечивает принцип доменного разделения Data Mesh в едином инфраструктурном подходе
Data Mesh
Возможность инсталляции в публичном и частном облаке, on-premise, а также в гибридном подходе
Простая инсталляция
Реализует функционал федеративного доступа данных и виртуального хранилища
Доступность данных
Бесшовная работа с вашими CRM — и ML-платформами
Реализация среды вычислений для внешних систем

Решения Data Ocean — оптимальный выбор, если:

1
Вы ориентируетесь на современные подходы организации платформ данных с перспективой на годы вперед
2
Вы хотите решить задачу по импортозамещению без потери качества
3
Вы ищете универсальную систему для массивно-параллельной обработки данных
5
Вы осознаете риски open-source проектов и сложности их поддержки и развития
4
Ваш объём данных исчисляется в терабайтах

Архитектура решения

•Потребители и сервисы
•Nova Lakehouse
•Real-time
•Batch

Функционал Data Ocean Nova

Процессинговые движки и фреймворки
Хранение данных
Impala — cамый быстрый и эффективный SQL движок массивных параллельных вычислений
S3 — единое хранилище для всех данных платформы
Trino — SQL движок федеративных запросов
Для on-premise развёртывания используется реализация объектного хранилища данных или устанавливается решение minIO
Spark — фреймворк для решения любых задач в области данных
Iceberg используется в качестве табличного формата хранения реляционных данных, реализующего ACID подход, эволюцию метаданных, data time travel операции
Система отвечает требованиям информационной безопасности enterprise-уровня
В готовом решении устанавливаются преднастроенные тонкие веб-клиенты, поддерживающие процессинговые движки и фреймворки
Информационная безопасность
Пользовательские подключения
Решение может быть установлено в окружении публичного облака

В on-premise установке выполняется сайзинг, подготовка окружения и настройка всех инфраструктурных компонентов
В Data Ocean Nova входит большое количество разнообразных преднастроенных дашбордов мониторинга всех компонентов, начиная от инфраструктуры развёртывания, заканчивая метриками отдельных сервисов
Инфраструктура
Управление

Ответы на вопросы

Узнайте больше о решениях Data Ocean

Ответим на все ваши вопросы и поможем определиться с выбором
Пишите нам: