Нажмите «принять», если вы соглашаетесь с условиями обработки куки‑файлов/cookie-файлов и данных о поведении на сайте, нужных нам для аналитики. Запретить обработку куки‑файлов/cookie-файлов можно через браузер

Принять

Nova

Flex Loader

SDI

Lakehouse-платформа данных нового поколения: высокая производительность при минимальных затратах

Инструмент для быстрого наполнения хранилища или озера данных на базе GreenPlum, Hadoop или S3

Low-code инструмент для потоковой обработки и репликации данных

UI Deploy — установка и обновление Data Ocean, UI Control — администрирование платформы, UI Explore — пользовательская self-service среда анализа данных

Platform UI

Высокопроизводительное объектное хранилище данных для аналитики

Store

Подписаться на дайджест

Узнайте больше о решениях Data Ocean

Ответим на все ваши вопросы и поможем определиться с выбором

Пишите нам:

info@dataplatform.ru

Data Sapience запустил новостной дайджест!

Только полезное и ничего лишнего

Раз в две недели — только ценная аналитика. Самые важные и интересные новости в одном письме.

[{"lid":"1725607971367","ls":"10","loff":"","li_parent_id":"","li_type":"em","li_ph":"Email","li_name":"Email","li_req":"y","li_inputwidth":"1","li_nm":"Email"},{"lid":"1725608128179","ls":"20","loff":"","li_parent_id":"","li_type":"cb","li_label":"\u041e\u0437\u043d\u0430\u043a\u043e\u043c\u043b\u0435\u043d (\u0430) \u0438 \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u044e \u0443\u0441\u043b\u043e\u0432\u0438\u044f <a href=\"\/privacy-policy\" style=\"color: rgb(43, 0, 165);\">\u041f\u043e\u043b\u0438\u0442\u0438\u043a\u0438 \u043a\u043e\u043d\u0444\u0438\u0434\u0435\u043d\u0446\u0438\u0430\u043b\u044c\u043d\u043e\u0441\u0442\u0438*<\/a>","li_name":"privacy-policy","li_req":"y","li_nm":"privacy-policy"},{"lid":"1772790939804","ls":"30","loff":"","li_parent_id":"","li_type":"cb","li_label":"\u0414\u0430\u044e \u0441\u0432\u043e\u0435 <a href=\"\/data-policy\" target=\"_blank\" rel=\"noreferrer noopener\" style=\"color: rgb(43, 0, 165);\">\u0441\u043e\u0433\u043b\u0430\u0441\u0438\u0435 \u043d\u0430 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0443 \u043f\u0435\u0440\u0441\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445*<\/a>","li_name":"data-policy","li_req":"y","li_nm":"data-policy"},{"lid":"1772790941345","ls":"40","loff":"","li_parent_id":"","li_type":"cb","li_label":"\u0425\u043e\u0447\u0443 \u043f\u043e\u043b\u0443\u0447\u0430\u0442\u044c \u0440\u0430\u0441\u0441\u044b\u043b\u043a\u0438 \u0438 \u043f\u0438\u0441\u044c\u043c\u0430 \u043e\u0442 Data Ocean. \u0421\u043e\u0433\u043b\u0430\u0441\u0438\u0435 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u0434\u043b\u044f \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u0438\u044f \u0443\u0432\u0435\u0434\u043e\u043c\u043b\u0435\u043d\u0438\u0439 \u043e\u0431 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0438 \u0438 \u043d\u043e\u0432\u043e\u0441\u0442\u044f\u0445, \u0432\u044b \u0432\u0441\u0435\u0433\u0434\u0430 \u043c\u043e\u0436\u0435\u0442\u0435 \u043e\u0442\u043f\u0438\u0441\u0430\u0442\u044c\u0441\u044f","li_name":"rassylka","li_nm":"rassylka"}]

Универсальная
Lakehouse-платформа
данных нового поколения

Запросить демо

Главная

Продукты

Nova

Преимущества

Ниже чем у MPP и Hadoop, но при кратно большей производительности

Самое низкое ТСО на рынке

Создавайте и масштабируйте оперативный слой данных (ODS) в режиме реального времени

Готовое решение для real-time задач

Lakehouse — это замена классических систем массивных параллельных вычислений и озёр данных на базе экосистемы Hadoop

Универсальность

Независимое масштабирование за счёт разделения слоя хранения и слоя вычислений

Гибкость

Data Ocean Nova обеспечивает принцип доменного разделения Data Mesh в едином инфраструктурном подходе

Data Mesh

Возможность инсталляции в публичном и частном облаке, on-premise, а также при гибридном подходе

Простая инсталляция

Реализует функционал федеративного доступа данных и виртуального хранилища

Доступность данных

Бесшовная работа с вашими CRM- и ML-платформами

Реализация среды вычислений для внешних систем

Отличия платформы Data Ocean Nova от Open Source ПО

Узнать подробнее

Решения Data Ocean — оптимальный выбор, если:

Вы ориентируетесь на современные подходы организации платформ данных с перспективой на годы вперед

Вы хотите решить задачу по импортозамещению без потери качества

Вы ищете универсальную систему для массивно-параллельной обработки данных

Вы осознаете риски open source проектов и сложности их поддержки и развития

Ваш объем данных исчисляется в терабайтах

Архитектура решения

Узнать подробнее

•Потребители и сервисы

•Nova Lakehouse

•Batch

•Real-time

Функционал Data Ocean Nova

Процессинговые движки и фреймворки

Хранение данных

Iceberg используется в качестве табличного формата хранения реляционных данных. Реализует ACID-подход, эволюцию метаданных, data time travel операции.

Для on-premise установки используется любая существующая реализация объектного хранилища, удовлетворяющая требованиям решаемой задачи.
В случае отсутствия готового сервиса в инфраструктуре S3 вместе с платформой поставляется и поддерживается решение Data Ocean Store.

S3 как единое хранилище всех данных платформы.
Для облачной установки используется доступный сервис провайдера.

Spark — фреймворк для решения любых задач в области данных. Для ускорения вычислений используется DataFusion Comet. При необходимости оркестрации ресурсов Spark-приложений используется планировщик YuniKorn.

Trino — SQL-движок федеративных запросов, альтернатива Impala и StarRocks.

Impala и StarRocks — быстрые и эффективные SQL-движки массивной параллельной обработки данных в сценариях высоко конкурентного доступа и BI-задач анализа данных.

Система Data Ocean Nova отвечает всем требованиям информационной безопасности уровня Enterprise. Среди наших клиентов — финансовые организации, выполняющие самые строгие требования регуляторов.

В решении реализована единая ролевая модель, которая распространяется на все сервисы и движки, включая объектное хранилище, а также интеграция с LDAP-каталогом предприятия. Все компоненты Data Ocean Nova интегрированы с платформенным сервисом Keycloak, выполняющим роль IAM. SQL-запросы имеют JWT-аутентификацию. Продукт обладает общей системой журналирования событий информационной безопасности.

Преднастроенные тонкие веб-клиенты решают все основные задачи работы с данными, поддерживают процессинговые движки и фреймворки, входящие в решение.

Система может работать с любыми внешними клиентами и аналитическими приложениями посредством стандартных JDBC-, ODBC- и ADBC-подключений.
При работе с ноутбуками пользователи имеют возможность в рамках своей сессии запускать экземпляр DuckDB как инструмент ускорения аналитики последней мили.

Информационная безопасность

Клиентские подключения

Решение может быть установлено в окружении публичного облака. В этом случае задействуются готовые сервисы от оператора (managed S3, Kubernetes и другие), входящие в состав окружения.

При on-premise установке используются инфраструктурные решения технологических партнеров, либо выполняется подготовка окружения Kubernetes на базе opensource ПО и настройка всех инфраструктурных компонент для максимальной производительности системы.

В составе решения поставляется веб-приложение Data Ocean Platform UI, предназначенное для установки в среде контейнеризации, управления системой, заданиями автоматического самообслуживания и мониторинга состояния. Приложение имеет отдельное пользовательское представление «self-service рабочее место инженера данных».

Продукт обладает множеством преднастроенных дашбордов мониторинга компонент: от инфраструктуры до метрик отдельных сервисов.

Инфраструктура

Управление

Популярные вопросы

Lakehouse-платформа данных — комплексное решение, закрывающее весь спектр задач обработки данных. На практике это означает, что использование только Trino или Spark не покрывает всех потребностей пользователей и разработчиков, а попытка самостоятельно надстроить к вендорскому решению новый компонент приводит к проблемам. Data Ocean Nova обеспечивает согласованную работу всех фреймворков и движков, имеет общий метакаталог данных и единую ролевую модель. Также зрелая Lakehouse-платформа должна предоставлять готовые сервисы обслуживания объектного хранилища и табличного формата данных, иметь функционал автоматической оптимизации объектов хранилища, механизмы автомасштабирования и поддерживать мультитенантный подход, при котором любой фреймворк или движок может иметь несколько кластеров, каждый из которых оперирует своими изолированными ресурсами. В случае с Data Ocean Nova все эти возможности реализованы в полном объеме.

Кроме того, команда платформы вносит существенные изменения в исходный код технологий, на которых основано решение, для улучшения функциональных возможностей и производительности.
Со всеми изменениями можно ознакомиться по ссылке.

Зачастую решения, собранные самостоятельно, закрывают только функциональные задачи и основываются на готовых сторонних образах, что подразумевает зависимость от исправления ошибок и внесения изменений контрибьютерами. Также самостоятельные «конструкторы», как правило, слабо отвечают требованиям информационной безопасности. Выбирая наше решение, вы исключаете риск остаться один на один с проблемами.
Коллектив Data Ocean Nova, в отличие от команд DevOps, которые собирают ПО из открытого кода:

Имеет огромный практический опыт построения высоконагруженных систем обработки данных на технологиях, которые используются в нашем Lakehouse-решении;
Вкладывает эти знания и опыт в конечный продукт и уровень сервиса, что создает высокую и уникальную добавленную стоимость. Вы получаете не просто платформу, а готовые рецепты для решения внутренних задач;
Не только правит ошибки, но и вносит улучшения в компоненты, отсутствующие в открытом сообществе, и создает дополнительные сервисы, определяющие добавленную стоимость.

Детали о продукте — по ссылке.

Data Sapience входит в группу компаний GlowByte, реализующую проекты по всему миру. Мы имеем широкий практический кругозор и понимание мировых трендов.

Выбирая Data Ocean Nova, вы выбираете экспертизу и накопленный опыт 2500 специалистов!