Nova
Flex Loader
Cluster Manager
Lakehouse-платформа данных нового поколения: высокая производительность при минимальных затратах
Инструмент для быстрого наполнения хранилища или озера данных на базе GreenPlum, Hadoop или S3
Программное обеспечение для администрирования кластеров и анализа запросов
Узнайте больше о решениях Data Ocean
Ответим на все ваши вопросы и поможем определиться с выбором
Пишите нам:
Data Sapience запустил новостной дайджест!

Только полезное и ничего лишнего

Раз в две недели — только ценная аналитика.
Самые важные и интересные новости в одном письме.
/
/
«Апельсин» совместно с GlowByte внедрил...

«Апельсин» совместно с GlowByte внедрил решения Data Ocean Nova и Data Ocean Governance DQ вендора Data Sapience

27.06.2025
Сервис «Апельсин» совместно с интегратором GlowByte внедрил lakehouse-платформу данных Data Ocean Nova и решение для управления качеством данных Data Ocean Governance DQ вендора Data Sapience.
Созданное на основе этих продуктов централизованное хранилище стало основой для оперативного анализа и построения отчетности, значительно ускорив процессы принятия решений и улучшив бизнес-аналитику. Были реализованы механизмы управления качеством данных, что обеспечило их полноту, точность и актуальность.

За время реализации проекта специалисты GlowByte развернули в инфраструктуре клиента lakehouse-платформу и BI-систему, создали и наполнили озеро данных, подключив все необходимые источники, настроили основные проверки, реализовали фреймворк обработки и трансформации данных, предоставили доступы пользователям. В BI-системе были созданы необходимые дашборды для формирования отчетности по ключевым KPI.

В основу новой ИТ-архитектуры легла универсальная lakehouse-платформа Data Ocean Nova, которая решает комплексные задачи массивно-параллельной обработки: от сырых данных до агрегированных таблиц, предоставляя возможность неограниченного масштабирования. Технология Trino используется для задач интеграции с источниками: несколькими базами PostgreSQL, кластером Hadoop, поставщиками данных по маркетинговым и поведенческим метрикам из сторонних сервисов. Процессинговый движок Impala выполняет трансформацию информации и формирует ODS/EM-слои, одновременно служа движком для интерактивного SQL-анализа больших объемов, обеспечивая аналитикам быстрый отклик сложных аналитических запросов. Благодаря Apache Superset бизнес-пользователи самостоятельно создают и просматривают интерактивные дашборды, применяют фильтры и делятся отчетами. Data Ocean Governance DQ отвечает за контроль полноты, согласованности и актуальности информации, сигнализируя о любых проблемах в потоках ETL.

Оперируя информацией из разных источников, платформа позволяет создавать профиль клиента. В его структуре — сведения о покупательском поведении, финансовых операциях, телеком-услугах и страховых предпочтениях. Ранее такой подход был невозможен из-за разрозненности информации. Теперь же открываются новые горизонты для персонализации услуг, более точного таргетинга и оперативного принятия бизнес-решений.

В будущем планируется масштабирование хранилища по мере роста объемов и появления новых источников информации. Такая гибкость позволит компании управлять большими массивами без потери скорости и качества анализа. Развитая аналитика поможет «Апельсину» выявлять новые сегменты клиентов, точнее понимать их потребности и усиливать персонализацию. В итоге организация привлечет новых клиентов и повысит лояльность существующих. Наличие централизованной платформы открывает возможности для внедрения передовых технологий, связанных с машинным обучением и искусственным интеллектом. Это позволит не только оптимизировать текущие процессы, но и предсказывать будущие тренды, повышая конкурентоспособность компании на рынке.
Сама суть механики нашего сервиса лояльности подразумевает работу с клиентом и его профилем 360° - этот бизнес невозможен без информации и современных инструментов для ее обработки и доставки. Мы начинали работу на распределенных хранилищах наших партнеров, но очень быстро столкнулись с проблемами доступа к информации, ограниченностью локальных хранилищ и отсутствием централизованных и сопоставимых сведений. Появление собственных каналов — сайт и мобильное приложение, а также интеграционных сервисов, связывающих всех партнеров, обусловило возникновение наших собственных уникальных массивов и создало предпосылки для создания собственного хранилища. Далее перед нами стояла задача максимально быстро и с использованием современных технологий построить свое хранилище и дать полезные инсайты нашему бизнесу. Наши партнеры GlowByte и Data Sapience вместе с нами приняли этот вызов и превосходно справились с внедрением. Отличный продукт и компетентная команда дали синергию и открыли новые возможности для аналитики, появились идеи для новых механик развития наших продуктов.
Руслан Ахмедов, директор по технологическому развитию, сервис «Апельсин»
При выборе решения для обработки наших массивов мы искали платформу, которая эффективно использовала бы инфраструктуру частного облака и изначально включала все необходимые инфраструктурные компоненты и сервисы работы с информацией. Нам была нужна система, способная обрабатывать массивы из различных отраслей, включая ритейл, банковский сектор и телекоммуникации. Data Ocean Nova оказалась лучшим решением на рынке, предоставляющим все необходимые сервисы в едином комплексе: от озера данных и средств трансформации до инструментов контроля качества и визуализации. Теперь мы можем значительно быстрее принимать бизнес-решения, что открывает новые возможности для персонализации услуг наших клиентов.
Софья Цховербадзе, CDO, сервис «Апельсин»
GlowByte с помощью решений Data Sapience смог усовершенствовать ИТ-инфраструктуру «Апельсина», сделав ее еще более устойчивой и эффективной. Внедрив lakehouse-платформу Data Ocean Nova, мы смогли решить вопрос масштабирования и создать единое пространство для аналитики. Мы также внедрили Apache Superset в качестве BI-системы и интегрировали его с платформой в рамках проектных работ, что позволило бизнес-пользователям самостоятельно создавать интерактивные дашборды и формировать отчетность по ключевым KPI. Новая архитектура позволяет решать текущие задачи клиента без сложностей и рисков — от интеграции разнородных источников до построения устойчивых аналитических процессов. Благодаря синергии команд заказчика, интегратора и вендора удалось достичь отличных результатов в максимально сжатые сроки. Это заложило фундамент для будущего развития аналитических возможностей.
Данил Побирский, менеджер проектов, GlowByte
В рамках совместного проекта «Апельсин», GlowByte и Data Sapience удалось разработать новую ИТ-архитектуру, способную вывести бизнес-процессы компании на новый уровень. Lakehouse-платформа Data Ocean Nova и решение Data Ocean Governance DQ стали технологической основой системы, объединив в централизованном хранилище информацию, необходимую для развития бизнеса. «Апельсин» получил инструмент для отслеживания качества информации, мгновенной аналитики, точных решений и беспрецедентной персонализации услуг. Мы гордимся, что наши решения помогают создавать будущее лояльности.
Алексей Рундасов, коммерческий директор Data Sapience

Вам может быть интересно