Созданное на основе этих продуктов централизованное хранилище стало основой для оперативного анализа и построения отчетности, значительно ускорив процессы принятия решений и улучшив бизнес-аналитику. Были реализованы механизмы управления качеством данных, что обеспечило их полноту, точность и актуальность.
За время реализации проекта специалисты GlowByte развернули в инфраструктуре клиента lakehouse-платформу и BI-систему, создали и наполнили озеро данных, подключив все необходимые источники, настроили основные проверки, реализовали фреймворк обработки и трансформации данных, предоставили доступы пользователям. В BI-системе были созданы необходимые дашборды для формирования отчетности по ключевым KPI.
В основу новой ИТ-архитектуры легла универсальная lakehouse-платформа
Data Ocean Nova, которая решает комплексные задачи массивно-параллельной обработки: от сырых данных до агрегированных таблиц, предоставляя возможность неограниченного масштабирования. Технология Trino используется для задач интеграции с источниками: несколькими базами PostgreSQL, кластером Hadoop, поставщиками данных по маркетинговым и поведенческим метрикам из сторонних сервисов. Процессинговый движок Impala выполняет трансформацию информации и формирует ODS/EM-слои, одновременно служа движком для интерактивного SQL-анализа больших объемов, обеспечивая аналитикам быстрый отклик сложных аналитических запросов. Благодаря Apache Superset бизнес-пользователи самостоятельно создают и просматривают интерактивные дашборды, применяют фильтры и делятся отчетами
. Data Ocean Governance DQ отвечает за контроль полноты, согласованности и актуальности информации, сигнализируя о любых проблемах в потоках ETL.
Оперируя информацией из разных источников, платформа позволяет создавать профиль клиента. В его структуре — сведения о покупательском поведении, финансовых операциях, телеком-услугах и страховых предпочтениях. Ранее такой подход был невозможен из-за разрозненности информации. Теперь же открываются новые горизонты для персонализации услуг, более точного таргетинга и оперативного принятия бизнес-решений.
В будущем планируется масштабирование хранилища по мере роста объемов и появления новых источников информации. Такая гибкость позволит компании управлять большими массивами без потери скорости и качества анализа. Развитая аналитика поможет «Апельсину» выявлять новые сегменты клиентов, точнее понимать их потребности и усиливать персонализацию. В итоге организация привлечет новых клиентов и повысит лояльность существующих. Наличие централизованной платформы открывает возможности для внедрения передовых технологий, связанных с машинным обучением и искусственным интеллектом. Это позволит не только оптимизировать текущие процессы, но и предсказывать будущие тренды, повышая конкурентоспособность компании на рынке.