Нажмите «принять», если вы соглашаетесь с условиями обработки куки‑файлов/cookie-файлов и данных о поведении на сайте, нужных нам для аналитики. Запретить обработку куки‑файлов/cookie-файлов можно через браузер
Принять
Nova
Flex Loader
SDI
Lakehouse-платформа данных нового поколения: высокая производительность при минимальных затратах
Инструмент для быстрого наполнения хранилища или озера данных на базе GreenPlum, Hadoop или S3
Low-code инструмент для потоковой обработки и репликации данных
UI Deploy — установка и обновление Data Ocean, UI Control — администрирование платформы, UI Explore — пользовательская self-service среда анализа данных
Platform UI
Высокопроизводительное объектное хранилище данных для аналитики
Data Ocean Store
Узнайте больше о решениях Data Ocean
Ответим на все ваши вопросы и поможем определиться с выбором
Пишите нам:

Только полезное и ничего лишнего

Раз в две недели — только ценная аналитика. Самые важные и интересные новости в одном письме.
/
/
Оптимизации функционала Apache Iceberg...

Оптимизации функционала Apache Iceberg в задачах real-time загрузки и обработки данных

16.12.2025
В блоге Data Sapience на Habr вышла новая статья.
Технические лидеры направления разработки Apache Spark в составе платформы Data Ocean Андрей Первушин и Дмитрий Паршин рассказывают, с какими проблемами можно столкнуться при реализации Upsert Streaming в Iceberg, что такое equality delete, почему они создают нагрузку при чтении таблиц в Apache Iceberg и как мы оптимизировали Apache Spark, чтобы снизить потребление памяти и ускорить чтение данных.

Вам может быть интересно