Nova
Flex Loader
SDI
Lakehouse-платформа данных нового поколения: высокая производительность при минимальных затратах
Инструмент для быстрого наполнения хранилища или озера данных на базе GreenPlum, Hadoop или S3
Low-code инструмент для потоковой обработки и репликации данных
Программное обеспечение для администрирования кластеров и анализа запросов
Cluster Manager
Узнайте больше о решениях Data Ocean
Ответим на все ваши вопросы и поможем определиться с выбором
Пишите нам:

Только полезное и ничего лишнего

Раз в две недели — только ценная аналитика.
Самые важные и интересные новости в одном письме.
/
/
Проблема маленьких файлов...

Проблема маленьких файлов. Оценка замедления S3 и проблем HDFS и Greenplum при работе с ними

27.08.2025
В блоге Data Sapience на Habr вышла новая статья.
Рассказываем о результатах исследования проблемы маленьких файлов в распределенных системах вычислений, демонстрируем зависимость производительности от размера файла популярного решения объектного хранилища minIO и сравниваем результаты с другими аналогичными тестированиями. Наглядно показываем, почему архитектурные решения HDFS и Greenplum не приспособлены к задачам интенсивной загрузки данных в реальном времени.

Вам может быть интересно