Вопросы и ответы
Потоковая пайплайн Google Cloud Data Fusion и задания Spark с пустыми строками
00
Вопрос или проблема У меня есть потоковый конвейер Google Cloud Data Fusion, который получает данные из Google Pub/Sub. Микробатчи выполняются каждые 5 секунд. Поскольку данные не всегда поступают постоянно, я вижу множество Spark Batch с 0 записями