Вопрос или проблема
Надеюсь, кто-нибудь сможет помочь мне с рабочей проблемой, с которой я сталкиваюсь. У меня есть данные, включающие machineID, временные метки (UTC) и потенциал батареи для нескольких машин в течение 14 дней каждые 2 минуты.
Мне нужно проанализировать их временные ряды и определить, показывают ли они симптомы отключения батареи или нет.
Определение отключения батареи –
Отключения батареи
1. Сценарий 1:
Главный выключатель машины находится на отрицательной стороне батареи, вызывая внезапное падение напряжения или регистрацию плавающего напряжения из-за местоположения, где заканчивается силовой провод устройства.
2. Сценарий 2:
Главный выключатель машины находится на положительной стороне батареи. Из-за местоположения силового провода устройства при использовании выключателя напряжение внезапно падает до 0V и случайным образом возвращается к нормальному напряжению оборудования при эксплуатации.
Вот мой текущий подход –
Я анализировал данные о потенциале батареи в виде временных рядов, чтобы выявить значительные изменения или «события отключения». Процесс включает извлечение и группировку данных по серийным номерам оборудования и временным меткам, вычисление открытых и закрытых значений для последовательных временных точек и определение абсолютных различий между ними. Используя эти различия, для каждой машины рассчитываются динамические пороги на основе среднего значения и стандартного отклонения различий. Различия, превышающие порог, отмечаются, и отмеченные события агрегируются, чтобы сообщить об общем количестве событий отключения и первых и последних случаях для каждого устройства. Мы рассматриваем минимум 15 таких событий. Дайте знать ваши мысли.
Вот в чем проблема –
Распределение довольно интересно, так как оно настолько сильно сдвинуто. Прошло некоторое время с тех пор, как я последний раз работал с параметрической статистикой на наборах данных с ненормальным распределением, но что-то подсказывает мне, что порог не может быть определен таким образом, если распределение не приближается к нормальному. Я затрудняюсь разобраться в правильном подходе в этом случае. Возможно, имеет смысл исключить выбросы при расчетах пороговых значений?
Пожалуйста, помогите!
Ответ или решение
Определение отключения батареи — это важная задача, требующая глубокого анализа временных рядов данных о потенциале батареи. На основании предоставленной вами информации, ваша текущая методология анализа временных рядов для определения значительных изменений в уровне напряжения заслуживает уважения, но действительно может нуждаться в усовершенствованиях из-за ненормального распределения данных.
Подход к категоризации отключений аккумулятора
Анализ текущего подхода
-
Сбор и группировка данных: Аккумулирование данных по идентификаторам машин и временным меткам, что позволяет формировать основу для последующего анализа.
-
Определение изменений напряжения: Извлечение значений в начале и в конце каждого промежутка времени для вычисления абсолютных изменений напряжения.
-
Выявление аномальных изменений: Введение динамических порогов на основе ключевых статистических показателей (среднее и стандартное отклонение) для обнаружения и маркировки событий с отклонениями.
-
Составление отчета об отключениях: Объединение данных событий для определения частоты и временных рамок отключений.
Ваше беспокойство по поводу несоответствия распределения данных нормальному — полностью оправдано. Применение стандартного подхода с использованием среднего и стандартного отклонения на асимметричных данных действительно может вызывать проблемы.
Стратегии улучшения
-
Использование непараметрических методов: Рассмотрите возможность использования непараметрических методов, таких как методы х-интервалов для оценки изменений. Они могут быть более устойчивыми к аномалиям и асимметрии данных, что поможет выявить отключения более надежно.
-
Обработка выбросов: Определите и удалите выбросы перед вычислением порогов. Для этого можно использовать методы моды или медианы, что часто более подходит для асимметричных распределений.
-
Анализ частоты и плотности: Исследуйте распределение частоты и плотности изменений напряжения, что может помочь в создании более адаптивных и надежных порогов.
-
Эмпирические пороги: Рассмотрите возможность установления порогов на основе исторических данных о предыдущих отключениях в комбинации с анализом новейших данных для калибровки порогов отключений.
Заключение
Ваш подход является хорошей начальной точкой, но, как вы правильно заметили, стоит более критично подойти к вопросу расчета порогов в условиях несоответствующего распределения данных. Применение непараметрических статистических методов и более адаптивных подходов к обработке данных может значительно улучшить качество обнаружения отключений батареи.
Этот ответ оптимизирован по ключевым аспектам, связанным с анализом временных рядов и использованием статистических методов для обеспечения их релевантности и повышения дальнейших результатов.