Лучший показатель для оценки сходства между характеристиками траекторий полетов

Question 1

Рассмотрим полет, представленный в виде данных с пространственными (широта, долгота, высота) и временными (временная метка) координатами. По мере полета у меня есть переменная, отслеживающая длину предыдущего сегмента, проведенного в определенных условиях (например, температура выше определенного порога), accumulatedMilesWithCondition:

широта	долгота	временная метка	высота	accumulatedMilesWithCondition	узел
-17.5456	-149.5954	2020-06-01 21:00:00.000	5.0853	0.00	ВЫЛЕТ
-17.5543	-149.6081	2020-06-01 21:00:33.300	43.1430	10.54	ПРОМЕЖУТОЧНЫЙ
—	—	—	—	—	—
-22.0070	166.1995	2020-06-02 04:50:29.300	-23.3268	1140.58	НАЗНАЧЕНИЕ

Я смоделировал тот же полет (тот же вылет, назначение, время начала) с немного отличающимися условиями, что привело к тому, что данные имеют немного отличающиеся пространственные (кроме вылета и назначения, очевидно) и временные координаты.

Я хочу вывести метрику, которая даст мне оценку того, насколько “похожа” переменная accumulatedMilesWithCondition между разными полетами. Например, здесь я сравниваю 3 разные версии одного и того же полета с использованием цветового отображения, которое выделяет области, где accumulatedMilesWithCondition увеличивается (то есть области, где мои условия выполняются).

Идея заключается в том, чтобы иметь метрику, которая дает более количественное представление о том, насколько эти “изображения” визуально похожи.

Я экспериментировал с различными метриками, но проблема в том, что во всех этих случаях мне всегда нужно как-то ресемплировать до общего индекса, и это сложно сделать, потому что единственный инвариант этих полетов — это координаты вылета и назначения, в то время как остальное может развиваться свободно (хотя, как я сказал, обычно различия действительно малы). Это означает, что также количество точек для некоторых полетов может быть разным.

У вас есть идеи по поводу стратегий сравнения характеристик различных траекторий полетов?

Question 2

Я думаю, что вариационный автоэнкодер (VAE) с 1D сверточным кодирующим этапом может подойти.

1D сверточный кодирующий этап сможет кодировать данные о траектории, которые длинные, многомерные и переменной длины.

Помещение этого в архитектуру VAE означало бы, что сеть обучается представлять образцы так, чтобы похожие образцы располагались близко друг к другу в этом пространстве.

Это похоже на сокращение размерности, где вы можете спроецировать данные в двумерное пространство и обнаружить, что связанные образцы группируются вместе. Сложность для этой конкретной задачи возникает из структуры данных, где нам нужно справляться с переменной длиной последовательности среди прочего.

Предположим, вы обучили такую сеть, и затем хотите измерить схожесть двух новых траекторий. Вы пропускаете их обе через кодировщик и считываете их кодировки. Затем вы можете вычислить расстояние между кодировками (скаляр $d\ge0$), и интерпретировать его как меру различия.

Лучший показатель для оценки сходства между характеристиками траекторий полетов

Вопрос или проблема

Ответ или решение