Модель Tensorflow работает для классификации, но не для регрессии (все предсказания равны смещению выходного слоя).

Question 1

Я пытаюсь создать модель для прогноза валютных курсов. Она дает многообещающие результаты для классификации каждого периода как покупка/продажа/нейтрально. При использовании в качестве классификатора фактическая доходность преобразуется в 0, 1 или 2, чтобы отразить возможные действия (продажа=0, нейтрально=1, покупка=2) в зависимости от того, превышает ли изменение цен в будущем заданный порог в сторону повышенной или пониженной.

Однако, пытаясь предсказать будущее изменение как задачу линейной регрессии, она делает бессмысленные прогнозы. Каждый раз, когда я обучаю модель, она быстро сходится к различному фиксированному значению прогноза для каждого периода.

Вот упрощенная версия построения/компиляции модели:

def build(self, is_evolution=False):
    self.model = models.Sequential()
    self.model.add(layers.Dense(self.num_layers, activation="relu", input_shape=(self.x_train.shape[1],)))
    self.model.add(layers.Dense(self.num_layers, activation="relu"))
    if self.is_classification:
        class_counts = np.array(list(map(lambda x: self.y_train[self.y_train == x].shape[0], self.classes)))
        total_count = self.y_train.shape[0]
        bias_initializer = tf.constant_initializer(tuple(class_counts / total_count))
        self.model.add(layers.Dense(len(self.classes), activation="sigmoid", bias_initializer=bias_initializer))
    else:
        self.model.add(layers.Dense(1))

    loss = "sparse_categorical_crossentropy" if self.is_classification else tf.keras.losses.MeanSquaredError()
    self.model.compile(optimizer=tf.keras.optimizers.Adam(), loss=loss, metrics=["accuracy"])

Вот пример прогнозов, когда is_classification установлено на False. Это бессмысленно, потому что все прогнозы одинаковы, но и числа в этом случае тоже очень большие (т.е. фактическое среднее очень близко к нулю), хотя числа прогнозов могут значительно варьироваться при различных обучениях.

[[0.00081437]
 [0.00081437]
 [0.00081437]
 ...
 [0.00081437]
 [0.00081437]
 [0.00081437]]

Основываясь на предложениях здесь: Модель регрессии Tensorflow дает одинаковый прогноз каждый раз, я пытался изменить скорость обучения, но без успеха. Я также убедился, что масштабирую обучающую и тестовую выборки, хотя не уверен, что это должно иметь значение для линейной регрессии.

Сначала я думал, что это просто из-за очень шумного набора данных, но размышляя больше, я полагаю, что модель, которая может классифицировать покупку или продажу, также должна быть в состоянии делать регрессионные прогнозы, когда выходной слой модифицирован, как указано выше.

Любые мысли будут приветствоваться.

Обновление: Я проверял отдельные веса и вижу, что прогнозы линейной регрессии равны смещению выходного слоя, однако другие веса, похоже, “нормальные” (т.е. различные положительные и отрицательные веса).

Question 2

Удивительно, но изменение оптимизатора с adam на tf.keras.optimizers.SGD(lr=0.01, momentum=0.9) устранило идентичные прогнозы, но похоже, что требуется больше настроек, чтобы получить хорошие результаты, как в модели классификации.

Единственный вопрос — почему это изменение делает такую значительную разницу? Я был бы любопытен узнать ответ, если кто-то его знает.

Модель Tensorflow работает для классификации, но не для регрессии (все предсказания равны смещению выходного слоя).

Вопрос или проблема

Ответ или решение

1. Архитектура модели

2. Функция потерь

3. Масштабирование данных

4. Оптимизатор

5. Параметры обучения

6. Шум в данных

Заключение