Моя LSTM имеет действительно низкую точность, есть ли способ её улучшить?

Question 1

Я пытаюсь создать модель для классификации, могут ли эти пациенты быть диагностированы с деменцией по их 35 дням биометрических данных.

Краткое резюме набора данных приведено ниже.

В качестве входных данных X_train он имеет 51 признак и 148 идентификаторов пользователей. И собирает 35 дней биометрических данных от пациентов.

В качестве входных данных y_train он имеет список диагнозов 148 пациентов. Это могут быть ‘CN’, ‘MCI’ и ‘Dem’, так что у него 3 категории.

['CN',
 'MCI',
 'MCI',
 'CN',
 'MCI',
 'CN',
 'MCI',
...

Так что я создал модель что-то вроде этого.

model = Sequential()
model.add(LSTM(35,input_shape=(35, 51)))  #35 дней, 51 признак
model.add(Dropout(0.5))
model.add(Dense(100, activation='relu'))
model.add(Dense(3, activation='softmax'))

model.compile(loss="sparse_categorical_crossentropy", optimizer="adam", metrics=['accuracy'])

Что касается точности, она действительно не так хороша, как вы можете видеть ниже, она даже не превышает 50% валидационной точности.

...
Эпоха 200/200
2/2 [==============================] - 0s 131ms/step - loss: 0.0609 - sparse_categorical_accuracy: 0.9835 - val_loss: 3.2440 - val_sparse_categorical_accuracy: 0.4667

Есть ли способ улучшить эту модель? Или мне нужно перестроить модель?

Question 2

Похоже, это классическая проблема ПЕРЕОБУЧЕНИЯ, результаты на обучающем наборе действительно хорошие, а результаты на валидационном наборе оставляют желать лучшего.
Вы можете построить график обучения, показывающий потери и точность на обучающем и валидационном наборах для каждой эпохи.
Пример такого графика: ссылка

history = model.fit(X, Y, validation_split=0.33, epochs=150, batch_size=10, verbose=0)
print(history.history.keys())
plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])
plt.title('точность модели')
plt.ylabel('точность')
plt.xlabel('эпоха')
plt.legend(['обучение', 'тест'], loc="upper left")
plt.show()

plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('потери модели')
plt.ylabel('потери')
plt.xlabel('эпоха')
plt.legend(['обучение', 'тест'], loc="upper left")
plt.show()

Другой простой способ снизить переобучение — уменьшить вычислительную мощность вашей модели/количество обученных параметров, уменьшив количество нейронов на каждом слое вашей модели.
Например:

model = Sequential()
model.add(LSTM(35,input_shape=(35, 51)))  #35 дней, 51 признак
model.add(Dropout(0.5))
model.add(Dense(32, activation='relu'))
model.add(Dense(3, activation='softmax'))

Question 3

Ваша модель переобучается. Есть несколько способов справиться с этим:

1.) Данные, которые у вас есть, имеют всего 5k записей. Это не подходит для алгоритмов глубокого обучения, которые требуют гораздо больше данных. Вам стоит использовать алгоритм машинного обучения для этих данных. Переобучение происходит, когда модель, которую вы используете, довольно сложная для имеющихся у вас данных. Либо используйте алгоритм машинного обучения, либо соберите больше данных, если хотите использовать алгоритмы глубокого обучения.

2.) Вы используете точность в качестве метрики для задачи многоклассовой классификации, что не рекомендуется. Попробуйте использовать подходящую метрику и посмотрите, решит ли это проблему.

3.) Еще один способ справиться с этим — как предлагает @niv dudovitch. Уменьшите сложность LSTM, снижая количество параметров.

4.) Вы можете попробовать использовать Keras Tuner для настройки гиперпараметров и посмотреть, решит ли это проблему.

5.) Попробуйте использовать Нормализацию пакетами вместо Dropout. Если вы действительно хотите использовать Dropout, то значение 0.5 — это слишком большое значение для таких небольших данных.

Дайте мне знать, если это сработает!

Удачи!

Моя LSTM имеет действительно низкую точность, есть ли способ её улучшить?

Вопрос или проблема

Ответ или решение

Повышение Точности Модели LSTM для Классификации Деменций

1. Понимание Проблемы с Переобучением

Решения для уменьшения переобучения:

2. Использование Более Подходящих Метрик

3. Улучшение Качества Данных

4. Кросс-Валидация

5. Тонкая Настройка Гиперпараметров

6. Применение Batch Normalization

Заключение