Почему я получаю неправильное предсказание, когда комбинирую два списка образцов, каждый из которых по отдельности дает правильное предсказание?

Question 1

Я программирую на Python. У меня есть два набора образцов. Набор1 содержит образцы класса A, а другой набор, Набор2, содержит образцы класса B. Эти образцы являются частью обучающего набора данных. Когда я предсказываю наборы 1 и 2 по отдельности, классификация идеальна. Но когда я объединяю оба набора для предсказания в один набор, предсказание дает неверный результат для образцов в Наборе2, т.е. предсказывает образцы набора 2 как принадлежащие классу A. В то же время образцы, принадлежащие Набору1, предсказываются как класс A в объединенном наборе. Почему это происходит? (Я сохранил модель и загрузил эту модель для дальнейшего предсказания, та же ошибка сохраняется)

model.add(Dense(newshape[1]+1, activation='relu', input_shape=(newshape[1],)))
model.add(Dropout(0.5))
model.add(Dense(500, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(250, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(100, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(50, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss="binary_crossentropy",
          optimizer="adam",
          metrics=['binary_accuracy'])
model.fit(X_train, y_train,validation_data=(X_test, y_test),validation_split=0.2, epochs=500, batch_size=25, verbose=0)

Question 2

У вас есть ошибка где-то в данных, которые вы предоставляете в качестве обучающих данных, или в модели, которую вы используете для предсказания.

Если бы это была действительно одна и та же модель, обученная на полных данных во всех случаях, тогда любой экземпляр в наборе2 всегда предсказывался бы с одним и тем же классом (правильным или неправильным), независимо от других экземпляров в тестовом наборе. Это предполагает, что модель, которая применяется при предсказании отдельных наборов или обоих одновременно, не одна и та же.

В качестве теста сначала сохраните вашу модель, а затем примените ее к различным случаям (используйте сохраненную модель, не обучайте ее снова).

Хорошо, вы пытаетесь провести 3 эксперимента:

Обучение на полном обучающем наборе создает modelA, затем примените modelA к набору1
Обучение на полном обучающем наборе создает modelB, затем примените modelB к набору2
Обучение на полном обучающем наборе создает modelC, затем примените modelC как к набору1, так и к набору2

Но если бы это действительно так, три модели были бы одинаковыми: modelA = modelB = modelC. На самом деле вы можете сделать так:

Обучение на полном обучающем наборе создает modelD
примените modelD к любому набору

Судя по вашему описанию, вероятно, происходит следующее:

Обучение на экземплярах класса A (ошибка) создает modelA, затем примените modelA к набору1 -> идеальные результаты
Обучение на экземплярах класса B (ошибка) создает modelB, затем примените modelB к набору2 -> идеальные результаты
Обучение на экземплярах класса A (ошибка) создает modelC = modelA, затем примените modelC к наборам 1 и 2: идеально для класса A, совершенно неверно для класса B

Вам нужно проверить, какие экземпляры вы предоставляете в качестве обучающего набора в каждом случае.

Почему я получаю неправильное предсказание, когда комбинирую два списка образцов, каждый из которых по отдельности дает правильное предсказание?

Вопрос или проблема

Ответ или решение

1. Модель и данные

2. Разделение данных и обучение

3. Проблемы с подготовкой данных

4. Обучение на полной выборке

Заключение