Как объединить две модели логистической регрессии, обученные на разных наборах данных?

Question 1

Мои данные имеют иерархическую структуру – это означает, что есть N класс на уровне 1 и M класс на уровне M. После обучения обеих моделей отдельно с различными наборами данных (обе являются логистической регрессией, но могут быть изменены), я хочу предсказать N + M классов.

В настоящее время я решаю эту задачу собирая все данные перед обучением и добавляя примеры со второго уровня к результатам первого уровня, что приводит к (N + 1) классам (+1 означает все примеры со второго уровня), и если модель на уровне 1 предсказывает этот “+1” класс, тогда я отправляю запрос ко второй модели. Но сбор примеров перед обучением затратен, и тренировочный набор становится несбалансированным после сбора. Псевдокод:

clf1 = LogisticRegression()
clf1.fit(X1 + X2, Y1 + ["ID класса +1"] * len(Y2))
clf2 = LogisticRegression()
clf2.fit(X2, Y2)
if cl1.predict(X_test_example) == ["ID класса +1"]:
    clf2.predict(X_test_example)

Но мне нужно сохранить эту иерархическую структуру, поэтому напрямую объединить две модели невозможно. Есть ли способ объединить два вывода классификационных моделей (в виде распределения вероятностей), чтобы получить значимый результат и избежать проблем с чрезмерной уверенностью моделей? Псевдокод:

clf1 = LogisticRegression()
clf1.fit(X1, Y1)
clf2 = LogisticRegression()
clf2.fit(X2, Y2)
combined_clf = clf1 + clf2

Question 2

Я могу предложить два варианта, возможно, их больше:

Обучите бинарную классификационную “верхнюю модель”, которая предсказывает, принадлежит ли экземпляр модели 1 или модели 2. Две финальные модели нужно обучить только на соответствующих данных и предсказывать только свои N или M классы. Эффективность верхней модели является решающей в этом варианте.
Обучите модель классификации открытого набора. Это немного похоже на то, что вы делаете сейчас, добавляя класс “другая модель” к первой модели, за исключением того, что “другая” не является обычным классом, и вам не нужно обучать модель на экземплярах из этого класса. Это связано с классификацией одного класса и требует специфического метода обучения, который может обрабатывать классификацию открытого набора.

Question 3

Вы можете использовать подход иерархической классификации для решения этой проблемы. Иерархическая классификация – это метод машинного обучения, который классифицирует точки данных в заранее определенные категории, имеющие иерархическую структуру.

Вот как это делается:

Обучите свою модель уровня 1 с N классами. Эта модель будет использоваться для предсказания категории верхнего уровня для новой точки данных.
Обучите отдельные модели для каждого из N классов на уровне 1. Каждая из этих моделей будет использоваться для предсказания подкласса новой точки данных, при условии, что она принадлежит соответствующей категории верхнего уровня.
При предсказании класса новой точки данных сначала используйте модель уровня 1 для предсказания категории верхнего уровня. Затем используйте соответствующую модель уровня 2 для предсказания подкласса.

Этот подход имеет несколько преимуществ:

Он позволяет вам обучать каждую модель отдельно, используя только данные, относящиеся к этой модели. Это может сделать процесс обучения более эффективным и также помочь сбалансировать обучающие данные для каждой модели.
Он позволяет делать предсказания на разных уровнях детализации, в зависимости от ваших потребностей. Например, вам может быть нужно предсказать только категорию верхнего уровня для некоторых точек данных, но потребоваться предсказать подкласс для других.
Это может потенциально улучшить точность ваших предсказаний, позволяя каждой модели специализироваться на конкретной части задачи классификации.

Вы можете использовать любой тип модели для каждого уровня, в зависимости от ваших потребностей и природы ваших данных. Логистическая регрессия может хорошо подойти, но вы также можете рассмотреть другие типы моделей, такие как решающие деревья, случайные леса или нейронные сети.

Как объединить две модели логистической регрессии, обученные на разных наборах данных?

Вопрос или проблема

Ответ или решение

Метод 1: Иерархическая классификация

Метод 2: Обучение модели верхнего уровня

Заключение