Как вычислить f1_score для многоклассовой многометочной классификации

Question 1

Я использовал одномерное кодирование [1,0,0][0,1,0][0,0,1] для своей функциональной модели классификации.
Предсказанные вероятности для тестовых данных yprob = model.predict(testX) дают мне :

yprob = array([[0.18120882, 0.5803128 , 0.22847839],
       [0.0101245 , 0.12861261, 0.9612609 ],
       [0.16332535, 0.4925239 , 0.35415074],
       ...,
       [0.9931931 , 0.09328955, 0.01351734],
       [0.48841736, 0.25034943, 0.16123319],
       [0.3807928, 0.42698202, 0.27493873]], dtype=float32)

Я хотел бы вычислить точность, F1-меру и матрицу путаницы на основе этого.
Последовательный API предлагает функцию predict_classes для этого.
yclasses = model.predict_classes(testX) и, используя функцию f1_score из sklearn, мы могли бы вычислить все эти значения.
Как я мог бы применить это для предсказания вероятностей тестовых данных для многоклассовой многометочной классификации?
Мой второй вопрос заключается в том, соответствует ли наивысшее значение каждого массива yprob = model.predict(testX) предсказанному классу? Например, [0.18120882, 0.5803128 , 0.22847839] – это первый элемент в массиве. Наивысшее значение – 0.5803128. Значит ли это, что оно соответствует одномерному кодированию [0, 1, 0], так что это вторая метка, потому что это второй элемент в массиве?

Question 2

Кажется, между многоклассовой и многометочной классификацией существует путаница:

Многоклассовая классификация – это обычный случай, при котором задача состоит в том, чтобы предсказать среди N возможных классов. Например, изображение может быть либо собакой, либо лошадью, либо кошкой, но всегда ровно одним из этих трех животных.
Многометочная классификация – это ситуация, когда задача состоит в предсказании множества. Например, изображение может быть любым подмножеством {собака, лошадь, кошка}: это может быть {собака, кошка}, это может быть {лошадь}, это может быть {собака, лошадь, кошка}, это может даже быть пустое множество (ни одного животного).

Практически в случае многометочной классификации вы предсказываете каждое возможное животное независимо как бинарную задачу, поэтому для каждого изображения система отвечает на 3 вопроса:

содержит ли это изображение собаку? (да/нет)
содержит ли это изображение лошадь? (да/нет)
содержит ли это изображение кошку? (да/нет)

Поскольку каждый вопрос предсказывается независимо, нет смысла выбирать класс с максимальной вероятностью. На деле существует 3 независимые задачи бинарной классификации и 3 соответствующие матрицы путаницы.

Похоже, вы не собирались учитывать случай многометочной классификации и у вас нет ни одного изображения с несколькими животными, верно? Если это так, вам следует изменить систему для решения обычной многоклассовой задачи.

Похоже, путаница может быть вызвана одномерным кодированием класса: возможно, вы думали, что класс является категориальным, поэтому было бы ошибкой кодировать класс как числовое значение. Это верно для категориальных признаков, но на самом деле не для целевой переменной, вы можете прекрасно использовать, например, LabelEncoder для представления класса как одной целевой переменной. Это намного проще и, вероятно, более уместно для вашей задачи.
Одно отличие, которое вы заметите, заключается в том, что вероятности, полученные в качестве предсказаний, в сумме составляют один, потому что классификатор не рассматривает классы как независимые (в отличие от того, что происходит в вашем текущем эксперименте: вероятности не суммируются до 1).

Как вычислить f1_score для многоклассовой многометочной классификации

Вопрос или проблема

Ответ или решение

Понимание задачи

Преобразование вероятностей в классы

Вычисление F1-меры

Заключение