Data Science
Решения для маркировки обучающих данных для задач бинарной классификации
00
Вопрос или проблема У меня есть огромный набор данных, для которого я пытаюсь использовать метод 80-20 (метод отложенной выборки) для обучения и тестирования моей модели. Однако набор данных, который мне был предоставлен, содержит 6 миллионов строк.
Data Science
Лучше иметь одну модель с большим количеством категорий или две модели с меньшим количеством для многоцелеой классификации?
00
Вопрос или проблема Для классификации текста на три категории вопрос, жалоба и дополнение, где каждый экземпляр может иметь несколько меток (вопрос и жалоба, вопрос и дополнения): лучше иметь одну модель для всех трех категорий?