Data Science
Многозначная классификация – переобучение?
00
Вопрос или проблема Моя задача следующая: Вводить комбинации лекарств и выводить симптомы, связанные с почечной недостаточностью, из этих комбинаций. Как комбинации лекарств, так и симптомы, связанные с почечной недостаточностью, представлены в виде кодированного
Data Science
Верхняя граница размера выборки для деревьев решений
00
Вопрос или проблема Предположим, у меня есть пространство экземпляров с 4 признаками, и я знаю, что дерево решений с 8 узлами может представлять целевую функцию, которую я хочу изучить. Я хочу установить верхнюю границу на размер выборки, необходимой
Data Science
О способности нейронной сети к обобщению
00
Вопрос или проблема У меня был этот вопрос на интервью, на который я не смог ответить, даже после поиска информации в Интернете. Что из следующего может повлиять на способность искусственной нейронной сети к обобщению??? отсутствие смещения смещение в
Data Science
Как обеспечить обобщение при наличии очень-очень маленьких данных?
00
Вопрос или проблема У меня есть 21 наблюдение с более чем 10000 признаков. Проблема заключается в бинарной классификации, и данные сбалансированы. Используя метод выбора признаков, я нашел 5 признаков. Теперь у меня есть 21 наблюдение с 5 признаками.
Data Science
Является ли обобщение модели, а затем удаление обобщения, полезным для FFNN?
00
Вопрос или проблема Если вы обучаете базовую FFNN (Сеть с прямой связью), вы можете применять регуляризации, такие как дроп-аут, l1, l2 и гауссовский шум, чтобы модель была устойчивой и показывала лучшие результаты на новых данных.
Data Science
Помощь в прогнозировании центров затрат
00
Вопрос или проблема Как говорит заголовок: Мне поставили задачу предсказать центры затрат для данных о грузоперевозках. Я совершенно не представляю, как это сделать. Уникальное количество центров затрат превышает 5000, а количество признаков составляет около 100.
Data Science
Как я могу оценить надежность специфики модели с очень маленькими обучающими, тестовыми и валидационными наборами данных?
00
Вопрос или проблема Я новичок в статистике. У меня есть небольшая выборка из 646 образцов, на которой я обучил достаточно производительную модель (около 99% точности на тестовой и валидационной выборках). Чтобы усложнить задачу, классы немного несбалансированы.