Data Science
Как обучить нейронную сеть обобщению за пределами распределения (например, экстраполяция функции синуса) без утечки данных?
00
Вопрос или проблема Я пытаюсь обучить нейронную сеть для аппроксимации функции sin(x), но хочу, чтобы она обобщала за пределами диапазона обучающих данных. В частности, я обучаю сеть на значениях x в пределах [-π, π] и тестирую её на непересекающемся
Data Science
Как правильно тренировать модель с новыми поступающими наборами данных?
00
Вопрос или проблема Я хочу обучить глубокую нейронную сеть с учителем. Для обучения я могу самостоятельно генерировать данные, используя определенное распределение. К сожалению, данные очень большие с точки зрения памяти, поэтому я могу сохранить только
Data Science
Многозначная классификация – переобучение?
00
Вопрос или проблема Моя задача следующая: Вводить комбинации лекарств и выводить симптомы, связанные с почечной недостаточностью, из этих комбинаций. Как комбинации лекарств, так и симптомы, связанные с почечной недостаточностью, представлены в виде кодированного
Data Science
Верхняя граница размера выборки для деревьев решений
00
Вопрос или проблема Предположим, у меня есть пространство экземпляров с 4 признаками, и я знаю, что дерево решений с 8 узлами может представлять целевую функцию, которую я хочу изучить. Я хочу установить верхнюю границу на размер выборки, необходимой
Data Science
О способности нейронной сети к обобщению
00
Вопрос или проблема У меня был этот вопрос на интервью, на который я не смог ответить, даже после поиска информации в Интернете. Что из следующего может повлиять на способность искусственной нейронной сети к обобщению??? отсутствие смещения смещение в
Data Science
Как обеспечить обобщение при наличии очень-очень маленьких данных?
00
Вопрос или проблема У меня есть 21 наблюдение с более чем 10000 признаков. Проблема заключается в бинарной классификации, и данные сбалансированы. Используя метод выбора признаков, я нашел 5 признаков. Теперь у меня есть 21 наблюдение с 5 признаками.
Data Science
Является ли обобщение модели, а затем удаление обобщения, полезным для FFNN?
00
Вопрос или проблема Если вы обучаете базовую FFNN (Сеть с прямой связью), вы можете применять регуляризации, такие как дроп-аут, l1, l2 и гауссовский шум, чтобы модель была устойчивой и показывала лучшие результаты на новых данных.
Data Science
Помощь в прогнозировании центров затрат
00
Вопрос или проблема Как говорит заголовок: Мне поставили задачу предсказать центры затрат для данных о грузоперевозках. Я совершенно не представляю, как это сделать. Уникальное количество центров затрат превышает 5000, а количество признаков составляет около 100.
Data Science
Как я могу оценить надежность специфики модели с очень маленькими обучающими, тестовыми и валидационными наборами данных?
00
Вопрос или проблема Я новичок в статистике. У меня есть небольшая выборка из 646 образцов, на которой я обучил достаточно производительную модель (около 99% точности на тестовой и валидационной выборках). Чтобы усложнить задачу, классы немного несбалансированы.