overfitting
Data Science
Вопрос или проблема Я применил Xgboost к своему набору данных, который включает около 50 000 наблюдений. Я разделил набор данных на 80/20 и использовал 5-кратную кросс-валидацию. Ниже приведены результаты: Обучающая выборка R$^2$: 0.
Data Science
Вопрос или проблема Результаты модели случайного леса, которую я настроил с помощью Gridsearch, следующие. Как вы думаете, есть ли у этой модели серьезная переобученность? Среднее значение целевых показателей составляет 850. R2: 0.
Data Science
Вопрос или проблема Результаты модели случайного леса, которую я настроил с помощью gridsearch, следующие. Я также построил кривую обучения для нее. Вы считаете, что эта модель имеет сильное переобучение? Среднее значение целевых переменных равно 850.
Data Science
Вопрос или проблема Я работаю над проектом, связанным с использованием моделей машинного обучения для классификации заданного медицинского датасета. Датасет, который вы можете найти здесь: https://zenodo.org/records/10885957, содержит данные о 10 000 пациентах.
Data Science
Вопрос или проблема Как дела? Я экспериментирую с CNN в FastAI. Моя модель с 2 миллионами параметров дает всего около 80% точности. Я также пробовал нормализацию данных, нормализацию пакетов, сглаживание меток, Mixup, но результаты все равно остаются
Data Science
Вопрос или проблема У меня есть набор данных, который содержит около 87000 изображений в директории, причем каждый класс находится в отдельной подпапке. Я попробовал класс ImageDataGenerator() и функцию flow_from_directory() для генерации изображений