model-evaluations - ответы на вопросы

Data Science

Получение низкой точности при использовании QSVM

00

Вопрос или проблема Я пытаюсь предсказать погоду, используя QSVM. Набор данных, который я использую, можно посмотреть здесь: Набор данных: https://www.kaggle.com/datasets/muthuj7/weather-dataset Я использую ZZfeatyremap и линейное квантовое ядро.

Data Science

Сравнение RMSE на нескольких тестовых наборах данных различного размера

00

Вопрос или проблема У меня есть временные ряды данных (доходность акций), и я обучаю на них регрессию случайного леса. Общее количество наблюдений = 2499. Чтобы лучше оценить производительность, я реализовал тестирование с прокатными окнами с размерами

Data Science

Одинаковые кривые валидации для обучающего и тестового набора данных

00

Вопрос или проблема Я изучаю машинное обучение самостоятельно. Я применяю логистическую регрессию к набору данных о прогнозе погоды с Kaggle Weather_data. Цель состоит в том, чтобы предсказать дождь в соответствии с заданными признаками, и набор данных

Data Science

Как оценить отсутствующие значения при расчете NDCG

00

Вопрос или проблема Я хотел бы сравнить методы рекомендаций, используя метрику NDCG на датасете MovieLens. В задаче ранжирования цель состоит в том, чтобы ранжировать предметы на основе их релевантности для пользователя. Модели ранжирования могут изучаться

Data Science

Почему model.fit и model.evaluate дают разные результаты?

00

Вопрос или проблема Следующий код представляет собой небольшой фрагмент, но я пытаюсь понять результаты model.fit с обучающим и тестовым наборами данных по сравнению с результатами model.evaluate. Я не уверен, что они не совпадают, или я не понимаю, как читать результаты?

Data Science

Является ли чувствительность тем же самым, что и полнота в многоклассовой классификации?

00

Вопрос или проблема В Википедии говорится: “В двоичной классификации показатель recall называется чувствительностью” в разделе о Recall. Отличаются ли они в случае многоклассовой классификации? коротко: не совсем, recall и точность очень похожи

Data Science

Как эффективно оценить модель с сильно несбалансированным и ограниченным набором данных

00

Вопрос или проблема Большинство вопросов о дисбалансе данных на этом сайте касаются того, как обучить лучшую модель, но я склонен считать, что другая проблема заключается в том, как определить “лучшую” модель (т.е.

Data Science

Метрики оценки для многоклассовой классификации

00

Вопрос или проблема Как получить Accuracy, Detection_Rate, False_Positive_Rate и False_Negative_Rate для каждого класса? Например, все эти метрики для class_1, class_2, class_3 и т.д. Вот пример кода, который я использовал для вычисления точности классификатора

Data Science

Оценка регрессионных моделей с различными показателями (MSE, дисперсия, VAF и т.д.)

00

Вопрос или проблема При сравнении нескольких регрессионных моделей с точки зрения качества, кажется, что большинство согласны с MSE. Есть также статьи, сравнивающие “дисперсию” и “дисперсию, объясненную регрессией (VAF)”

Data Science

Как узнать, является ли моя регрессионная модель недообученной?

00

Вопрос или проблема Как мы оцениваем работу модели регрессии с определенным RMSE, если отсутствует метрика производительности, основанная на знаниях о предмете? Возможно, MAPE — это один из способов сравнить производительность моей модели на моем наборе

Data Science

Всегда ли переобучение плохо?

00

Вопрос или проблема Я обучил свою модель впервые и провел инференс на случайных изображениях. Когда я попробовал случайное изображение, которое имеет аналогичную позицию камеры с моим набором данных, она хорошо справляется с обнаружением реки.

Data Science

Соответствие между прогнозом регрессии и сгенерированными человеком предположениями для верхнего и нижнего порогов.

00

Вопрос или проблема У меня есть база данных, содержащая числовые данные о продуктах. Я использую различные модели для прогнозирования значения признака, например, ёмкости батареи ноутбука, с учётом других признаков, таких как размер, количество ядер процессора и т.

Data Science

Каковы будут основные и ключевые критерии для оценки библиотеки auto-sklearn?

00

Вопрос или проблема Я провожу эксперименты с использованием контрольных наборов данных и auto-sklearn, чтобы увидеть, как его производительность отличается от стандартной библиотеки sklearn, поскольку automl выполняет исчерпывающий поиск по параметрам

Data Science

Является ли хорошей практикой оценивать эффективность модели, сравнивая метрики пересчитанных (обратным образом преобразованных) предсказаний и истинных целевых значений?

00

Вопрос или проблема Я сейчас работаю с линейной регрессией для задачи регрессии временных рядов (извините, но я не могу рассказать слишком много о проблеме и векторе признаков из-за соглашения о неразглашении). Я масштабировал как входные значения, так

Data Science

Совпадают ли эта ROC кривая и ROC AUC оценка?

00

Вопрос или проблема Я работаю над задачей бинарной классификации. Я попытался оценить модель, построив ROC-кривую и рассчитав ROC AUC. Рассчитанный балл составляет 0.9115, но площадь кривой выглядит нереалистично для этого балла.

Data Science

model.evaluate дает низкие результаты?

00

Вопрос или проблема У меня есть набор изображений, в котором 6300 изображений и 5 классов. Извлеченные признаки и набор данных уменьшены до 256 признаков. Этот набор данных дает хорошие результаты (99%) при тестировании ANN с обратным распространением (tensorflow).

Data Science

Какие методы доступны для оценки сходства между различными алгоритмами кластеризации?

00

Вопрос или проблема Я провожу обширный анализ сегментации клиентов и на данный момент реализовал модели гауссовских смесей, алгоритм K-средних и иерархическую кластеризацию. В большинстве случаев алгоритмы согласны по структуре кластеров и количеству (7-8).

Data Science

precision@k и recall@k

00

Вопрос или проблема Как правило, я знаком с метриками оценки точности и полноты, но, как вы знаете, recall@k и precision@k – это разные вещи, используемые в оценках ранжирования, особенно в системах рекомендаций. Я проверил много источников, я понял

Data Science

метрики оценки для нескольких значений за сессию

00

Вопрос или проблема У меня есть приложение, которое выполняет мою функцию foo() несколько раз для каждой сессии пользователя. Существуют 2 альтернативных алгоритма, которые я могу реализовать в качестве функции foo(), и моя цель — оценить их на основе задержки выполнения.

Data Science

Рейтинг банкоматов на основе использования и экономических данных (Модель оценки/рейтинга)

00

Вопрос или проблема У меня есть образец данных о расположении около 10 банкоматов, а также их количестве использования (внесения наличных, снятия наличных и других операций) за последние 3 месяца. Я планирую собрать дополнительные данные, такие как ближайшие