Data Science
Как проводится оценка модели и повторное обучение после развертывания без меток истинного значения?
00
Вопрос или проблема Предположим, я развернул модель, вручную пометив истинные метки с моими обучающими данными, поскольку в данном случае нет способа получить истинные метки без участия человека. После развертывания модели, если я хотел бы оценить, как
Data Science
Случайный лес всегда прогнозирует класс большинства
00
Вопрос или проблема Я предсказываю исход болезни, используя биологические данные (метаболиты плюс ковариаты: возраст, пол и ИМТ). Исход является бинарной переменной и умеренно несбалансирован (~12% положительных случаев). У меня относительно большое число
Data Science
Какой метрикой оценивается направленная производительность в регрессионных моделях?
00
Вопрос или проблема Не уверен, озадачивает ли заголовок или нет. Вот пример: Предположим, мы строим регрессионную модель для предсказания цен на жилье. Однако, вместо того чтобы заботиться о точности предсказания, где MAE, MSE и некоторые другие метрики
Data Science
Как правильно измерить время вывода и FLOPs модели?
00
Вопрос или проблема Почему-то я не могу найти встроенные решения (неужели?) в keras и tensorflow, в то время как на сайте https://keras.io/api/applications/ они предоставляют время (мс) на каждый шаг вывода (ЦП), но по какой-то причине не описали, как
Data Science
Как измерить F1-меру и NMI для задачи кластеризации?
00
Вопрос или проблема Я вижу, что авторы этой статьи измеряют F1 и NMI для оценки качества кластеризации. Однако я не понимаю алгоритм, как именно они это измеряют. Смотрите раздел Оценка. Хотя я посмотрел на код, я не уверен в самом алгоритме.
Data Science
Как вы на самом деле оцениваете систему поиска?
00
Вопрос или проблема Допустим, у меня есть база знаний, я разделил ее и сгенерировал вопрос-ответ с помощью qa_generator и отфильтровал с помощью qa_critic, так что у меня есть вопрос, ответ и контекст. Теперь, создавая систему rag (в частности, извлечение)
Data Science
Хи-квадрат как оценочный метод для моделей регрессии нелинейного машинного обучения
00
Вопрос или проблема Я использую модели машинного обучения для предсказания порядковой переменной (значения: 1, 2, 3, 4 и 5) с использованием 7 различных признаков. Я рассмотрел это как задачу регрессии, поэтому окончательные выводы модели –
Data Science
В чем разница между бутстрэппингом и кросс-валидацией?
00
Вопрос или проблема Раньше я использовал K-кратную кросс-валидацию для надежной оценки моих моделей машинного обучения. Но я также знаю о существовании метода бутстрэппинга для этой цели. Тем не менее, я не вижу основной разницы между ними с точки зрения
Data Science
Совершенные пакеты Python, которые могут оценивать сходство языков
00
Вопрос или проблема Я пытаюсь оценить вероятность генерации конкретного предложения из большого набора предложений. Для этого я начинаю с простого подхода: обучения пользовательской n-gram языковой модели и расчета значений перплексии для списка предложений.
Data Science
Измерение полноты или уровня ложных отрицаний в сильно несбалансированном наборе данных
00
Вопрос или проблема Мы хотим измерить полноту (или уровень ложных отрицаний) для нашей модели машинного обучения. Проблема в том, что Положительные случаи встречаются только в
Data Science
Обучение с подкреплением: Почему жадные действия с оптимальной функцией значения приводят к оптимальной стратегии?
00
Вопрос или проблема Курс Дэвида Сильвера по обучению с подкреплением объясняет, как получить оптимальную стратегию из оптимальной функции ценности. Это кажется очень простым, нужно всего лишь действовать жадно, максимально увеличивая функцию ценности на каждом шаге.
Data Science
Может ли микроподсчет ROC AUC быть больше, чем ROC AUC для классов?
00
Вопрос или проблема Я работаю с несбалансированным набором данных. В обучающем наборе данных 11567 отрицательных и 3737 положительных образцов. В валидационном наборе данных 2892 отрицательных и 935 положительных образцов. Это задача бинарной классификации
Data Science
Сравнение наборов данных – Нужно ли использовать один и тот же тестовый набор данных?
01
Вопрос или проблема Я обучаю модель ML CNN. Я хочу сравнить различные наборы изображений. Эти наборы имеют разные характеристики (переведенные или нет, повернутые или нет и т.д.). Я не изменяю модель ML между обучением на разных наборах данных.
Data Science
Существует ли метрика оценки для регрессии (временных рядов), которая оценивает, насколько точна форма “кривой”?
00
Вопрос или проблема Я пытаюсь предсказать значение y. Меня в основном интересует, когда его пики будут и как будет выглядеть общая кривая за день. Менее важно, чтобы фактически предсказанные значения были точными. Чуть преувеличивая: мне все равно, если
Data Science
Что делать с неудачной частью обучающего набора данных?
00
Вопрос или проблема Я видел множество уроков и статей о том или ином модели, которые демонстрируют отличные показатели точности. В данном случае, скажем, 85%. Но я никогда не вижу, что делать с оставшимися 15%? Я предполагаю, что большинство из тех людей