model-evaluations
Data Science
Вопрос или проблема Предположим, я развернул модель, вручную пометив истинные метки с моими обучающими данными, поскольку в данном случае нет способа получить истинные метки без участия человека. После развертывания модели, если я хотел бы оценить, как
Data Science
Вопрос или проблема Я предсказываю исход болезни, используя биологические данные (метаболиты плюс ковариаты: возраст, пол и ИМТ). Исход является бинарной переменной и умеренно несбалансирован (~12% положительных случаев). У меня относительно большое число
Data Science
Вопрос или проблема Не уверен, озадачивает ли заголовок или нет. Вот пример: Предположим, мы строим регрессионную модель для предсказания цен на жилье. Однако, вместо того чтобы заботиться о точности предсказания, где MAE, MSE и некоторые другие метрики
Data Science
Вопрос или проблема Почему-то я не могу найти встроенные решения (неужели?) в keras и tensorflow, в то время как на сайте https://keras.io/api/applications/ они предоставляют время (мс) на каждый шаг вывода (ЦП), но по какой-то причине не описали, как
Data Science
Вопрос или проблема Я вижу, что авторы этой статьи измеряют F1 и NMI для оценки качества кластеризации. Однако я не понимаю алгоритм, как именно они это измеряют. Смотрите раздел Оценка. Хотя я посмотрел на код, я не уверен в самом алгоритме.
Data Science
Вопрос или проблема Допустим, у меня есть база знаний, я разделил ее и сгенерировал вопрос-ответ с помощью qa_generator и отфильтровал с помощью qa_critic, так что у меня есть вопрос, ответ и контекст. Теперь, создавая систему rag (в частности, извлечение)
Data Science
Вопрос или проблема Я использую модели машинного обучения для предсказания порядковой переменной (значения: 1, 2, 3, 4 и 5) с использованием 7 различных признаков. Я рассмотрел это как задачу регрессии, поэтому окончательные выводы модели –
Data Science
Вопрос или проблема Раньше я использовал K-кратную кросс-валидацию для надежной оценки моих моделей машинного обучения. Но я также знаю о существовании метода бутстрэппинга для этой цели. Тем не менее, я не вижу основной разницы между ними с точки зрения
Data Science
Вопрос или проблема Я пытаюсь оценить вероятность генерации конкретного предложения из большого набора предложений. Для этого я начинаю с простого подхода: обучения пользовательской n-gram языковой модели и расчета значений перплексии для списка предложений.
Data Science
Вопрос или проблема Мы хотим измерить полноту (или уровень ложных отрицаний) для нашей модели машинного обучения. Проблема в том, что Положительные случаи встречаются только в
Data Science
Вопрос или проблема Курс Дэвида Сильвера по обучению с подкреплением объясняет, как получить оптимальную стратегию из оптимальной функции ценности. Это кажется очень простым, нужно всего лишь действовать жадно, максимально увеличивая функцию ценности на каждом шаге.
Data Science
Вопрос или проблема Я работаю с несбалансированным набором данных. В обучающем наборе данных 11567 отрицательных и 3737 положительных образцов. В валидационном наборе данных 2892 отрицательных и 935 положительных образцов. Это задача бинарной классификации
Data Science
Вопрос или проблема Я обучаю модель ML CNN. Я хочу сравнить различные наборы изображений. Эти наборы имеют разные характеристики (переведенные или нет, повернутые или нет и т.д.). Я не изменяю модель ML между обучением на разных наборах данных.
Data Science
Вопрос или проблема Я пытаюсь предсказать значение y. Меня в основном интересует, когда его пики будут и как будет выглядеть общая кривая за день. Менее важно, чтобы фактически предсказанные значения были точными. Чуть преувеличивая: мне все равно, если
Data Science
Вопрос или проблема Я видел множество уроков и статей о том или ином модели, которые демонстрируют отличные показатели точности. В данном случае, скажем, 85%. Но я никогда не вижу, что делать с оставшимися 15%? Я предполагаю, что большинство из тех людей