supervised-learning
Data Science
Вопрос или проблема Отказ от ответственности: Математики, пожалуйста, не сердитесь на меня за использование некоторых терминов в этом посте. Я инженер. 🙂 Предыстория: Итак, я в настоящее время работаю над задачей, где мне нужно сгенерировать последовательность
Data Science
Вопрос или проблема Допустим, у меня есть 100 значений в моем наборе данных, и я разделяю их: 80% для обучения и 20% для теста. Когда я предсказываю последнее значение, основан ли прогноз на предыдущих 99 (80 тестовых + 19 уже предсказанных значений)
Data Science
Вопрос или проблема Мой текущий набор данных имеет форму 5300 строк на 160 столбцов с числовой целевой переменной в диапазоне=[641, 3001]. Это не большой набор данных, но в общем должно быть достаточно для достойного качества регрессии.
Data Science
Вопрос или проблема Я использую обучение с учителем на данных о ежемесячной активности, чтобы предсказать, когда клиент купит конкретный продукт. Этот продукт обычно покупается редко, и в данный момент моя целевая переменная –
Data Science
Вопрос или проблема Недавно я занимаюсь обнаружением аномалий, одним из методов является использование модели АЕ для изучения паттерна нормальных образцов. Определите его как аномальный образец, если он не соответствует паттерну нормальных образцов.
Data Science
Вопрос или проблема У меня есть набор данных временных рядов, который мне нужно вручную пометить для обучения с учителем. То, что я сейчас делаю, это использую Excel для построения графиков, и когда я вижу нужный мне паттерн, я навожу курсор на данные
Data Science
Вопрос или проблема Модель EfficientNet была обучена на ~3500 изображениях для классификации на 4 класса: A, B, C и Neither – с точностью 0.985 – кем-то другим, не мной. Я довольно нов в ML. Итак, у нас есть эта модель, и она работает довольно хорошо.
Data Science
Вопрос или проблема У меня есть следующая проблема, и я очень надеюсь, что есть ее решение. Я также подозреваю, что существует простой подход к этому. Я просто не вижу его в данный момент. Буду очень признателен за любую помощь или совет.
Data Science
Вопрос или проблема Я работаю над моделью предсказания, чтобы определить, нужно ли продавать, удерживать или покупать акцию через n дней. Каждый день (или строка в наборе данных) я классифицирую, нужно ли продавать, удерживать или покупать, основываясь
Data Science
Вопрос или проблема У меня есть базовые знания в области прогнозирования временных рядов и алгоритмов машинного обучения с учителем и без учителя (кластеризация, классификация, деревья решений и т.д.). Сейчас мне поручили задачу прогнозирования цен на акции.
Data Science
Вопрос или проблема Я больше изучал полупод监督ное обучение, в частности, распространение меток и размножение меток. Читая учебники и некоторые статьи, я заметил, что часто результаты распространения меток затем используются для построения контролируемой модели.
Data Science
Вопрос или проблема Пусть $X$ представляет собой набор данных, состоящий из $N$ экземпляров, где каждый экземпляр описывается набором признаков $\text{feat}_0, \ldots, \text{feat}_m$, а $Y$ обозначает соответствующие целевые значения.
Data Science
Вопрос или проблема У меня есть идея, но я не уверен, что ее можно смоделировать в архитектуре глубокого обучения. Предположим, у нас есть изображения разного качества, основанные на цветовом паттерне, и их оценка в качестве меток в диапазоне от 0 до 1.
Data Science
Вопрос или проблема В контексте контролируемого машинного обучения существует ли способ сделать прогноз по частичному вводу (т.е. некоторые признаки неизвестны) в общем? Если нет, существуют ли модели, которые поддерживают эту функцию?
Data Science
Вопрос или проблема Я работаю над проектом, где мне нужно разметить аудиоданные, в которых тысячи данных, каждое аудиоданные составляет одну секунду. Мне нужно размечать, находится ли оно в состоянии простоя, происходит ли событие или шум.
Data Science
Вопрос или проблема Я новичок в машинном обучении. После нескольких дней изучения идей машинного обучения я пришел к некоторым выводам, которые приведены ниже (я рассматриваю только контролируемое обучение). Шаг 1: Разделение данных Перед обработкой данных
Data Science
Вопрос или проблема Я новичок, и у меня есть вопрос. Можно ли использовать результаты кластеризации на основе вероятности для обучающего обучения? Данные производства содержат 80000 строк. Они не размечены, но есть информация о том, что уровень дефектов составляет 7,2%.
Data Science
Вопрос или проблема Для проекта я пытаюсь предсказать утечки в сети. Сеть состоит из узлов, соединённых ссылками. У меня есть несколько “сценариев”, в каждом из которых утечка присутствует на другом узле (также возможно, что утечки нет).
Data Science
Вопрос или проблема Я хочу предсказать коэффициенты конверсии для интернет-магазина. У меня есть данные из Google Analytics с такими характеристиками, как средняя продолжительность сессии, показатель отказов, количество посетителей по источникам и т.
Data Science
Вопрос или проблема Это для многоклассовой классификации. Перед настройкой n_neighbors для KNN результаты были следующие: Точность на обучающей выборке: 99.54% Точность на тестовой выборке: 99.58% ROC AUC: 99.86% После поиска оптимального n_neighbors