supervised-learning - ответы на вопросы

Data Science

Генерация временных рядов – многомерные данные временных рядов

00

Вопрос или проблема Отказ от ответственности: Математики, пожалуйста, не сердитесь на меня за использование некоторых терминов в этом посте. Я инженер. 🙂 Предыстория: Итак, я в настоящее время работаю над задачей, где мне нужно сгенерировать последовательность

Data Science

Расширяет ли knn обучающую выборку за счет тестовых значений во время предсказания?

00

Вопрос или проблема Допустим, у меня есть 100 значений в моем наборе данных, и я разделяю их: 80% для обучения и 20% для теста. Когда я предсказываю последнее значение, основан ли прогноз на предыдущих 99 (80 тестовых + 19 уже предсказанных значений)

Data Science

плохая регрессионная производительность на несбалансированном наборе данных

00

Вопрос или проблема Мой текущий набор данных имеет форму 5300 строк на 160 столбцов с числовой целевой переменной в диапазоне=[641, 3001]. Это не большой набор данных, но в общем должно быть достаточно для достойного качества регрессии.

Data Science

Как использовать свежие данные, когда период предсказания цели длительный?

00

Вопрос или проблема Я использую обучение с учителем на данных о ежемесячной активности, чтобы предсказать, когда клиент купит конкретный продукт. Этот продукт обычно покупается редко, и в данный момент моя целевая переменная –

Data Science

Какой тип обучения необходим для обнаружения аномалий? Обучение с учителем, полуобучение или обучение без учителя?

00

Вопрос или проблема Недавно я занимаюсь обнаружением аномалий, одним из методов является использование модели АЕ для изучения паттерна нормальных образцов. Определите его как аномальный образец, если он не соответствует паттерну нормальных образцов.

Data Science

Существуют ли инструменты для визуализации и манипуляции данными?

00

Вопрос или проблема У меня есть набор данных временных рядов, который мне нужно вручную пометить для обучения с учителем. То, что я сейчас делаю, это использую Excel для построения графиков, и когда я вижу нужный мне паттерн, я навожу курсор на данные

Data Science

Переобучение EfficientNet только на 2 классах из 4.

00

Вопрос или проблема Модель EfficientNet была обучена на ~3500 изображениях для классификации на 4 класса: A, B, C и Neither – с точностью 0.985 – кем-то другим, не мной. Я довольно нов в ML. Итак, у нас есть эта модель, и она работает довольно хорошо.

Data Science

Как обучить алгоритм машинного обучения с несколькими метками

00

Вопрос или проблема У меня есть следующая проблема, и я очень надеюсь, что есть ее решение. Я также подозреваю, что существует простой подход к этому. Я просто не вижу его в данный момент. Буду очень признателен за любую помощь или совет.

Data Science

Как мне справиться с несбалансированными классами в задаче предсказания фондового рынка?

00

Вопрос или проблема Я работаю над моделью предсказания, чтобы определить, нужно ли продавать, удерживать или покупать акцию через n дней. Каждый день (или строка в наборе данных) я классифицирую, нужно ли продавать, удерживать или покупать, основываясь

Data Science

Сочетание выбора признаков машинного обучения с временными рядами

00

Вопрос или проблема У меня есть базовые знания в области прогнозирования временных рядов и алгоритмов машинного обучения с учителем и без учителя (кластеризация, классификация, деревья решений и т.д.). Сейчас мне поручили задачу прогнозирования цен на акции.

Data Science

Каковы преимущества комбинирования полун supervised и управляемых методов обучения?

00

Вопрос или проблема Я больше изучал полупод监督ное обучение, в частности, распространение меток и размножение меток. Читая учебники и некоторые статьи, я заметил, что часто результаты распространения меток затем используются для построения контролируемой модели.

Data Science

Преобразование признаков для адаптации по домену: Модификация аномальных данных для соответствия нормальным распределениям признаков.

00

Вопрос или проблема Пусть $X$ представляет собой набор данных, состоящий из $N$ экземпляров, где каждый экземпляр описывается набором признаков $\text{feat}_0, \ldots, \text{feat}_m$, а $Y$ обозначает соответствующие целевые значения.

Data Science

Модель DL для оценки качества изображения

00

Вопрос или проблема У меня есть идея, но я не уверен, что ее можно смоделировать в архитектуре глубокого обучения. Предположим, у нас есть изображения разного качества, основанные на цветовом паттерне, и их оценка в качестве меток в диапазоне от 0 до 1.

Data Science

Прогнозирование частичного ввода

00

Вопрос или проблема В контексте контролируемого машинного обучения существует ли способ сделать прогноз по частичному вводу (т.е. некоторые признаки неизвестны) в общем? Если нет, существуют ли модели, которые поддерживают эту функцию?

Data Science

Метка большого объема аудиоданных автоматически или полуавтоматически.

00

Вопрос или проблема Я работаю над проектом, где мне нужно разметить аудиоданные, в которых тысячи данных, каждое аудиоданные составляет одну секунду. Мне нужно размечать, находится ли оно в состоянии простоя, происходит ли событие или шум.

Data Science

Когда я использую линейную регрессию в машинном обучении, выбор переменных аналогичен выбору параметров настройки?

00

Вопрос или проблема Я новичок в машинном обучении. После нескольких дней изучения идей машинного обучения я пришел к некоторым выводам, которые приведены ниже (я рассматриваю только контролируемое обучение). Шаг 1: Разделение данных Перед обработкой данных

Data Science

Можно ли использовать результаты кластеризации на основе вероятности для обучения с учителем?

00

Вопрос или проблема Я новичок, и у меня есть вопрос. Можно ли использовать результаты кластеризации на основе вероятности для обучающего обучения? Данные производства содержат 80000 строк. Они не размечены, но есть информация о том, что уровень дефектов составляет 7,2%.

Data Science

Алгоритм бинарной классификации, где входные переменные являются массивами.

00

Вопрос или проблема Для проекта я пытаюсь предсказать утечки в сети. Сеть состоит из узлов, соединённых ссылками. У меня есть несколько “сценариев”, в каждом из которых утечка присутствует на другом узле (также возможно, что утечки нет).

Data Science

Машинное обучение и временные данные

00

Вопрос или проблема Я хочу предсказать коэффициенты конверсии для интернет-магазина. У меня есть данные из Google Analytics с такими характеристиками, как средняя продолжительность сессии, показатель отказов, количество посетителей по источникам и т.

Data Science

ROC_AUC значение выше до настройки n_neighbors для KNN.

00

Вопрос или проблема Это для многоклассовой классификации. Перед настройкой n_neighbors для KNN результаты были следующие: Точность на обучающей выборке: 99.54% Точность на тестовой выборке: 99.58% ROC AUC: 99.86% После поиска оптимального n_neighbors