classification
Data Science
Вопрос или проблема Допустим, я пытаюсь предсказать, будет ли автомобиль продан на аукционе или нет (это не то, чем я на самом деле занимаюсь, но это хорошо это иллюстрирует), используя табличные данные. У меня есть год выпуска автомобиля, его цвет, модель и т.
Data Science
Вопрос или проблема Мне просто любопытно, и я хотел бы знать, возможно ли получить оценки для каждого предсказания в модели многоклассовой классификации. Если это возможно, как я могу реализовать это, чтобы делать предсказания на моих оригинальных наборах
Data Science
Вопрос или проблема У меня есть 1000 данных из двувариантного нормального распределения $\mathcal{N}$ со средним $(0,0)$ и дисперсией $\sigma_1^2=\sigma_2^2=10$, при этом ковариация равна $0$. Также есть еще 20 точек из другого двувариантного нормального
Data Science
Вопрос или проблема Можно ли классифицировать мои изображения (детали автомобилей) по типу детали автомобиля (дверь, окно …) и также по виду изображения (фронт, зад, право, лево, верх и низ)? Мои картинки помечены следующим образом: View_idPart
Data Science
Вопрос или проблема У меня в настоящее время есть 2 алгоритма, которые выдают числовой результат. Используя порог 0,9, я получаю результаты классификации. Допустим, это: P (высокая точность, низкая полнота) R (высокая полнота, низкая точность) Каждый
Data Science
Вопрос или проблема Я работаю над задачей многомерной бинарной классификации. Я хочу предсказать бинарную классификацию, учитывая признаки в текущий момент времени и данные (признаки + реальная классификация) из предыдущих моментов времени.
Data Science
Вопрос или проблема Я часто слышал о таких мерах, как индекс стабильности населения и индекс стабильности характеристик. Возможно, я ошибаюсь, но они, похоже, более применимы для анализа изменений в унивариантных распределениях и более линейны.
Data Science
Вопрос или проблема Пока что я наткнулся на много советов и статей о PU-обучении и унарной классификации. Короче говоря: есть ли у кого-нибудь предложения по конкретным алгоритмам или реализациям для размеченных данных только одного класса и разметки
Data Science
Вопрос или проблема Я обучаю свою модель на почти 200 000 изображениях, использую Jupyter, и после 3 дней обучения (я использовал 800 эпох и размер батча = 600) у меня появилось сообщение “ядро, похоже, умерло. Оно перезапустится автоматически”
Data Science
Вопрос или проблема Я пытаюсь построить классификационную модель. Признаки являются чисто булевыми (не бинарными) и находятся в csv-файле, как 1,0,1,.. Результат — это int в диапазоне (0, 128). Я подумал, имеет ли смысл не тратить ресурсы на операции
Data Science
Вопрос или проблема Я обучаю классификатор SGD перед тем, как применить масштабирование, и он дает точность 0.02. После того, как я применяю масштабирование, точность составляет 0.85. В чем может быть проблема? clf = SGDClassifier(loss="hinge", penalty="l2"
Data Science
Вопрос или проблема В основном, мне интересно, существуют ли методы в машинном обучении, которые позволяют модели учитывать события, происходящие в реальном времени, которые влияют на данные в течение этого периода. Тогда мы можем заставить модель придавать
Data Science
Вопрос или проблема У меня есть набор данных с примерно 200 000 записей. Целевая переменная бинарная, и только 4000 экземпляров принадлежат классу интереса. Я хотел бы уменьшить число экземпляров большинства, чтобы получить набор данных с 8000 записей
Data Science
Вопрос или проблема У меня есть большая проблема с данными, связанная с большим набором данных (например, 50 миллионов строк и 200 столбцов). Набор данных состоит из около 100 числовых столбцов и 100 категориальных столбцов, а также колонки с ответом
Data Science
Вопрос или проблема У меня есть несколько рядов цен одного и того же актива, как показано ниже. Визуально очевидно, что ряд “A” (горизонтальная линия) является выбросом, и ряд “E” (линия с зигзагообразным паттерном) также ведет себя иначе.
Data Science
Вопрос или проблема Я делаю небольшой ПOC, в котором я обучил свою модель машинного обучения (Наивный Байес) и сохранил в формате “.pkl” (pickle). Теперь моя следующая задача — разработать веб-приложение, которое будет запрашивать у пользователя
Data Science
Вопрос или проблема Я хочу классифицировать изображения, поступающие из видеопотока с движущейся камеры, на несколько различных знаков, но проблема в том, что есть 2 типа знаков, которые очень похожи: end_curve (буква D сверху и внизу буква X) start_curve
Data Science
Вопрос или проблема У меня есть набор данных, аналогичный newsgroup20, для классификации. С обучающим набором данных у меня есть набор данных словаря, который объясняет некоторые жаргоны в обучающем наборе данных. Эти два набора данных различны, так как
Data Science
Вопрос или проблема Мне интересно, какие шаги вы предпринимаете, чтобы решить, какую часть модели разморозить. Вы проводите несколько экспериментов? Поскольку использование GPU дорогостоящее, у вас должны быть какие-то рекомендации.
Data Science
Вопрос или проблема Я работаю над проектом по кластеризации воздушных объектов на основе их траекторий. Я хотел бы обучить модель на наборе данных с траекториями различных летающих объектов, чтобы позже я мог предсказать, к какому типу объекта относится