Data Science
Что делать, если конкретная метка категории появляется только несколько раз?
00
Вопрос или проблема Допустим, я пытаюсь предсказать, будет ли автомобиль продан на аукционе или нет (это не то, чем я на самом деле занимаюсь, но это хорошо это иллюстрирует), используя табличные данные. У меня есть год выпуска автомобиля, его цвет, модель и т.
Data Science
Как я могу получить оценки каждого прогноза для многоклассовой модели классификации?
00
Вопрос или проблема Мне просто любопытно, и я хотел бы знать, возможно ли получить оценки для каждого предсказания в модели многоклассовой классификации. Если это возможно, как я могу реализовать это, чтобы делать предсказания на моих оригинальных наборах
Data Science
Граничная линия решения в задаче классификации
00
Вопрос или проблема У меня есть 1000 данных из двувариантного нормального распределения $\mathcal{N}$ со средним $(0,0)$ и дисперсией $\sigma_1^2=\sigma_2^2=10$, при этом ковариация равна $0$. Также есть еще 20 точек из другого двувариантного нормального
Data Science
CNN для классификации изображений с двумя выходами
00
Вопрос или проблема Можно ли классифицировать мои изображения (детали автомобилей) по типу детали автомобиля (дверь, окно …) и также по виду изображения (фронт, зад, право, лево, верх и низ)? Мои картинки помечены следующим образом: View_idPart
Data Science
Создание ансамблевой модели для высокой оценки F1
00
Вопрос или проблема У меня в настоящее время есть 2 алгоритма, которые выдают числовой результат. Используя порог 0,9, я получаю результаты классификации. Допустим, это: P (высокая точность, низкая полнота) R (высокая полнота, низкая точность) Каждый
Data Science
Входные данные Keras для многовариантной классификации с LSTM, используя текущие характеристики и характеристики предыдущих временных шагов и значения y.
00
Вопрос или проблема Я работаю над задачей многомерной бинарной классификации. Я хочу предсказать бинарную классификацию, учитывая признаки в текущий момент времени и данные (признаки + реальная классификация) из предыдущих моментов времени.
Data Science
Как мониторить модели классификации машинного обучения в производстве?
00
Вопрос или проблема Я часто слышал о таких мерах, как индекс стабильности населения и индекс стабильности характеристик. Возможно, я ошибаюсь, но они, похоже, более применимы для анализа изменений в унивариантных распределениях и более линейны.
Data Science
Как мне построить бинарный классификатор для тысяч положительных данных и миллионов размеченных данных?
00
Вопрос или проблема Пока что я наткнулся на много советов и статей о PU-обучении и унарной классификации. Короче говоря: есть ли у кого-нибудь предложения по конкретным алгоритмам или реализациям для размеченных данных только одного класса и разметки
Data Science
Jupyter, Python: ядро, похоже, умерло во время обучения модели на большом объеме данных.
00
Вопрос или проблема Я обучаю свою модель на почти 200 000 изображениях, использую Jupyter, и после 3 дней обучения (я использовал 800 эпох и размер батча = 600) у меня появилось сообщение “ядро, похоже, умерло. Оно перезапустится автоматически”
Data Science
Задача классификации на булевых только признаках: какие модели/слои/активаторы лучше?
00
Вопрос или проблема Я пытаюсь построить классификационную модель. Признаки являются чисто булевыми (не бинарными) и находятся в csv-файле, как 1,0,1,.. Результат — это int в диапазоне (0, 128). Я подумал, имеет ли смысл не тратить ресурсы на операции
Data Science
Линейный классификатор SGD не обучается без нормализации данных?
00
Вопрос или проблема Я обучаю классификатор SGD перед тем, как применить масштабирование, и он дает точность 0.02. После того, как я применяю масштабирование, точность составляет 0.85. В чем может быть проблема? clf = SGDClassifier(loss="hinge", penalty="l2"
Data Science
Интеграция временного контекста в модели машинного обучения
00
Вопрос или проблема В основном, мне интересно, существуют ли методы в машинном обучении, которые позволяют модели учитывать события, происходящие в реальном времени, которые влияют на данные в течение этого периода. Тогда мы можем заставить модель придавать
Data Science
Будет ли классификатор, обученный на недообученных данных, давать точные прогнозы на новых несбалансированных данных?
00
Вопрос или проблема У меня есть набор данных с примерно 200 000 записей. Целевая переменная бинарная, и только 4000 экземпляров принадлежат классу интереса. Я хотел бы уменьшить число экземпляров большинства, чтобы получить набор данных с 8000 записей
Data Science
Глубокое обучение против градиентного бустинга: когда использовать что?
00
Вопрос или проблема У меня есть большая проблема с данными, связанная с большим набором данных (например, 50 миллионов строк и 200 столбцов). Набор данных состоит из около 100 числовых столбцов и 100 категориальных столбцов, а также колонки с ответом
Data Science
Как определить, является ли целая серия выбросом по отношению к другим?
00
Вопрос или проблема У меня есть несколько рядов цен одного и того же актива, как показано ниже. Визуально очевидно, что ряд “A” (горизонтальная линия) является выбросом, и ряд “E” (линия с зигзагообразным паттерном) также ведет себя иначе.
Data Science
Интеграция NLP и приложения Angular
00
Вопрос или проблема Я делаю небольшой ПOC, в котором я обучил свою модель машинного обучения (Наивный Байес) и сохранил в формате “.pkl” (pickle). Теперь моя следующая задача — разработать веб-приложение, которое будет запрашивать у пользователя
Data Science
Как обучить модель для обнаружения определенной области (D вверху) на изображении, независимо от изменяющегося содержимого в нижней части?
00
Вопрос или проблема Я хочу классифицировать изображения, поступающие из видеопотока с движущейся камеры, на несколько различных знаков, но проблема в том, что есть 2 типа знаков, которые очень похожи: end_curve (буква D сверху и внизу буква X) start_curve
Data Science
Как использовать набор данных словаря для классификации текста?
00
Вопрос или проблема У меня есть набор данных, аналогичный newsgroup20, для классификации. С обучающим набором данных у меня есть набор данных словаря, который объясняет некоторые жаргоны в обучающем наборе данных. Эти два набора данных различны, так как
Data Science
Как выбрать слой, из которого нужно разморозить модель классификации изображений
00
Вопрос или проблема Мне интересно, какие шаги вы предпринимаете, чтобы решить, какую часть модели разморозить. Вы проводите несколько экспериментов? Поскольку использование GPU дорогостоящее, у вас должны быть какие-то рекомендации.
Data Science
Какие алгоритмы машинного обучения могут быть использованы для классификации траекторий?
00
Вопрос или проблема Я работаю над проектом по кластеризации воздушных объектов на основе их траекторий. Я хотел бы обучить модель на наборе данных с траекториями различных летающих объектов, чтобы позже я мог предсказать, к какому типу объекта относится