classification - ответы на вопросы

Data Science

Трансформерная сеть классификации предсказывает один и тот же класс.

00

Вопрос или проблема Я разрабатываю нейронную сеть на основе трансформеров для бинарной классификации. Оба класса сбалансированы (по 750k наблюдений для каждого). Во время обучения значение потерь и метрик становится NaN после нескольких батчей (примерно через 50 батчей).

Data Science

Классификация, когда классификация предыдущих элементов имеет значение.

00

Вопрос или проблема У меня есть проблема классификации, которую кажется, часто встречают, но я не могу найти название этой задачи и лучший способ моделирования этой проблемы. Допустим, у меня есть серия событий, которые происходят последовательно во времени.

Data Science

Трансформации данных в иерархической классификации

00

Вопрос или проблема Я строю иерархический текстовый классификатор, используя подход Local Classifier Per Parent Node (LCPN) с политикой ‘siblings’, как описано в обзоре иерархической классификации в различных областях применения: Например

Data Science

Наивный Байес с использованием алгоритма максимизации ожидания vs логистическая регрессия для бинарной классификации

00

Вопрос или проблема Предположим, я имею дело с бинарной классификацией. Для какого типа данных использование Наивного Байеса с использованием метода максимального правдоподобия даст лучшее решение, а для какого типа данных логистическая регрессия будет лучшим выбором?

Data Science

В чем разница между оценкой GridSearchCrossValidation и оценкой на тестовом наборе данных?

00

Вопрос или проблема Я занимаюсь классификацией с использованием Python. Я использую класс GridSearchCV, этот класс имеет атрибут best_score_, определяемый как “Средняя кросс-валидиционная оценка лучшего оценщика”. С этим классом я также могу

Data Science

Машинное обучение: Сравнение моделей классификации

00

Вопрос или проблема Дан набор данных, который мне нужно использовать для классификации, и я хочу сравнить эффективность различных моделей классификации. Предположим, я хочу рассмотреть логистическую регрессию (с разными точками отсечения) и KNN.

Data Science

Агрегация низкоуровневых признаков для классификатора

00

Вопрос или проблема Цель заключается в прогнозировании отказа/неотказа маршрутизатора (1/0) в будущем временном окне с использованием всех данных, собранных за последний час (т.е. бинарная цель). Данные получаются на двух уровнях: Метрики маршрутизатора

Data Science

Различие в показателях производительности модели между обучающей и тестовой выборками.

00

Вопрос или проблема Я использую метод классификации CART, разделяя набор данных на обучающую и тестовую выборки. Я использовал ошибку классификации, KS по ранговой сортировке, AUC и Gini в качестве MPM (меры производительности модели).

Data Science

Как непрерывно обучать и проверять модель, которая влияет на свои собственные будущие данные?

00

Вопрос или проблема Мы работаем с онлайн-рынком. Наша задача – предсказать, будут ли определенные продукты прибыльными для нашего рынка в ближайшем будущем (горизонт – один месяц). Например, рассмотрим 2 продукта: Игрушка Жираф (предсказана неприбыльной)

Data Science

Бинарная + Нейтральная Классификация

00

Вопрос или проблема У меня есть набор данных постов для анализа настроений, которые помечены как -1 (негативные), 1 (позитивные) или 0 (нейтральные). Я задумываюсь над тем, как с этим работать. Вот мои идеи: создать мультиклассовый классификатор: я пробовал

Data Science

Преобразовать задачу многоклассовой классификации в многометочную проблему.

00

Вопрос или проблема Я нашел этот вопрос, но мне нужен ответ в другом направлении. Пример: Предположим, мы хотим предсказать, захочет ли человек с определенным профилем купить продукт A и/или B. Итак, у нас есть 2 бинарных класса A и B, которые не исключают

Data Science

Расширяет ли knn обучающую выборку за счет тестовых значений во время предсказания?

00

Вопрос или проблема Допустим, у меня есть 100 значений в моем наборе данных, и я разделяю их: 80% для обучения и 20% для теста. Когда я предсказываю последнее значение, основан ли прогноз на предыдущих 99 (80 тестовых + 19 уже предсказанных значений)

Data Science

Стандартные наборы данных для задач классического машинного обучения

00

Вопрос или проблема Я знаком и работал со многими наборами данных в классическом машинном обучении, а также в глубоком обучении. Я также осведомлён о некоторых стандартных наборах данных в глубоком обучении (например, ImageNet для классификации изображений и т.

Data Science

Потери на обучении застряли на начальных эпохах, но затем начинают уменьшаться. Какова могла бы быть причина этого?

00

Вопрос или проблема Я обучаю модель, в которой столкнулся с уникальной проблемой: в течение первых 4 эпох моя функция потерь не изменялась, но после этого начала изменяться. Может быть, это из-за высокой скорости обучения, локального минимума или чего-то

Data Science

Как использовать нечеткую тематическую модель в качестве входных данных для классификационной модели

00

Вопрос или проблема У меня есть нечеткая кластеризация для тематического моделирования, и я получил это . Всего существует 50 тем [0-49], и каждая тема состоит из 30 слов с вероятностным мультипликативным фактором. Теперь как мне сделать это входными

Data Science

Следует ли очищать шестнадцатеричные адреса набора данных?

00

Вопрос или проблема Я работаю над обнаружением мошенничества в блокчейнах. Более конкретно, я получил большое количество транзакций, которые произошли в блокчейне, пометил их как спам/не спам, используя соответствующий API, и теперь буду обучать модель

Data Science

Сравнить эффективность классификации подмножеств набора данных.

00

Вопрос или проблема Предположим, у меня есть такой набор данных, на котором я хочу провести классификацию: id feature class factor 1 … 1 A 2 … 1 B 3 … 2 A 4 … 2 B $\vdots$ Как я могу сравнить производительность модели, учитывая значения фактора?

Data Science

Уделите больше внимания признакам, основываясь на графике распределения.

00

Вопрос или проблема У меня есть задача предсказать бинарную переменную purchase, их датасет сильно несбалансирован (10:100), и модели, которые я пробовал до сих пор (в основном ансамблевые), не справляются. Кроме того, я также пытался применить SMOTE

Data Science

Получить зависимые вероятности в многоклассовой классификации

00

Вопрос или проблема После обучения моей модели CatBoostClassifier я вызываю функцию get_proba, которая возвращает мне список вероятностей. Проблема начинается с другой стороны… Я переношу эти данные в датафрейм, затем в Excel, после чего суммирую

Data Science

Как отделить периодические данные от временных рядов?

00

Вопрос или проблема В настоящее время я работаю над задачей классификации упражнений в спортзале на основе данных акселерометра. Я пытаюсь модульно извлечь окна, чтобы обучить свою модель на основе метрик в пределах окна (которое должно содержать одно