Data Science
Трансформерная сеть классификации предсказывает один и тот же класс.
00
Вопрос или проблема Я разрабатываю нейронную сеть на основе трансформеров для бинарной классификации. Оба класса сбалансированы (по 750k наблюдений для каждого). Во время обучения значение потерь и метрик становится NaN после нескольких батчей (примерно через 50 батчей).
Data Science
Классификация, когда классификация предыдущих элементов имеет значение.
00
Вопрос или проблема У меня есть проблема классификации, которую кажется, часто встречают, но я не могу найти название этой задачи и лучший способ моделирования этой проблемы. Допустим, у меня есть серия событий, которые происходят последовательно во времени.
Data Science
Трансформации данных в иерархической классификации
00
Вопрос или проблема Я строю иерархический текстовый классификатор, используя подход Local Classifier Per Parent Node (LCPN) с политикой ‘siblings’, как описано в обзоре иерархической классификации в различных областях применения: Например
Data Science
Наивный Байес с использованием алгоритма максимизации ожидания vs логистическая регрессия для бинарной классификации
00
Вопрос или проблема Предположим, я имею дело с бинарной классификацией. Для какого типа данных использование Наивного Байеса с использованием метода максимального правдоподобия даст лучшее решение, а для какого типа данных логистическая регрессия будет лучшим выбором?
Data Science
В чем разница между оценкой GridSearchCrossValidation и оценкой на тестовом наборе данных?
00
Вопрос или проблема Я занимаюсь классификацией с использованием Python. Я использую класс GridSearchCV, этот класс имеет атрибут best_score_, определяемый как “Средняя кросс-валидиционная оценка лучшего оценщика”. С этим классом я также могу
Data Science
Машинное обучение: Сравнение моделей классификации
00
Вопрос или проблема Дан набор данных, который мне нужно использовать для классификации, и я хочу сравнить эффективность различных моделей классификации. Предположим, я хочу рассмотреть логистическую регрессию (с разными точками отсечения) и KNN.
Data Science
Агрегация низкоуровневых признаков для классификатора
00
Вопрос или проблема Цель заключается в прогнозировании отказа/неотказа маршрутизатора (1/0) в будущем временном окне с использованием всех данных, собранных за последний час (т.е. бинарная цель). Данные получаются на двух уровнях: Метрики маршрутизатора
Data Science
Различие в показателях производительности модели между обучающей и тестовой выборками.
00
Вопрос или проблема Я использую метод классификации CART, разделяя набор данных на обучающую и тестовую выборки. Я использовал ошибку классификации, KS по ранговой сортировке, AUC и Gini в качестве MPM (меры производительности модели).
Data Science
Как непрерывно обучать и проверять модель, которая влияет на свои собственные будущие данные?
00
Вопрос или проблема Мы работаем с онлайн-рынком. Наша задача – предсказать, будут ли определенные продукты прибыльными для нашего рынка в ближайшем будущем (горизонт – один месяц). Например, рассмотрим 2 продукта: Игрушка Жираф (предсказана неприбыльной)
Data Science
Бинарная + Нейтральная Классификация
00
Вопрос или проблема У меня есть набор данных постов для анализа настроений, которые помечены как -1 (негативные), 1 (позитивные) или 0 (нейтральные). Я задумываюсь над тем, как с этим работать. Вот мои идеи: создать мультиклассовый классификатор: я пробовал
Data Science
Преобразовать задачу многоклассовой классификации в многометочную проблему.
00
Вопрос или проблема Я нашел этот вопрос, но мне нужен ответ в другом направлении. Пример: Предположим, мы хотим предсказать, захочет ли человек с определенным профилем купить продукт A и/или B. Итак, у нас есть 2 бинарных класса A и B, которые не исключают
Data Science
Расширяет ли knn обучающую выборку за счет тестовых значений во время предсказания?
00
Вопрос или проблема Допустим, у меня есть 100 значений в моем наборе данных, и я разделяю их: 80% для обучения и 20% для теста. Когда я предсказываю последнее значение, основан ли прогноз на предыдущих 99 (80 тестовых + 19 уже предсказанных значений)
Data Science
Стандартные наборы данных для задач классического машинного обучения
00
Вопрос или проблема Я знаком и работал со многими наборами данных в классическом машинном обучении, а также в глубоком обучении. Я также осведомлён о некоторых стандартных наборах данных в глубоком обучении (например, ImageNet для классификации изображений и т.
Data Science
Потери на обучении застряли на начальных эпохах, но затем начинают уменьшаться. Какова могла бы быть причина этого?
00
Вопрос или проблема Я обучаю модель, в которой столкнулся с уникальной проблемой: в течение первых 4 эпох моя функция потерь не изменялась, но после этого начала изменяться. Может быть, это из-за высокой скорости обучения, локального минимума или чего-то
Data Science
Как использовать нечеткую тематическую модель в качестве входных данных для классификационной модели
00
Вопрос или проблема У меня есть нечеткая кластеризация для тематического моделирования, и я получил это . Всего существует 50 тем [0-49], и каждая тема состоит из 30 слов с вероятностным мультипликативным фактором. Теперь как мне сделать это входными
Data Science
Следует ли очищать шестнадцатеричные адреса набора данных?
00
Вопрос или проблема Я работаю над обнаружением мошенничества в блокчейнах. Более конкретно, я получил большое количество транзакций, которые произошли в блокчейне, пометил их как спам/не спам, используя соответствующий API, и теперь буду обучать модель
Data Science
Сравнить эффективность классификации подмножеств набора данных.
00
Вопрос или проблема Предположим, у меня есть такой набор данных, на котором я хочу провести классификацию: id feature class factor 1 … 1 A 2 … 1 B 3 … 2 A 4 … 2 B $\vdots$ Как я могу сравнить производительность модели, учитывая значения фактора?
Data Science
Уделите больше внимания признакам, основываясь на графике распределения.
00
Вопрос или проблема У меня есть задача предсказать бинарную переменную purchase, их датасет сильно несбалансирован (10:100), и модели, которые я пробовал до сих пор (в основном ансамблевые), не справляются. Кроме того, я также пытался применить SMOTE
Data Science
Получить зависимые вероятности в многоклассовой классификации
00
Вопрос или проблема После обучения моей модели CatBoostClassifier я вызываю функцию get_proba, которая возвращает мне список вероятностей. Проблема начинается с другой стороны… Я переношу эти данные в датафрейм, затем в Excel, после чего суммирую
Data Science
Как отделить периодические данные от временных рядов?
00
Вопрос или проблема В настоящее время я работаю над задачей классификации упражнений в спортзале на основе данных акселерометра. Я пытаюсь модульно извлечь окна, чтобы обучить свою модель на основе метрик в пределах окна (которое должно содержать одно