Data Science
как обрабатывать задачи классификации с несовместимыми метками?
00
Вопрос или проблема Я работаю над задачей классификации, где экземпляры могут одновременно принадлежать нескольким классам. Например: Фильм может быть отмечен несколькими жанрами, такими как “Экшен”, “Комедия”
Data Science
Нормализация валюты для прогнозирования зарплаты
00
Вопрос или проблема У меня есть набор данных (350 тысяч данных) о сотрудниках из разных регионов за последние 10 лет. Набор данных состоит из их навыков, региона, в котором они находятся, отрасли, их текущей роли, их зарплаты в соответствующей валюте.
Data Science
Насколько эффективен псевдообратный оператор Мура-Пенроуза для решения задач регрессии с переопределенной системой уравнений?
00
Вопрос или проблема Для регрессионных задач с #Предикторами > #наблюдений я недавно читал о псевдообратной матрице Мура-Пенроуза, которая решает проблему невозвратимой матрицы в МНК для регрессионных задач. Насколько хорошо это “
Data Science
ROC_AUC значение выше до настройки n_neighbors для KNN.
00
Вопрос или проблема Это для многоклассовой классификации. Перед настройкой n_neighbors для KNN результаты были следующие: Точность на обучающей выборке: 99.54% Точность на тестовой выборке: 99.58% ROC AUC: 99.86% После поиска оптимального n_neighbors
Data Science
Поэтапное обучение определенных слоев/подсетей в Keras Functional API
00
Вопрос или проблема Предположим, у нас есть архитектура глубокой нейронной сети с слоем, который должен быть общим между двумя “подсетями”. Пример: from keras.layers import Input, Dense from keras.models import Model main_input = Input(shape=(5
Data Science
Включение информации о позиционном смещении в функцию потерь ранжирования с использованием кросс-энтропии в softmax.
00
Вопрос или проблема Рассмотрим задачу обучения ранжированию, где я обучаюсь на N элементах, отображаемых пользователю для каждого запроса. Предположим, что я могу количественно оценить вероятность исследования $P[E_i]$ каждой позиции $i$ при условии
Data Science
Изображение в изображение с U-Net без пропускных соединений. Это реально?
00
Вопрос или проблема В общем, U-Net нужен для создания изображения в другом стиле, но с сохранением структуры. Например, полноценный рисунок из эскиза. Верно? Я хочу сохранить стиль, но изменить структуру. Например, я хочу взять фото с смятой тканью и
Data Science
Нахождение уравнения для модели множественной и нелинейной регрессии?
00
Вопрос или проблема Что касается нелинейной и многомерной регрессии, я использую R или Matlab. В случае, когда у меня есть регрессия только с двумя переменными, я просто рисую график Y относительно X и ищу уравнение модели, которое наилучшим образом соответствует
Data Science
Можем ли мы использовать как потери валидации, так и кросс-валидацию в CNN?
00
Вопрос или проблема Я вижу, что потери валидации используются для предотвращения переобучения обучающей выборки, а кросс-валидация используется для обобщения результатов моделей. Используются ли они для схожих целей или результатов?
Data Science
Как я могу понять несколько LSTM ячеек, развертывая их?
00
Вопрос или проблема Мне не понятно понятие нескольких ячеек в LSTM. Если у меня есть слой LSTM с 64 ячейками, как ячейки будут применяться к каждому временном шагу при разворачивании. Мое понимание состоит в том, что каждый временной шаг будет применяться
Data Science
Инкрементальное обучение на автоэнкодере для обнаружения аномалий
00
Вопрос или проблема Я хочу поэтапно обучать свою предобученную модель автокодировщика на данных, которые поступают каждую минуту. Основываясь на этой теме, последовательные вызовы model.fit будут поэтапно обучать модель. Однако ошибка восстановления и
Data Science
Какой алгоритм машинного обучения лучше всего работает с текстовыми данными и почему? Также какие метрики используются для оценки производительности модели?
00
Вопрос или проблема Я работаю над проектом – «анализ настроений в твитах». Есть 5 различных настроений – крайнеNegative, негативное, нейтральное, положительное и крайне положительное. Так что это, в основном, задача обработки естественного
Data Science
Недоразумения о числовом росте fp-дерева:
00
Вопрос или проблема Если fcam=3, будет ли условное fp-дерево все равно c=4 или что-то другое? Я предполагаю, что это должно быть f=3, c=4, a=3, m=3. Я прав? Или что-то другое? Пожалуйста, подскажите. Также, на этой ниже приведенной фигуре (та же фигура
Data Science
Какая архитектура машинного обучения подходит для регрессии сигналов фиксированной длины?
00
Вопрос или проблема Моя проблема имеет регрессионный характер – Как оценить вес рыбы, используя сигнал фиксированной длины (80 точек данных) изменения сопротивления, когда рыба проплывает через ворота с электроды (по сути, 4 секунды прохождения
Data Science
Объединить результаты нескольких моделей
00
Вопрос или проблема Я использую партии по 100000 строк из CSV файла для обучения простой модели LASSO. Как мне объеденить все эти модели, обученные на разных партициях? Я хотел бы использовать все эти обученные модели для предсказания.
Data Science
RMSE и R-квадрат
00
Вопрос или проблема Вопрос: Какой из метрик лучше для сравнения разных моделей: RMSE или R-квадрат? Я немного поискал, обычно все блоги говорят, что обе метрики объясняют разные идеи: R-квадрат является мерой того, сколько вариации объясняет модель, а
Data Science
Следует ли применять нормализацию к признаку взаимодействия
00
Вопрос или проблема Я работаю с взаимодействиями в своей модели машинного обучения, где я создаю новые признаки, умножая числовую переменную на закодированный категориальный признак. Мой вопрос: Следует ли применять нормализацию к этим термам взаимодействия?
Data Science
как установить порог для обнаружения аномалий
00
Вопрос или проблема Я прочитал одну научную статью, и в ней говорилось, что они используют порог для обнаружения аномалий. Порог определяется для того, чтобы сделать некоторую пропорцию данных из валидационного набора помеченной как аномалии. Как этот концепт имеет смысл?
Data Science
Мой валидационный набор показывает худшие результаты, даже когда я использую обучающий набор в качестве валидационного. Что может быть причиной этого?
00
Вопрос или проблема У меня есть вопрос о том, как Keras обрабатывает валидацию. У меня есть предобученная модель (ResNet34 с архитектурой U-NET), и я хочу обучать ее на своем пользовательском наборе данных для бинарной сегментации.
Data Science
Число единиц для первого слоя в модели Keras Sequential
00
Вопрос или проблема У меня есть огромный набор данных в формате CSV. Я передаю этот набор данных в последовательную модель Keras. У меня вопрос: может ли моя модель иметь количество единиц больше, чем количество входных признаков?