machine-learning
Data Science
Вопрос или проблема Я работаю над задачей классификации, где экземпляры могут одновременно принадлежать нескольким классам. Например: Фильм может быть отмечен несколькими жанрами, такими как “Экшен”, “Комедия”
Data Science
Вопрос или проблема У меня есть набор данных (350 тысяч данных) о сотрудниках из разных регионов за последние 10 лет. Набор данных состоит из их навыков, региона, в котором они находятся, отрасли, их текущей роли, их зарплаты в соответствующей валюте.
Data Science
Вопрос или проблема Для регрессионных задач с #Предикторами > #наблюдений я недавно читал о псевдообратной матрице Мура-Пенроуза, которая решает проблему невозвратимой матрицы в МНК для регрессионных задач. Насколько хорошо это “
Data Science
Вопрос или проблема Это для многоклассовой классификации. Перед настройкой n_neighbors для KNN результаты были следующие: Точность на обучающей выборке: 99.54% Точность на тестовой выборке: 99.58% ROC AUC: 99.86% После поиска оптимального n_neighbors
Data Science
Вопрос или проблема Предположим, у нас есть архитектура глубокой нейронной сети с слоем, который должен быть общим между двумя “подсетями”. Пример: from keras.layers import Input, Dense from keras.models import Model main_input = Input(shape=(5
Data Science
Вопрос или проблема Рассмотрим задачу обучения ранжированию, где я обучаюсь на N элементах, отображаемых пользователю для каждого запроса. Предположим, что я могу количественно оценить вероятность исследования $P[E_i]$ каждой позиции $i$ при условии
Data Science
Вопрос или проблема В общем, U-Net нужен для создания изображения в другом стиле, но с сохранением структуры. Например, полноценный рисунок из эскиза. Верно? Я хочу сохранить стиль, но изменить структуру. Например, я хочу взять фото с смятой тканью и
Data Science
Вопрос или проблема Что касается нелинейной и многомерной регрессии, я использую R или Matlab. В случае, когда у меня есть регрессия только с двумя переменными, я просто рисую график Y относительно X и ищу уравнение модели, которое наилучшим образом соответствует
Data Science
Вопрос или проблема Я вижу, что потери валидации используются для предотвращения переобучения обучающей выборки, а кросс-валидация используется для обобщения результатов моделей. Используются ли они для схожих целей или результатов?
Data Science
Вопрос или проблема Мне не понятно понятие нескольких ячеек в LSTM. Если у меня есть слой LSTM с 64 ячейками, как ячейки будут применяться к каждому временном шагу при разворачивании. Мое понимание состоит в том, что каждый временной шаг будет применяться
Data Science
Вопрос или проблема Я хочу поэтапно обучать свою предобученную модель автокодировщика на данных, которые поступают каждую минуту. Основываясь на этой теме, последовательные вызовы model.fit будут поэтапно обучать модель. Однако ошибка восстановления и
Data Science
Вопрос или проблема Я работаю над проектом – «анализ настроений в твитах». Есть 5 различных настроений – крайнеNegative, негативное, нейтральное, положительное и крайне положительное. Так что это, в основном, задача обработки естественного
Data Science
Вопрос или проблема Если fcam=3, будет ли условное fp-дерево все равно c=4 или что-то другое? Я предполагаю, что это должно быть f=3, c=4, a=3, m=3. Я прав? Или что-то другое? Пожалуйста, подскажите. Также, на этой ниже приведенной фигуре (та же фигура
Data Science
Вопрос или проблема Моя проблема имеет регрессионный характер – Как оценить вес рыбы, используя сигнал фиксированной длины (80 точек данных) изменения сопротивления, когда рыба проплывает через ворота с электроды (по сути, 4 секунды прохождения
Data Science
Вопрос или проблема Я использую партии по 100000 строк из CSV файла для обучения простой модели LASSO. Как мне объеденить все эти модели, обученные на разных партициях? Я хотел бы использовать все эти обученные модели для предсказания.
Data Science
Вопрос или проблема Вопрос: Какой из метрик лучше для сравнения разных моделей: RMSE или R-квадрат? Я немного поискал, обычно все блоги говорят, что обе метрики объясняют разные идеи: R-квадрат является мерой того, сколько вариации объясняет модель, а
Data Science
Вопрос или проблема Я работаю с взаимодействиями в своей модели машинного обучения, где я создаю новые признаки, умножая числовую переменную на закодированный категориальный признак. Мой вопрос: Следует ли применять нормализацию к этим термам взаимодействия?
Data Science
Вопрос или проблема Я прочитал одну научную статью, и в ней говорилось, что они используют порог для обнаружения аномалий. Порог определяется для того, чтобы сделать некоторую пропорцию данных из валидационного набора помеченной как аномалии. Как этот концепт имеет смысл?
Data Science
Вопрос или проблема У меня есть вопрос о том, как Keras обрабатывает валидацию. У меня есть предобученная модель (ResNet34 с архитектурой U-NET), и я хочу обучать ее на своем пользовательском наборе данных для бинарной сегментации.
Data Science
Вопрос или проблема У меня есть огромный набор данных в формате CSV. Я передаю этот набор данных в последовательную модель Keras. У меня вопрос: может ли моя модель иметь количество единиц больше, чем количество входных признаков?