machine-learning
Data Science
Вопрос или проблема У меня есть дата-фрейм, который выглядит примерно так: A B C 1 2 2 2 4 3 4 8 5 9 16 7 16 32 11 22 43 14 28 55 17 34 67 20 40 79 23 A, B и C можно считать признаками в литературе по машинному обучению. Я изучал […]
Data Science
Вопрос или проблема Как мне присвоить вероятность предсказанию, выведенному моделью гауссовского наивного байеса? Я спрашиваю, потому что функция predict_proba, которую вы можете использовать с классификатором гауссовского наивного байеса в sklearn, дает
Data Science
Вопрос или проблема Я пытаюсь создать модель NER, которая может называть сущности в “Описание работы”. Сущности: Обязательные навыки (Обязательные навыки, такие как java, python, c++ и т.д.) Желательные навыки (кандидат “
Data Science
Вопрос или проблема Я хочу написать метод для тестирования нескольких гипотез для пары школ (скажем, TAMU и UT Austin). Я хочу рассмотреть все возможные пары слов (Исследование, Тезис, Предложение, ИИ, Аналитика) и протестировать гипотезу о том, что количество
Data Science
Вопрос или проблема Я новичок, и у меня есть вопрос. Можно ли использовать результаты кластеризации на основе вероятности для обучающего обучения? Данные производства содержат 80000 строк. Они не размечены, но есть информация о том, что уровень дефектов составляет 7,2%.
Data Science
Вопрос или проблема Как я могу изменить пороговое значение для каждого классификатора? В ROC-анализе мы можем убрать галочку с “умолчательного порога”. Я не думаю, что вы можете сделать это для классификаторов или любых других виджетов (например, матрицы смешения).
Data Science
Вопрос или проблема Я хочу предсказать коэффициенты конверсии для интернет-магазина. У меня есть данные из Google Analytics с такими характеристиками, как средняя продолжительность сессии, показатель отказов, количество посетителей по источникам и т.
Data Science
Вопрос или проблема Я работаю с книгой Прикладное предсказательное моделирование и столкнулся с чем-то, что оказалось немного запутанным. В ней обсуждалось добавление нелинейности в модель для улучшения её подгонки – этот момент мне понятен. Например: $x^2 + 2x –
Data Science
Вопрос или проблема У меня есть строка букв, которая соответствует “грамматике”. У меня также есть булевские метки в моем обучающем наборе данных о том, соответствует ли строка “грамматике” или нет. В основном, моя модель пытается
Data Science
Вопрос или проблема В коротком summary вопрос состоит в следующем: как я могу построить регулярно обновляемую цепь тем, которая также покажет, как темы возникают и исчезают со временем? Чтобы быть более точным: – У меня есть данные с временными
Data Science
Вопрос или проблема У меня есть 3 модели sklearn, которые я использую для прогнозирования вероятности для задачи бинарной классификации. Я хочу создать взвешенное среднее значение всех предсказаний, сделанных этими моделями. Я затрудняюсь с тем, как найти оптимальные веса.
Data Science
Вопрос или проблема Я работаю над задачей классификации, где экземпляры могут одновременно принадлежать нескольким классам. Например: Фильм может быть отмечен несколькими жанрами, такими как “Экшен”, “Комедия”
Data Science
Вопрос или проблема У меня есть набор данных (350 тысяч данных) о сотрудниках из разных регионов за последние 10 лет. Набор данных состоит из их навыков, региона, в котором они находятся, отрасли, их текущей роли, их зарплаты в соответствующей валюте.
Data Science
Вопрос или проблема Для регрессионных задач с #Предикторами > #наблюдений я недавно читал о псевдообратной матрице Мура-Пенроуза, которая решает проблему невозвратимой матрицы в МНК для регрессионных задач. Насколько хорошо это “
Data Science
Вопрос или проблема Это для многоклассовой классификации. Перед настройкой n_neighbors для KNN результаты были следующие: Точность на обучающей выборке: 99.54% Точность на тестовой выборке: 99.58% ROC AUC: 99.86% После поиска оптимального n_neighbors
Data Science
Вопрос или проблема Предположим, у нас есть архитектура глубокой нейронной сети с слоем, который должен быть общим между двумя “подсетями”. Пример: from keras.layers import Input, Dense from keras.models import Model main_input = Input(shape=(5
Data Science
Вопрос или проблема Рассмотрим задачу обучения ранжированию, где я обучаюсь на N элементах, отображаемых пользователю для каждого запроса. Предположим, что я могу количественно оценить вероятность исследования $P[E_i]$ каждой позиции $i$ при условии
Data Science
Вопрос или проблема В общем, U-Net нужен для создания изображения в другом стиле, но с сохранением структуры. Например, полноценный рисунок из эскиза. Верно? Я хочу сохранить стиль, но изменить структуру. Например, я хочу взять фото с смятой тканью и
Data Science
Вопрос или проблема Что касается нелинейной и многомерной регрессии, я использую R или Matlab. В случае, когда у меня есть регрессия только с двумя переменными, я просто рисую график Y относительно X и ищу уравнение модели, которое наилучшим образом соответствует
Data Science
Вопрос или проблема Я вижу, что потери валидации используются для предотвращения переобучения обучающей выборки, а кросс-валидация используется для обобщения результатов моделей. Используются ли они для схожих целей или результатов?