Data Science
Как работать с категориальными переменными при масштабировании
00
Вопрос или проблема У меня есть классификатор MLP, который используется для решения задачи бинарной классификации (например, категория A против B). Моя цель – минимизировать логарифмическую потерю, однако один из тестов, который я провожу, –
Data Science
Масштабирование и нессимметричные преобразования признаков для классификации
00
Вопрос или проблема Я хочу преобразовать некоторые значения признаков в своей модели, используя кубический корень, чтобы уменьшить некоторую асимметрию в своих данных. Однако я заметил, что после того, как я применяю кубический корень к определенным признакам
Data Science
Логарифмические шансы против логарифмической вероятности
00
Вопрос или проблема Логарифмические шансы имеют линейную зависимость с независимыми переменными, поэтому логарифмические шансы равны линейному уравнению. Что насчет логарифма вероятности? Как он связан с независимыми переменными?
Вопросы и ответы
Оценка максимального правдоподобия для дискретных данных
00
Вопрос или проблема В настоящее время я изучаю методы максимального правдоподобия для данных с биннингом и заметил, что многие подходы используют либо мультиномиальное, либо poisson распределение для вычисления правдоподобия. Мне было интересно, почему
Data Science
Как сравнить пуассоновский процесс точек, ARIMA и LSTM?
00
Вопрос или проблема Я пытаюсь сравнить три техники прогнозирования: Стационарный стохастический процесс Пуассона-GEV: где скорость возникновения событий задана пуассоновским процессом, а его интенсивность описывается распределением генеральных экстремальных значений (GEV).
Data Science
Сочетание нескольких вероятностей от классификатора. Пропагирование вероятностей.
00
Вопрос или проблема Допустим, я обучил классификатор, который классифицирует изображения животных на 10 разных классов. И предположим, что у меня есть 20 различных изображений конкретного животного, и поскольку я знаю фотографа, я с уверенностью знаю
Data Science
Как протестировать гипотезу правдоподобия на наборе данных?
00
Вопрос или проблема Как проверить следующую гипотезу? Чем больше плата, тем вероятнее, что клиент путешествует один. Используя данные ниже, как можно протестировать гипотезу? import seaborn as sns # набор данных df= sns.load_dataset('titanic') df[['fare','alone']].
Data Science
Анализ распределения вероятностей каждого признака и машинное обучение
00
Вопрос или проблема Хотя я знаю, что вероятностные распределения предназначены для проверки гипотез, построения доверительных интервалов и т. д., они определенно играют множество ролей в статистическом анализе. Тем не менее, мне не очевидно, как вероятностные
Data Science
Возможно ли найти вероятность появления экстраполированной точки на линии наилучшего соответствия, учитывая другие точки?
00
Вопрос или проблема У меня есть несколько точек (x,y), и я экстраполировал точку после получения графика наилучшей аппроксимации. Могу ли я определить вероятность появления этой точки? Связано ли это как-то с коэффициентом детерминации графика или чем-то подобным?
Data Science
Получение вероятностей действий вместо уникального предсказания в Stable Baselines 3 SAC?
00
Вопрос или проблема Я пытаюсь понять, как получить таблицу вероятностей действий вместо уникального предсказания в stable baselines 3 SAC, чтобы переопределить метод ‘predict’ и отфильтровать недопустимые действия.
Data Science
Функция потерь для вероятностной регрессии
00
Вопрос или проблема Я пытаюсь предсказать вероятность с помощью нейронной сети, но у меня возникают проблемы с тем, чтобы понять, какая функция потерь лучше. Первой мыслью для меня была перекрестная энтропия, но в других ресурсах всегда говорится об этом
Data Science
Моделирование влияния порядка событий на вероятность
00
Вопрос или проблема Задача состоит в том, чтобы смоделировать, влияет ли последовательность событий на вероятность бинарной целевой переменной. У нас есть, например, пять различных событий, которые происходят во времени (события: A, B, C, D, E).
Data Science
Прогнозирование продаж скрытых товаров магазина
00
Вопрос или проблема Я работаю над задачей прогнозирования продаж. Я могу предоставить алгоритму данные о том, какие товары были проданы, а какие нет.Как можно предоставить алгоритму информацию о товарах, которых нет в магазине?
Data Science
Сравнение значений кросс-валидации Бернулли NB и Мультиномиального NB
00
Вопрос или проблема Я тестирую многомерный наивный байесовский классификатор и бернуллиевский наивный байесовский классификатор на своем наборе данных и использую оценку кросс-валидации, чтобы лучше понять, какой из двух алгоритмов работает лучше.
Data Science
Настройка порогов с методом один против всех для многоклассовой классификации на Python
00
Вопрос или проблема В настоящее время я использую алгоритм случайного леса One vs Rest для задачи многоклассовой классификации на Python и хочу найти оптимальный порог для каждого класса. Как я могу сделать это с помощью подхода OVR (One-Vs-Rest)?