statistics
Data Science
Вопрос или проблема Я рассматриваю способы уменьшения размерностей многомерного набора данных до одномерных сигналов. Но сначала нужно провести некоторую предобработку. Кто-то упомянул, что мне следует объединить сигналы, сначала нормализовав временные
Data Science
Вопрос или проблема Я хочу извлечь сущности, используя 5 списков сущностей, которые я собрал. Списки на Python содержат около миллиона элементов каждый. Списки следующие: национальность, организация, профессия, религия, хобби.
Компьютеры и программы
Вопрос или проблема Закрыто. Этот вопрос не по теме. На данный момент он не принимает ответы. Этот вопрос не связан с аппаратным или программным обеспечением компьютера, в пределах, определенных в центре помощи. Закрыто 3 часа назад.
Вопросы и ответы
Вопрос или проблема Я только что реализовал/обратное проектировал rnorm на чистом R, но, похоже, он медленнее, чем базовый R rnorm. edm1_rnorm1 <- function(mean_inpt, sd_inpt, n_inpt, offset_proba = 0.00001, cur_step = "auto", accuracy_factor = 10){ offset_val <
Вопросы и ответы
Вопрос или проблема Я пытаюсь использовать numpy для генерации массива из 60 случайных чисел (либо 0, либо 1, то есть подмножества Бернулли биномиального распределения). Эта первая часть кода работает хорошо, так как генерирует 60 случайных (0 или 1 значений
Data Science
Вопрос или проблема Хотя я знаю, что вероятностные распределения предназначены для проверки гипотез, построения доверительных интервалов и т. д., они определенно играют множество ролей в статистическом анализе. Тем не менее, мне не очевидно, как вероятностные
Data Science
Вопрос или проблема Я знаю, что левый и правый скошенность означает, что у него длинный хвост либо слева (левая скошенность), либо справа (правая скошенность). Однако приведённый ниже пример является примером правой скошенности.
Data Science
Вопрос или проблема У меня есть две переменные в виде временных рядов, одна из которых является следствием другой. Я хотел бы найти среднюю временную задержку, которую требует зависимая переменная для реакции на независимую переменную.
Data Science
Вопрос или проблема Я пытаюсь найти распределение возраста подмножества женатых людей в популяции. Однако я понимаю, что простая визуализация количества женатых по возрасту (Рисунок 1) сильно зависит от исходного распределения возрастов в популяции, как показано на Рисунке 2.
Data Science
Вопрос или проблема Я работаю над задачей линейной регрессии. Признаки для моего анализа были выбраны с использованием p-значений и знаний в области. После выбора этих признаков производительность $R^2$ и $RMSE$ улучшилась с 0.
Data Science
Вопрос или проблема Я провожу кампанию по email-рассылке. Перед тем как отправить письма пользователям, я разделил свою пользовательскую базу на опытную и контрольные группы (50-50). Я разделил группы так, чтобы не было разницы в поведении пользователей.
Data Science
Вопрос или проблема Я только начал углубляться в машинное обучение, и каждый раз, когда я пытаюсь разобраться в концепциях или коде, я сталкиваюсь с математическими задачами и их запутанными обозначениями. Имея опыт в компьютерных науках, я немного их
Data Science
Вопрос или проблема Мы хотим измерить полноту (или уровень ложных отрицаний) для нашей модели машинного обучения. Проблема в том, что Положительные случаи встречаются только в
Вопросы и ответы
Вопрос или проблема У меня есть приложение, в котором я (эвристически) создаю большой набор тестовых кандидатов, которые сами по себе представляют собой большие наборы элементов в произвольном порядке. Чтобы не использовать один и тот же тестовый кандидат
Data Science
Вопрос или проблема У меня есть датафрейм с 50000 строк и 5 столбцов. В столбце VarName есть два типа данных: 1 – DatiStatistica_CombiWeight, 2 – DatiStatistica_TargetWeight Я отфильтровал строки, содержащие DatiStatistica_TargetWeight Я хотел
Data Science
Вопрос или проблема Может ли кто-нибудь объяснить разницу между Alternating Least Squares (ALS) и системами推荐? Будет полезно, если вы приведете пример. Системы推荐, например рекомендации фильмов Netflix, предположительно достаточно понятны.
Data Science
Вопрос или проблема В случае, если я получаю только стандартное отклонение от датчика значения $v$ (которое, кстати, нормально распределено) каждые 4 минуты, но мне нужно предоставить стандартное отклонение $\sigma$ каждые 15 минут, есть ли безопасный способ это сделать.
Data Science
Вопрос или проблема Может ли кто-нибудь объяснить мне разницу между Индексом Стабильности Популяции (PSI) и Индексом Точности Популяции (PAI)? Стабильность популяции относится к тому, изменяется ли распределение объясняющих переменных со временем.
Data Science
Вопрос или проблема У меня есть данные о машине, которая включает в себя различные компоненты. Все детали взаимодействуют, данные отслеживаются для этих частей, учитывается потребление энергии и множество других измерений, связанных с их характеристиками.
Data Science
Вопрос или проблема Я работаю с двумя наборами текстовых данных, один из которых содержит 68 тысяч образцов текста, а другой – 100 тысяч образцов. Я закодировал текстовые наборы в векторы BERT. Образец текста > 'Я работаю с NLP' ==>