Data Science
Что значит нормализовать временной ряд по отношению к другому?
00
Вопрос или проблема Я рассматриваю способы уменьшения размерностей многомерного набора данных до одномерных сигналов. Но сначала нужно провести некоторую предобработку. Кто-то упомянул, что мне следует объединить сигналы, сначала нормализовав временные
Data Science
Как удалить неактуальную информацию из списков сущностей?
00
Вопрос или проблема Я хочу извлечь сущности, используя 5 списков сущностей, которые я собрал. Списки на Python содержат около миллиона элементов каждый. Списки следующие: национальность, организация, профессия, религия, хобби.
Компьютеры и программы
Почему отчет о внедрении IPv6 от Google показывает всплеск каждую субботу? [закрыто]
00
Вопрос или проблема Закрыто. Этот вопрос не по теме. На данный момент он не принимает ответы. Этот вопрос не связан с аппаратным или программным обеспечением компьютера, в пределах, определенных в центре помощи. Закрыто 3 часа назад.
Вопросы и ответы

Как rnorm и runif работают так быстро?

00
Вопрос или проблема Я только что реализовал/обратное проектировал rnorm на чистом R, но, похоже, он медленнее, чем базовый R rnorm. edm1_rnorm1 <- function(mean_inpt, sd_inpt, n_inpt, offset_proba = 0.00001, cur_step = "auto", accuracy_factor = 10){ offset_val <
Вопросы и ответы
Как изменить массив с помощью numpy.where() на основе условного оператора?
00
Вопрос или проблема Я пытаюсь использовать numpy для генерации массива из 60 случайных чисел (либо 0, либо 1, то есть подмножества Бернулли биномиального распределения). Эта первая часть кода работает хорошо, так как генерирует 60 случайных (0 или 1 значений
Data Science
Анализ распределения вероятностей каждого признака и машинное обучение
00
Вопрос или проблема Хотя я знаю, что вероятностные распределения предназначены для проверки гипотез, построения доверительных интервалов и т. д., они определенно играют множество ролей в статистическом анализе. Тем не менее, мне не очевидно, как вероятностные
Data Science
Как исправить левостороннюю и правостороннюю асимметрию.
00
Вопрос или проблема Я знаю, что левый и правый скошенность означает, что у него длинный хвост либо слева (левая скошенность), либо справа (правая скошенность). Однако приведённый ниже пример является примером правой скошенности.
Data Science
Как найти среднее время задержки с дисперсией и доверительным интервалом для двух временных рядов
00
Вопрос или проблема У меня есть две переменные в виде временных рядов, одна из которых является следствием другой. Я хотел бы найти среднюю временную задержку, которую требует зависимая переменная для реакции на независимую переменную.
Data Science
Как найти распределение одной переменной на основе распределения населения
00
Вопрос или проблема Я пытаюсь найти распределение возраста подмножества женатых людей в популяции. Однако я понимаю, что простая визуализация количества женатых по возрасту (Рисунок 1) сильно зависит от исходного распределения возрастов в популяции, как показано на Рисунке 2.
Data Science
Добавление признаков с высоким p-значением и низким R-квадратом в линейную регрессию для улучшения результата.
00
Вопрос или проблема Я работаю над задачей линейной регрессии. Признаки для моего анализа были выбраны с использованием p-значений и знаний в области. После выбора этих признаков производительность $R^2$ и $RMSE$ улучшилась с 0.
Data Science
Мне нужно проводить какие-либо статистические тесты на результатах?
00
Вопрос или проблема Я провожу кампанию по email-рассылке. Перед тем как отправить письма пользователям, я разделил свою пользовательскую базу на опытную и контрольные группы (50-50). Я разделил группы так, чтобы не было разницы в поведении пользователей.
Data Science
Машинное обучение, статистика и математика
00
Вопрос или проблема Я только начал углубляться в машинное обучение, и каждый раз, когда я пытаюсь разобраться в концепциях или коде, я сталкиваюсь с математическими задачами и их запутанными обозначениями. Имея опыт в компьютерных науках, я немного их
Data Science
Измерение полноты или уровня ложных отрицаний в сильно несбалансированном наборе данных
00
Вопрос или проблема Мы хотим измерить полноту (или уровень ложных отрицаний) для нашей модели машинного обучения. Проблема в том, что Положительные случаи встречаются только в
Вопросы и ответы
Какой быстрый и статистически мощный способ эвристического удаления дубликатов из множества (неупорядоченных) множеств?
00
Вопрос или проблема У меня есть приложение, в котором я (эвристически) создаю большой набор тестовых кандидатов, которые сами по себе представляют собой большие наборы элементов в произвольном порядке. Чтобы не использовать один и тот же тестовый кандидат
Data Science
Разделение датафрейма на основе содержимого строк
00
Вопрос или проблема У меня есть датафрейм с 50000 строк и 5 столбцов. В столбце VarName есть два типа данных: 1 – DatiStatistica_CombiWeight, 2 – DatiStatistica_TargetWeight Я отфильтровал строки, содержащие DatiStatistica_TargetWeight Я хотел
Data Science
Альтернативные минимальные квадраты
00
Вопрос или проблема Может ли кто-нибудь объяснить разницу между Alternating Least Squares (ALS) и системами推荐? Будет полезно, если вы приведете пример. Системы推荐, например рекомендации фильмов Netflix, предположительно достаточно понятны.
Data Science
Есть ли безопасный и простой способ оценить стандартное отклонение для следующего подмножества?
00
Вопрос или проблема В случае, если я получаю только стандартное отклонение от датчика значения $v$ (которое, кстати, нормально распределено) каждые 4 минуты, но мне нужно предоставить стандартное отклонение $\sigma$ каждые 15 минут, есть ли безопасный способ это сделать.
Data Science
Индекс стабильности населения против Индекса точности населения
00
Вопрос или проблема Может ли кто-нибудь объяснить мне разницу между Индексом Стабильности Популяции (PSI) и Индексом Точности Популяции (PAI)? Стабильность популяции относится к тому, изменяется ли распределение объясняющих переменных со временем.
Data Science
Работа с несколькими экземплярами конкретной целевой функции в большом наборе данных.
00
Вопрос или проблема У меня есть данные о машине, которая включает в себя различные компоненты. Все детали взаимодействуют, данные отслеживаются для этих частей, учитывается потребление энергии и множество других измерений, связанных с их характеристиками.
Data Science
Методы выборки для текстовых наборов данных (NLP)
00
Вопрос или проблема Я работаю с двумя наборами текстовых данных, один из которых содержит 68 тысяч образцов текста, а другой – 100 тысяч образцов. Я закодировал текстовые наборы в векторы BERT. Образец текста > 'Я работаю с NLP' ==>