Data Science
Обработка сдвига ковариат и многоколлинеарности в одном наборе данных
00
Вопрос или проблема Проблема связана с регрессионной задачей. Я получаю партии данных из источника эксперимента, который имеет примерно 3 тысячи столбцов. Однако я заметил, что почти 99% столбцов сильно коррелируют друг с другом.
Data Science
Как мы можем различить мета-анализ и статистический анализ?
00
Вопрос или проблема Оба термина часто используются в статистических методах. Я считаю, что статистическое рассуждение/теория поддерживают мета-анализ. Какова реальная связь между двумя терминами? Помогите мне понять два концепта.
Data Science
Как строится матрица совпадений для вычисления альфа Криппендорфа?
00
Вопрос или проблема Я изучаю два документа, чтобы лучше понять, как строить матрицы совпадений с целью получения более полного представления о коэффициенте альфа Криппендорфа. Я использую эти два: https://repository.upenn.edu/cgi/viewcontent.cgi?article=1043&
Data Science
Как рассчитать лексическую связность и семантическую информативность для заданного набора данных?
01
Вопрос или проблема В ‘Автоматическом построении лексиконов, таксономий, онтологий и других структур знаний’ упоминается; Существует два немного разных класса измерений: лексическая связанность (иногда называемая ‘унитностью’ или ‘фразовостью’)
Компьютеры и программы
Рассчитайте медиану на основе количества значений.
00
Вопрос или проблема У меня есть данные о том, сколько у нас конкретных процессоров и их показатели CPU. На основе этого я хочу динамически рассчитывать медиа- и квартильные статистики. Например, у меня есть таблица, которая выглядит так: Название Количество
Вопросы и ответы
Ошибка размера плота: попытка использовать имя переменной нулевой длины
00
Вопрос или проблема У меня ошибка в этом коде. Я пытаюсь подстроить размер графика. Это хорошо работало в предыдущей версии R. После недавнего обновления у меня возникает ошибка “попытка использовать имя переменной нулевой длины”
Data Science
Как управлять ошибкой выжившего в метриках конверсии?
00
Вопрос или проблема Я пытаюсь понять, как работают уменьшенные доходы от дополнительной рекламы. В основном, конвертируется ли 2-я реклама хуже, чем 1-я, и так далее. Мне тяжело думать о том, как справляться с смещением выживаемости, потому что, если
Data Science
Интерпретация дисперсии оценок параметров в линейной регрессии
00
Вопрос или проблема Я читаю ESL и наткнулся на это уравнение (3.6), где дисперсия оценок параметров представлена как $$Var(\hat{\beta}) = (X^TX)^{-1}{\sigma}^2$$ Я понимаю математику, с помощью которой получается это уравнение, но я пытаюсь понять, что
Вопросы и ответы
Куртоз: мезокуртическое (нормальное) распределение, асимметрия: распределение с правой или левой асимметрией. Возможно ли это для набора данных/переменной?
00
Вопрос или проблема Пример 1: Куртоз: лептокуртическое распределение Скошенность: распределение с правым скошением Пример 2: Куртоз: лептокуртическое распределение Скошенность: распределение с левым скошением Пример 3: Куртоз: платикуртическое распределение
Data Science
Как прогнозировать доход от контрактов с привязкой ко времени?
00
Вопрос или проблема Я изучаю идеи о том, как я могу прогнозировать доход от контрактов. Например, у меня могут быть клиенты, которые приобрели ежемесячный мобильный план, годовой план или трехлетний план. Как я могу использовать эту информацию для прогнозирования дохода?
Data Science
Сочетание нескольких вероятностей от классификатора. Пропагирование вероятностей.
00
Вопрос или проблема Допустим, я обучил классификатор, который классифицирует изображения животных на 10 разных классов. И предположим, что у меня есть 20 различных изображений конкретного животного, и поскольку я знаю фотографа, я с уверенностью знаю
Data Science
Что значит нормализовать временной ряд по отношению к другому?
00
Вопрос или проблема Я рассматриваю способы уменьшения размерностей многомерного набора данных до одномерных сигналов. Но сначала нужно провести некоторую предобработку. Кто-то упомянул, что мне следует объединить сигналы, сначала нормализовав временные
Data Science
Как удалить неактуальную информацию из списков сущностей?
00
Вопрос или проблема Я хочу извлечь сущности, используя 5 списков сущностей, которые я собрал. Списки на Python содержат около миллиона элементов каждый. Списки следующие: национальность, организация, профессия, религия, хобби.
Компьютеры и программы
Почему отчет о внедрении IPv6 от Google показывает всплеск каждую субботу? [закрыто]
00
Вопрос или проблема Закрыто. Этот вопрос не по теме. На данный момент он не принимает ответы. Этот вопрос не связан с аппаратным или программным обеспечением компьютера, в пределах, определенных в центре помощи. Закрыто 3 часа назад.
Вопросы и ответы

Как rnorm и runif работают так быстро?

00
Вопрос или проблема Я только что реализовал/обратное проектировал rnorm на чистом R, но, похоже, он медленнее, чем базовый R rnorm. edm1_rnorm1 <- function(mean_inpt, sd_inpt, n_inpt, offset_proba = 0.00001, cur_step = "auto", accuracy_factor = 10){ offset_val <
Вопросы и ответы
Как изменить массив с помощью numpy.where() на основе условного оператора?
00
Вопрос или проблема Я пытаюсь использовать numpy для генерации массива из 60 случайных чисел (либо 0, либо 1, то есть подмножества Бернулли биномиального распределения). Эта первая часть кода работает хорошо, так как генерирует 60 случайных (0 или 1 значений
Data Science
Анализ распределения вероятностей каждого признака и машинное обучение
00
Вопрос или проблема Хотя я знаю, что вероятностные распределения предназначены для проверки гипотез, построения доверительных интервалов и т. д., они определенно играют множество ролей в статистическом анализе. Тем не менее, мне не очевидно, как вероятностные
Data Science
Как исправить левостороннюю и правостороннюю асимметрию.
00
Вопрос или проблема Я знаю, что левый и правый скошенность означает, что у него длинный хвост либо слева (левая скошенность), либо справа (правая скошенность). Однако приведённый ниже пример является примером правой скошенности.
Data Science
Как найти среднее время задержки с дисперсией и доверительным интервалом для двух временных рядов
00
Вопрос или проблема У меня есть две переменные в виде временных рядов, одна из которых является следствием другой. Я хотел бы найти среднюю временную задержку, которую требует зависимая переменная для реакции на независимую переменную.
Data Science
Как найти распределение одной переменной на основе распределения населения
00
Вопрос или проблема Я пытаюсь найти распределение возраста подмножества женатых людей в популяции. Однако я понимаю, что простая визуализация количества женатых по возрасту (Рисунок 1) сильно зависит от исходного распределения возрастов в популяции, как показано на Рисунке 2.