Data Science
Регрессия – Модель в целом выглядит хорошо, но R2 неожиданно отрицательно высок.
00
Вопрос или проблема Я строил модель линейной регрессии с около 150 строками данных. Я проверил корреляцию параметров с целевой переменной и попытался оставить только их, так как у меня меньше данных, и я хотел получить простую линейную модель.
Data Science
Экзогенные и эндогенные переменные в структурной причинной модели
00
Вопрос или проблема https://en.wikipedia.org/wiki/Causal_model#Definition Википедия определяет каузальные модели как: упорядоченную тройку $\langle U, V, E\rangle$, где $U$ – это множество экзогенных переменных, значения которых определяются факторами вне модели;
Data Science
Взаимосвязь между двумя непрерывными переменными в данных временных рядов
00
Вопрос или проблема У меня есть набор данных, который собирает ежедневные данные на основе транзакций между двумя субъектами. Я хочу выяснить силу, направление и вид отношения между двумя непрерывными переменными, т.е. количеством транзакций (No_of_transactions)
Data Science
Как измерить влияние Covid, анализируя транзакции по кредитным картам клиентов.
00
Вопрос или проблема Я хочу знать, как можно определить, находится ли клиент в финансовом затруднении из-за ситуации с COVID, используя его транзакции по кредитной карте. У меня есть ежедневные транзакции клиентов до текущей даты.
Data Science
Сегментация клиентов: Должен ли я использовать переменную, представляющую продукт, который непопулярен в наборе данных для кластеризации K-средних?
00
Вопрос или проблема Я работаю с набором данных, который, помимо возраста и дохода клиентов, показывает баланс, который есть у клиента на различных типах банковских счетов: расчетные, акции, инвестиции, сбережения, депозиты, ипотека, кредит и сертификаты.
Data Science
Какое разумное распределение можно использовать для моделирования просмотров со временем для… этого вопроса?
00
Вопрос или проблема Извините за самоцитирующийся заголовок 😉 Мне было бы любопытно узнать, какая кривая могла бы использоваться для моделирования – в масштабе (скажем) недель* – “цикла вовлеченности” одной новостной страницы онлайн-газеты
Data Science
Показ стандартного отклонения для кривой обучения
00
Вопрос или проблема Я тренирую нейронную сеть и хотел построить график изменения различных метрик (MSE…) в процессе обучения. Чтобы получить представление о вариациях между разными обучениями, я использую несколько моделей и строю среднее значение и стандартное отклонение.
Data Science
Расчет относительного стандартного отклонения с помощью пользовательской функции в R
00
Вопрос или проблема Я измерил концентрации элементов в ряде образцов. Каждая концентрация является средним значением трех измерений. Также записана стандартная девиация этих измерений. Я пытался рассчитать относительную стандартную девиацию с помощью
Data Science
Найдите изменения в переменных в двух состояниях.
00
Вопрос или проблема У меня есть такой датафрейм: dframe <- structure(list(c(60, 91, 377, 419, 893, 905), c(-0.6647, -0.0275000000000001, -0.6311, 0.1328, -0.4559, -1.0208), c(-1.6964, -1.3851, -1.1428, -1.4191, -1.2979, -1.
Программное обеспечение
ВВП на душу населения для всех стран
00
Вопрос или проблема Ищу [бесплатное] веб-приложение, идентичное/похожие на этот график, но которое может: показывать все страны, работать без задержек на хромбуке за 30 долларов Реклама – это нормально; регистрация –
Программное обеспечение
ВВП на душу населения посмотрите все страны
00
Вопрос или проблема Ищу [бесплатное] веб-приложение, идентичное/похожее на этот график, но которое может: показывать все страны, должно быть без задержек на Chromebook за $30 Разрешены реклама; регистрация — нет. Дополнительные очки за: возможность показывать/скрывать
Программное обеспечение
Выполните множественную линейную регрессию в Google Sheets.
01
Вопрос или проблема Я пытаюсь запустить множественную линейную регрессию в Google Sheets, но единственное расширение, которое я могу найти для этого (XLMiner), было отключено Google в ожидании проверки. Также похоже, что процесс проверки занимает уже
Data Science
Помощь в интерпретации стандартной ошибки
00
Вопрос или проблема Я провел стандартную ошибку на своей модели машинного обучения для предсказания структуры белка. График, который я здесь показываю, является отрывком фактических данных, и я удалил некоторую несущественную информацию.
Data Science
Каково правильное значение и интерпретация p-значений?
00
Вопрос или проблема Я публикую этот вопрос, и ответ, чтобы помочь развеять некоторые недоразумения о том, что такое p-значения. Как менеджер по найму, проводящий собеседования с Data Scientist-ами среднего и старшего уровня, я неоднократно сталкивался с этими недоразумениями.
Data Science
Нахождение значения P – объяснение
00
Вопрос или проблема def get_pvalue(con_conv, test_conv, con_size, test_size,): lift = - abs(test_conv - con_conv) scale_one = con_conv * (1 - con_conv) * (1 / con_size) scale_two = test_conv * (1 - test_conv) * (1 / test_size) scale_val = (scale_one + scale_two)**0.
Data Science
Многоклассовая классификация МакНемара
00
Вопрос или проблема У меня есть проблема многоклассовой классификации, и я хочу сравнить два классификатора с помощью теста МакНемара, чтобы определить, есть ли статистическая значимость. Я должен делать это для каждого класса (подход “
Вопросы и ответы
Как проверить, есть ли у моего спектра один симметричный пик, то есть гауссовский.
00
Вопрос или проблема Например, есть 2 спектра: Спектр 15 имеет почти симметричный пик и близкую к гауссовой форму, так что это сигнал. Спектр 371 вообще не имеет пика и должен рассматриваться как шум. Я знаю, что могу сделать гауссово приближение для каждого
Data Science
Связь между основной функцией и основной функцией вероятностного распределения данных.
00
Вопрос или проблема Я слышал и читал множество раз следующие утверждения и с течением времени испытал много путаницы. Утверждение 1: Цель машинного обучения заключается в том, чтобы получить функцию на основе данных. Утверждение 2: Цель машинного обучения
Data Science
Прогнозирование производительности продавца
00
Вопрос или проблема Я пытаюсь предсказать/прогнозировать эффективность продавцов по неделям, месяцам, кварталам и годам на основе продуктов, которые они продали за 3 года. В рамках этой работы я сгруппировал количество проданных единиц по штатам, местоположениям
Data Science
измерение дисперсии различий между двумя наборами соответствующих средних с учетом значимости
00
Вопрос или проблема У меня есть датафрейм id, w, x, y1, y2 (две категориальные переменные, две зависимые переменные) id – это индекс, который не является особенно информативным w, x – категориальные переменные –