distribution - ответы на вопросы

Data Science

Проверьте, одинаково ли распределение по неделям.

00

Вопрос или проблема У меня есть данные о продажах по клиентам (b2b) и по датам. Я хочу проверить, сохраняется ли распределение продаж по дням внутри недель от недели к неделе. Начальный набор данных Клиент Дата Продажи Alpha 2019-02-23 527 Beta 2019-02-23

Data Science

Получение сбалансированной выборки по многим переменным.

00

Вопрос или проблема Допустим, каждый элемент в моей популяции имеет несколько характеристик. Назовем их A, B, C, D, E, F. Предположим, для простоты, что каждая характеристика имеет 10 значений (но может быть любое число от 2 до 30).

Data Science

Вывод математического ожидания для дисперсии.

00

Вопрос или проблема Привет, я прослушиваю курс по распределению вероятностей в науке о данных, и ниже представлено вывод математического ожидания дисперсии Дисперсия = математическое ожидание квадратов отклонений от среднего для любого значения.

Data Science

Указание и подгонка пользовательского распределения к данным

00

Вопрос или проблема У меня есть набор данных измерений $Y$, к которому я хочу применить пользовательское распределение, чтобы получить оценку параметров распределения. Основываясь на знаниях предметной области, я знаю, что процесс, генерирующий $Y$, представляет

Data Science

Соответствие между прогнозом регрессии и сгенерированными человеком предположениями для верхнего и нижнего порогов.

00

Вопрос или проблема У меня есть база данных, содержащая числовые данные о продуктах. Я использую различные модели для прогнозирования значения признака, например, ёмкости батареи ноутбука, с учётом других признаков, таких как размер, количество ядер процессора и т.

Системное администрирование и сети

Варианты дистрибутивов серверов Linux

00

Вопрос или проблема Потенциально спорный вопрос — но я использую Debian в качестве серверной дистрибуции уже много лет, первой версией была 9 “stretch”, а сейчас я по-прежнему использую Debian 12. Тем не менее, я думаю, что сейчас пришло время для изменения.

Системное администрирование и сети

Есть ли какие-либо системы Linux, где домашний каталог для root не /root?

00

Вопрос или проблема Я смотрю на сценарий, и он содержит эти две строки: HOME="$( grep ^root: /etc/passwd | awk -F ':' '{ print $6 }' )" export HOME Это, конечно, загружает переменную с именем HOME значением /root. Отложив в сторону вопрос о том, намеренно

Data Science

метрики оценки для нескольких значений за сессию

00

Вопрос или проблема У меня есть приложение, которое выполняет мою функцию foo() несколько раз для каждой сессии пользователя. Существуют 2 альтернативных алгоритма, которые я могу реализовать в качестве функции foo(), и моя цель — оценить их на основе задержки выполнения.

Data Science

Нормальное и равномерное распределение для машинного обучения

00

Вопрос или проблема У меня есть набор данных, который соответствует закону Ципфа, так что большинство значений сконцентрировано в одном конце, а оставшиеся элементы содержат очень маленький процент. Обучение на наборе данных в таком виде введет предвзятость

Data Science

Выявление наиболее пострадавшей отрасли из-за COVID в отношении безработицы.

00

Вопрос или проблема Моя цель – определить наименее затронутые и наиболее пострадавшие от COVID-19 отрасли с точки зрения безработицы. Что касается данных, которые я буду использовать для этой задачи, у меня есть временной ряд данных о безработице

Data Science

Создание набора различных сценариев на основе некоторых начальных наблюдений.

00

Вопрос или проблема У меня в руках 3 разные временные ряда, которые моделируют 3 разные сценария (базовый, неблагоприятный, благоприятный). Каждый из этих временных рядов зависит от набора из 11 различных атрибутов, которые принимают значения для различных временных интервалов.

Data Science

Недостаточная/избыточная выборка учит модель неправильному распределению?

00

Вопрос или проблема Суть: Обучение модели с использованием недо/пересемплирования в процессе обучения приведет к неправильному распределению и негативно скажется на точности? Предположим, вы хотите обучить классификатор для различения класса A и класса B.

Data Science

Согласование многопиковых гистограмм

00

Вопрос или проблема Я анализирую множество файлов данных, которые представляют собой реакцию клеток на добавление препарата. Если препарат не добавляется, клетка реагирует нормально, если он добавляется, она показывает аномальные паттерны: , .

Data Science

Как выбрать выборку из набора данных с учетом заданной категориальной или числовой переменной на основе заданного произвольно выбранного распределения? (Python)

00

Вопрос или проблема Предположим, у меня есть набор данных за некоторый прошлый период. Теперь появляются новые данные, и для данной переменной в данных мы находим, что распределения изменились (например, с “возрастом”

Вопросы и ответы

R GAMLSS : Как подогнать логарифмически-логистическое распределение (усеченное)?

00

Вопрос или проблема Я пытаюсь подогнать усеченное логистическое распределение (log-logistic) с помощью GAMLSS и не могу найти, как это сделать. В документации сказано, что для обобщенной бета-распределения 2 (GB2): установка ν = 1 и τ = 1 в (15.

Data Science

Правильный способ сравнения результатов бинарных классификаторов с различной чувствительностью

00

Вопрос или проблема Я сравниваю 5 сторонних классификационных моделей на подмножестве результатов (в частности, ложно положительных, которые я исследую, чтобы найти общую причину). Все пять моделей выдают значения от 0 до 1, но, похоже, имеют разную общую чувствительность.

Вопросы и ответы

Почему версия моего iPhone приложения для macOS недоступна в App Store Connect?

00

Вопрос или проблема Мое приложение для iPhone было успешно загружено в App Store Connect и распространено среди широкой аудитории. Теперь я пытаюсь перенести приложение на macOS; я могу тестировать его на Mac через TestFlight.

Data Science

Как объединить данные с похожим распределением?

00

Вопрос или проблема У меня есть коллекция данных временных рядов с точками данных, охватывающими примерно 2 года ежедневных данных. Я подумываю о способе увеличения числа данных в ней, чтобы нейронная сеть лучше понимала колебания в данных.

Data Science

Является ли дисперсия пропорциональной максимальному расстоянию между образцами распределения?

00

Вопрос или проблема У меня есть два набора данных: первый набор set1=[2,2,2,4.5], а второй набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, для set1 получится: для set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому

Data Science

Биномиальный тест для данных с 3 переменными

00

Вопрос или проблема Я собрал данные, которые выглядят так: Компания А Компания Б Компания В Отдел Женщины Мужчины Женщины Мужчины Женщины Мужчины Искусство 98 2 95 5 80 20 Инженерия 2 98 30 70 10 90 Уборка 100 0 90 10 70 30 Теперь мой учитель попросил