Data Science
Проверьте, одинаково ли распределение по неделям.
00
Вопрос или проблема У меня есть данные о продажах по клиентам (b2b) и по датам. Я хочу проверить, сохраняется ли распределение продаж по дням внутри недель от недели к неделе. Начальный набор данных Клиент Дата Продажи Alpha 2019-02-23 527 Beta 2019-02-23
Data Science
Получение сбалансированной выборки по многим переменным.
00
Вопрос или проблема Допустим, каждый элемент в моей популяции имеет несколько характеристик. Назовем их A, B, C, D, E, F. Предположим, для простоты, что каждая характеристика имеет 10 значений (но может быть любое число от 2 до 30).
Data Science
Вывод математического ожидания для дисперсии.
00
Вопрос или проблема Привет, я прослушиваю курс по распределению вероятностей в науке о данных, и ниже представлено вывод математического ожидания дисперсии Дисперсия = математическое ожидание квадратов отклонений от среднего для любого значения.
Data Science
Указание и подгонка пользовательского распределения к данным
00
Вопрос или проблема У меня есть набор данных измерений $Y$, к которому я хочу применить пользовательское распределение, чтобы получить оценку параметров распределения. Основываясь на знаниях предметной области, я знаю, что процесс, генерирующий $Y$, представляет
Data Science
Соответствие между прогнозом регрессии и сгенерированными человеком предположениями для верхнего и нижнего порогов.
00
Вопрос или проблема У меня есть база данных, содержащая числовые данные о продуктах. Я использую различные модели для прогнозирования значения признака, например, ёмкости батареи ноутбука, с учётом других признаков, таких как размер, количество ядер процессора и т.
Системное администрирование и сети
Варианты дистрибутивов серверов Linux
00
Вопрос или проблема Потенциально спорный вопрос — но я использую Debian в качестве серверной дистрибуции уже много лет, первой версией была 9 “stretch”, а сейчас я по-прежнему использую Debian 12. Тем не менее, я думаю, что сейчас пришло время для изменения.
Системное администрирование и сети
Есть ли какие-либо системы Linux, где домашний каталог для root не /root?
00
Вопрос или проблема Я смотрю на сценарий, и он содержит эти две строки: HOME="$( grep ^root: /etc/passwd | awk -F ':' '{ print $6 }' )" export HOME Это, конечно, загружает переменную с именем HOME значением /root. Отложив в сторону вопрос о том, намеренно
Data Science
метрики оценки для нескольких значений за сессию
00
Вопрос или проблема У меня есть приложение, которое выполняет мою функцию foo() несколько раз для каждой сессии пользователя. Существуют 2 альтернативных алгоритма, которые я могу реализовать в качестве функции foo(), и моя цель — оценить их на основе задержки выполнения.
Data Science
Нормальное и равномерное распределение для машинного обучения
00
Вопрос или проблема У меня есть набор данных, который соответствует закону Ципфа, так что большинство значений сконцентрировано в одном конце, а оставшиеся элементы содержат очень маленький процент. Обучение на наборе данных в таком виде введет предвзятость
Data Science
Выявление наиболее пострадавшей отрасли из-за COVID в отношении безработицы.
00
Вопрос или проблема Моя цель – определить наименее затронутые и наиболее пострадавшие от COVID-19 отрасли с точки зрения безработицы. Что касается данных, которые я буду использовать для этой задачи, у меня есть временной ряд данных о безработице
Data Science
Создание набора различных сценариев на основе некоторых начальных наблюдений.
00
Вопрос или проблема У меня в руках 3 разные временные ряда, которые моделируют 3 разные сценария (базовый, неблагоприятный, благоприятный). Каждый из этих временных рядов зависит от набора из 11 различных атрибутов, которые принимают значения для различных временных интервалов.
Data Science
Недостаточная/избыточная выборка учит модель неправильному распределению?
00
Вопрос или проблема Суть: Обучение модели с использованием недо/пересемплирования в процессе обучения приведет к неправильному распределению и негативно скажется на точности? Предположим, вы хотите обучить классификатор для различения класса A и класса B.
Data Science
Согласование многопиковых гистограмм
00
Вопрос или проблема Я анализирую множество файлов данных, которые представляют собой реакцию клеток на добавление препарата. Если препарат не добавляется, клетка реагирует нормально, если он добавляется, она показывает аномальные паттерны: , .
Data Science
Как выбрать выборку из набора данных с учетом заданной категориальной или числовой переменной на основе заданного произвольно выбранного распределения? (Python)
00
Вопрос или проблема Предположим, у меня есть набор данных за некоторый прошлый период. Теперь появляются новые данные, и для данной переменной в данных мы находим, что распределения изменились (например, с “возрастом”
Вопросы и ответы
R GAMLSS : Как подогнать логарифмически-логистическое распределение (усеченное)?
00
Вопрос или проблема Я пытаюсь подогнать усеченное логистическое распределение (log-logistic) с помощью GAMLSS и не могу найти, как это сделать. В документации сказано, что для обобщенной бета-распределения 2 (GB2): установка ν = 1 и τ = 1 в (15.
Data Science
Правильный способ сравнения результатов бинарных классификаторов с различной чувствительностью
00
Вопрос или проблема Я сравниваю 5 сторонних классификационных моделей на подмножестве результатов (в частности, ложно положительных, которые я исследую, чтобы найти общую причину). Все пять моделей выдают значения от 0 до 1, но, похоже, имеют разную общую чувствительность.
Вопросы и ответы
Почему версия моего iPhone приложения для macOS недоступна в App Store Connect?
00
Вопрос или проблема Мое приложение для iPhone было успешно загружено в App Store Connect и распространено среди широкой аудитории. Теперь я пытаюсь перенести приложение на macOS; я могу тестировать его на Mac через TestFlight.
Data Science
Как объединить данные с похожим распределением?
00
Вопрос или проблема У меня есть коллекция данных временных рядов с точками данных, охватывающими примерно 2 года ежедневных данных. Я подумываю о способе увеличения числа данных в ней, чтобы нейронная сеть лучше понимала колебания в данных.
Data Science
Является ли дисперсия пропорциональной максимальному расстоянию между образцами распределения?
00
Вопрос или проблема У меня есть два набора данных: первый набор set1=[2,2,2,4.5], а второй набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, для set1 получится: для set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому
Data Science
Биномиальный тест для данных с 3 переменными
00
Вопрос или проблема Я собрал данные, которые выглядят так: Компания А Компания Б Компания В Отдел Женщины Мужчины Женщины Мужчины Женщины Мужчины Искусство 98 2 95 5 80 20 Инженерия 2 98 30 70 10 90 Уборка 100 0 90 10 70 30 Теперь мой учитель попросил