Data Science
Недостаточная/избыточная выборка учит модель неправильному распределению?
00
Вопрос или проблема Суть: Обучение модели с использованием недо/пересемплирования в процессе обучения приведет к неправильному распределению и негативно скажется на точности? Предположим, вы хотите обучить классификатор для различения класса A и класса B.
Data Science
Согласование многопиковых гистограмм
00
Вопрос или проблема Я анализирую множество файлов данных, которые представляют собой реакцию клеток на добавление препарата. Если препарат не добавляется, клетка реагирует нормально, если он добавляется, она показывает аномальные паттерны: , .
Data Science
Как выбрать выборку из набора данных с учетом заданной категориальной или числовой переменной на основе заданного произвольно выбранного распределения? (Python)
00
Вопрос или проблема Предположим, у меня есть набор данных за некоторый прошлый период. Теперь появляются новые данные, и для данной переменной в данных мы находим, что распределения изменились (например, с “возрастом”
Вопросы и ответы
R GAMLSS : Как подогнать логарифмически-логистическое распределение (усеченное)?
00
Вопрос или проблема Я пытаюсь подогнать усеченное логистическое распределение (log-logistic) с помощью GAMLSS и не могу найти, как это сделать. В документации сказано, что для обобщенной бета-распределения 2 (GB2): установка ν = 1 и τ = 1 в (15.
Data Science
Правильный способ сравнения результатов бинарных классификаторов с различной чувствительностью
00
Вопрос или проблема Я сравниваю 5 сторонних классификационных моделей на подмножестве результатов (в частности, ложно положительных, которые я исследую, чтобы найти общую причину). Все пять моделей выдают значения от 0 до 1, но, похоже, имеют разную общую чувствительность.
Вопросы и ответы
Почему версия моего iPhone приложения для macOS недоступна в App Store Connect?
00
Вопрос или проблема Мое приложение для iPhone было успешно загружено в App Store Connect и распространено среди широкой аудитории. Теперь я пытаюсь перенести приложение на macOS; я могу тестировать его на Mac через TestFlight.
Data Science
Как объединить данные с похожим распределением?
00
Вопрос или проблема У меня есть коллекция данных временных рядов с точками данных, охватывающими примерно 2 года ежедневных данных. Я подумываю о способе увеличения числа данных в ней, чтобы нейронная сеть лучше понимала колебания в данных.
Data Science
Является ли дисперсия пропорциональной максимальному расстоянию между образцами распределения?
00
Вопрос или проблема У меня есть два набора данных: первый набор set1=[2,2,2,4.5], а второй набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, для set1 получится: для set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому
Data Science
Биномиальный тест для данных с 3 переменными
00
Вопрос или проблема Я собрал данные, которые выглядят так: Компания А Компания Б Компания В Отдел Женщины Мужчины Женщины Мужчины Женщины Мужчины Искусство 98 2 95 5 80 20 Инженерия 2 98 30 70 10 90 Уборка 100 0 90 10 70 30 Теперь мой учитель попросил
Data Science
Анализ распределения вероятностей каждого признака и машинное обучение
00
Вопрос или проблема Хотя я знаю, что вероятностные распределения предназначены для проверки гипотез, построения доверительных интервалов и т. д., они определенно играют множество ролей в статистическом анализе. Тем не менее, мне не очевидно, как вероятностные
Data Science
Биномиальная семья в логистической регрессии
00
Вопрос или проблема Меня спросили на интервью, почему мы используем биномиальное распределение в логистической регрессии и как это связано с классом, который мы предсказываем? Может кто-то объяснить, без каких-либо математических уравнений, почему мы
Data Science
Как найти распределение одной переменной на основе распределения населения
00
Вопрос или проблема Я пытаюсь найти распределение возраста подмножества женатых людей в популяции. Однако я понимаю, что простая визуализация количества женатых по возрасту (Рисунок 1) сильно зависит от исходного распределения возрастов в популяции, как показано на Рисунке 2.
Data Science
Что такое дисперсия распределения?
00
Вопрос или проблема У меня есть два набора данных: один набор set1=[2,2,2,4.5] и другой набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, то set1 будет: set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому ожидал
Data Science
В чем разница между сдвигом ковариат, сдвигом метки, сдвигом концепта, дрейфом концепта и сдвигом априорной вероятности?
00
Вопрос или проблема Как начинающему в MLOps, мне было трудно с некоторыми запутанными определениями. Насколько я понимаю, когда у нас есть классификатор или регрессор с функцией y = f(X): Covariate Shift означает изменение распределения независимых переменных
Data Science
Поиск правильных выражений для параметров DistributionLambda в TensorFlow Probability
00
Вопрос или проблема В TensorFlow Probability, когда мы создаем модель с использованием слоя DistributionLambda, мы должны передать выражения для параметров распределения. Чаще всего эти выражения каким-то образом преобразуют выход предыдущего слоя.
Data Science
Не IID переменные и классификатор SVM
00
Вопрос или проблема Я обучаю модель SVM для предсказания тренда цен на акции (предсказания на один день вперед. Задача классификации). Совершенно забыл, что SVM предполагает IID данные, пока не поговорил с другом. Это заставило меня переосмыслить свой
Data Science
Линейный дискриминантный анализ и PDF
01
Вопрос или проблема Я изучаю материал по LDA. Я не на 100% уверен, как интерпретировать PDF двух выборок в контексте LDA. Допустим, такая ситуация: Во-первых, почему форма розового PDF справа более узкая? Приоритет выше, но это не имеет ничего общего с формой PDF.