distribution
Data Science
Вопрос или проблема Суть: Обучение модели с использованием недо/пересемплирования в процессе обучения приведет к неправильному распределению и негативно скажется на точности? Предположим, вы хотите обучить классификатор для различения класса A и класса B.
Data Science
Вопрос или проблема Я анализирую множество файлов данных, которые представляют собой реакцию клеток на добавление препарата. Если препарат не добавляется, клетка реагирует нормально, если он добавляется, она показывает аномальные паттерны: , .
Data Science
Вопрос или проблема Предположим, у меня есть набор данных за некоторый прошлый период. Теперь появляются новые данные, и для данной переменной в данных мы находим, что распределения изменились (например, с “возрастом”
Вопросы и ответы
Вопрос или проблема Я пытаюсь подогнать усеченное логистическое распределение (log-logistic) с помощью GAMLSS и не могу найти, как это сделать. В документации сказано, что для обобщенной бета-распределения 2 (GB2): установка ν = 1 и τ = 1 в (15.
Data Science
Вопрос или проблема Я сравниваю 5 сторонних классификационных моделей на подмножестве результатов (в частности, ложно положительных, которые я исследую, чтобы найти общую причину). Все пять моделей выдают значения от 0 до 1, но, похоже, имеют разную общую чувствительность.
Вопросы и ответы
Вопрос или проблема Мое приложение для iPhone было успешно загружено в App Store Connect и распространено среди широкой аудитории. Теперь я пытаюсь перенести приложение на macOS; я могу тестировать его на Mac через TestFlight.
Data Science
Вопрос или проблема У меня есть коллекция данных временных рядов с точками данных, охватывающими примерно 2 года ежедневных данных. Я подумываю о способе увеличения числа данных в ней, чтобы нейронная сеть лучше понимала колебания в данных.
Data Science
Вопрос или проблема У меня есть два набора данных: первый набор set1=[2,2,2,4.5], а второй набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, для set1 получится: для set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому
Data Science
Вопрос или проблема Я собрал данные, которые выглядят так: Компания А Компания Б Компания В Отдел Женщины Мужчины Женщины Мужчины Женщины Мужчины Искусство 98 2 95 5 80 20 Инженерия 2 98 30 70 10 90 Уборка 100 0 90 10 70 30 Теперь мой учитель попросил
Data Science
Вопрос или проблема Хотя я знаю, что вероятностные распределения предназначены для проверки гипотез, построения доверительных интервалов и т. д., они определенно играют множество ролей в статистическом анализе. Тем не менее, мне не очевидно, как вероятностные
Data Science
Вопрос или проблема Меня спросили на интервью, почему мы используем биномиальное распределение в логистической регрессии и как это связано с классом, который мы предсказываем? Может кто-то объяснить, без каких-либо математических уравнений, почему мы
Data Science
Вопрос или проблема Я пытаюсь найти распределение возраста подмножества женатых людей в популяции. Однако я понимаю, что простая визуализация количества женатых по возрасту (Рисунок 1) сильно зависит от исходного распределения возрастов в популяции, как показано на Рисунке 2.
Data Science
Вопрос или проблема У меня есть два набора данных: один набор set1=[2,2,2,4.5] и другой набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, то set1 будет: set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому ожидал
Data Science
Вопрос или проблема Как начинающему в MLOps, мне было трудно с некоторыми запутанными определениями. Насколько я понимаю, когда у нас есть классификатор или регрессор с функцией y = f(X): Covariate Shift означает изменение распределения независимых переменных
Data Science
Вопрос или проблема В TensorFlow Probability, когда мы создаем модель с использованием слоя DistributionLambda, мы должны передать выражения для параметров распределения. Чаще всего эти выражения каким-то образом преобразуют выход предыдущего слоя.
Data Science
Вопрос или проблема Я обучаю модель SVM для предсказания тренда цен на акции (предсказания на один день вперед. Задача классификации). Совершенно забыл, что SVM предполагает IID данные, пока не поговорил с другом. Это заставило меня переосмыслить свой
Data Science
Вопрос или проблема Я изучаю материал по LDA. Я не на 100% уверен, как интерпретировать PDF двух выборок в контексте LDA. Допустим, такая ситуация: Во-первых, почему форма розового PDF справа более узкая? Приоритет выше, но это не имеет ничего общего с формой PDF.