Программное обеспечение
ВВП на душу населения для всех стран
00
Вопрос или проблема Ищу [бесплатное] веб-приложение, идентичное/похожие на этот график, но которое может: показывать все страны, работать без задержек на хромбуке за 30 долларов Реклама – это нормально; регистрация –
Программное обеспечение
ВВП на душу населения посмотрите все страны
00
Вопрос или проблема Ищу [бесплатное] веб-приложение, идентичное/похожее на этот график, но которое может: показывать все страны, должно быть без задержек на Chromebook за $30 Разрешены реклама; регистрация — нет. Дополнительные очки за: возможность показывать/скрывать
Программное обеспечение
Выполните множественную линейную регрессию в Google Sheets.
00
Вопрос или проблема Я пытаюсь запустить множественную линейную регрессию в Google Sheets, но единственное расширение, которое я могу найти для этого (XLMiner), было отключено Google в ожидании проверки. Также похоже, что процесс проверки занимает уже
Data Science
Помощь в интерпретации стандартной ошибки
00
Вопрос или проблема Я провел стандартную ошибку на своей модели машинного обучения для предсказания структуры белка. График, который я здесь показываю, является отрывком фактических данных, и я удалил некоторую несущественную информацию.
Data Science
Каково правильное значение и интерпретация p-значений?
00
Вопрос или проблема Я публикую этот вопрос, и ответ, чтобы помочь развеять некоторые недоразумения о том, что такое p-значения. Как менеджер по найму, проводящий собеседования с Data Scientist-ами среднего и старшего уровня, я неоднократно сталкивался с этими недоразумениями.
Data Science
Нахождение значения P – объяснение
00
Вопрос или проблема def get_pvalue(con_conv, test_conv, con_size, test_size,): lift = - abs(test_conv - con_conv) scale_one = con_conv * (1 - con_conv) * (1 / con_size) scale_two = test_conv * (1 - test_conv) * (1 / test_size) scale_val = (scale_one + scale_two)**0.
Data Science
Многоклассовая классификация МакНемара
00
Вопрос или проблема У меня есть проблема многоклассовой классификации, и я хочу сравнить два классификатора с помощью теста МакНемара, чтобы определить, есть ли статистическая значимость. Я должен делать это для каждого класса (подход “
Вопросы и ответы
Как проверить, есть ли у моего спектра один симметричный пик, то есть гауссовский.
00
Вопрос или проблема Например, есть 2 спектра: Спектр 15 имеет почти симметричный пик и близкую к гауссовой форму, так что это сигнал. Спектр 371 вообще не имеет пика и должен рассматриваться как шум. Я знаю, что могу сделать гауссово приближение для каждого
Data Science
Связь между основной функцией и основной функцией вероятностного распределения данных.
00
Вопрос или проблема Я слышал и читал множество раз следующие утверждения и с течением времени испытал много путаницы. Утверждение 1: Цель машинного обучения заключается в том, чтобы получить функцию на основе данных. Утверждение 2: Цель машинного обучения
Data Science
Прогнозирование производительности продавца
00
Вопрос или проблема Я пытаюсь предсказать/прогнозировать эффективность продавцов по неделям, месяцам, кварталам и годам на основе продуктов, которые они продали за 3 года. В рамках этой работы я сгруппировал количество проданных единиц по штатам, местоположениям
Data Science
измерение дисперсии различий между двумя наборами соответствующих средних с учетом значимости
00
Вопрос или проблема У меня есть датафрейм id, w, x, y1, y2 (две категориальные переменные, две зависимые переменные) id – это индекс, который не является особенно информативным w, x – категориальные переменные –
Data Science
Обнаружение аномалий/выбросов в реальном времени?
00
Вопрос или проблема Мои данные – это статистика использования/игры для игроков конкретной игры. Одна точка данных для пользователя – это агрегированная статистика за одну неделю. Цель заключается в следующем: обнаружить, когда аккаунт игрока
Data Science
Мера схожести смоделированных временных рядов и наблюдаемых временных рядов
00
Вопрос или проблема В моей работе у меня есть наблюдаемая временная серия и смоделированные. Я хочу сравнить кривые света и проверить на сходство, чтобы выяснить, какая смоделированная кривая лучше всего соответствует, и какие параметры лучше всего моделируют кривую света.
Data Science
Мне нужно определить, какой статистический тест и представление данных использовать.
00
Вопрос или проблема Если я хочу получить 2 пользователей для получения значений с помощью программного обеспечения. Эти числа соответствуют теме. Я хочу сравнить схожесть между числами, которые получает каждый пользователь для каждой темы.
Data Science
P-значение с использованием гауссовского дискриминантного анализа
00
Вопрос или проблема Я задумался, в модели Гауссовского дискриминантного анализа (GDA), скажем, у нас есть два класса для классификации y=0 и y=1 После подгонки гауссианы по наборам данных y=0 и y=1, когда мы пытаемся предсказать класс для новой тестовой
Data Science
Я пишу дипломную работу по анализу биографий авторов и хотел бы получить немного совета.
00
Вопрос или проблема Я студент факультета компьютерных наук и большую часть своей учебы проходил, работая полный рабочий день веб-разработчиком, поэтому мои учебные занятия немного пострадали. Теперь, на финишной прямой моего обучения, я хотел сделать
Data Science
Понимание доверительного интервала
00
Вопрос или проблема Я пытаюсь понять концепцию доверительных интервалов. Каково значение точечных оценок и доверительных интервалов? Я понял, что точечная оценка в доверительном интервале по сути является статистикой распределения выборки.
Data Science
Почему 100%-ная точность на тестовых данных не является хорошей?
00
Вопрос или проблема Мне задали этот вопрос на собеседовании, и я не смог дать удовлетворительный ответ не только по ожиданиям интервьюеров, но и по своим собственным. Вопрос был как выше, только он позже привел пример, почему, если моя модель предсказала
Data Science
Как вычислить временно задержанную корреляцию между двумя переменными с множеством примеров в каждый момент времени t?
00
Вопрос или проблема У меня есть словарь следующей формы: datetimes = {год : {имя : (оценка1, оценка2)}} # есть 50+ имен/год Таким образом, по сути, я пытаюсь получить общее представление о том, как оценка1 в год_n коррелирует с оценкой2 в год_n.
Data Science
Как можно построить модель на основе не независимых несбалансированных данных?
00
Вопрос или проблема Я пытаюсь предсказать отток клиентов на основе имеющихся у меня данных. Я определяю отток как деятельность, которой не предшествует другая деятельность в течение недели. Клиент может вернуться через два месяца и снова стать активным