Data Science
Проблема вычисления коэффициента кликов (CTR)
00
Вопрос или проблема Итак, я выполняю практическое задание для собеседования в компании, и один из вопросов заключается в том, чтобы вычислить CTR для алгоритма сортировки. Мой вопрос: следует ли мне исключить операции, в которых не было показано никаких
Data Science
Система рекомендаций, которая соединяет пользователей друг с другом, стоит ли выбрать контентный метод или коллаборативную фильтрацию?
00
Вопрос или проблема Я пытаюсь создать систему, где пользователь приходит на платформу, выбирает тему (несколько заранее определенных тем), и тогда мы соединяем его с любым случайным пользователем онлайн, который выбрал ту же тему.
Data Science
Вопрос о коллапсировании переменной и сверхвыборке меньшинств.
00
Вопрос или проблема У меня есть несбалансированные данные, состоящие из девяти классов, и я планирую объединить их в два класса. Я провел стратифицированную (пропорциональную) выборку между тестовыми, валидационными и обучающими наборами данных в соответствии с девятью классами.
Data Science
Как интерпретировать вывод двух непрерывных переменных с использованием GAM?
00
Вопрос или проблема Мне действительно нужна помощь с GAM. Я должен выяснить, является ли ассоциация линейной или нелинейной с помощью GAM. Переменная предиктор — это температура на лаге 0, а результат — сердечно-сосудистые госпитализации (переменная подсчета).
Data Science
Как называется моя проблема – распределение количества элементов, обладающих определённым атрибутом?
00
Вопрос или проблема У меня следующая проблема: Есть большой набор записей. У каждой записи в наборе есть атрибут. Для некоторых значений атрибута существует только одна запись, для других значений есть много записей с этим значением.
Data Science
Лучше понимать диаграммы рассеяния
00
Вопрос или проблема Я пытаюсь понять, как читать диаграмму рассеяния на основе результатов моей матрицы ошибок. Это матрица ошибок: Я заметил высокую корреляцию между столбцом 5 и столбцом 6, низкую корреляцию со столбцом 11 и среднюю корреляцию со столбцом
Data Science
Проверьте, одинаково ли распределение по неделям.
00
Вопрос или проблема У меня есть данные о продажах по клиентам (b2b) и по датам. Я хочу проверить, сохраняется ли распределение продаж по дням внутри недель от недели к неделе. Начальный набор данных Клиент Дата Продажи Alpha 2019-02-23 527 Beta 2019-02-23
Программное обеспечение
Библиотека C++ для работы с вероятностными распределениями
00
Вопрос или проблема Мне нужна библиотека C++, которая позволила бы динамически конструировать распределение из широкого набора семейств распределений с соответствующими параметрами на основе данных конфигурации, прочитанных с диска или из консоли (а не
Data Science
Существует ли решение для модифицированного t-теста в Python для пространственных данных?
00
Вопрос или проблема Я ищу решение для проведения модифицированного t-теста или любую другую возможность, чтобы вычислить значимые или незначимые отношения в пространственных данных (которые могут быть стопкой растров или большим списком (не)регулярных
Data Science
Методы прогнозирования/предсказания для качественных данных?
00
Вопрос или проблема У меня есть набор данных о предупреждениях о продуктах питания, состоящий из номинальных качественных переменных, таких как тип предупреждения, страна происхождения, предпринятые действия и т.д., а также дата записи предупреждения.
Data Science
Получение сбалансированной выборки по многим переменным.
00
Вопрос или проблема Допустим, каждый элемент в моей популяции имеет несколько характеристик. Назовем их A, B, C, D, E, F. Предположим, для простоты, что каждая характеристика имеет 10 значений (но может быть любое число от 2 до 30).
Программное обеспечение
Панель мониторинга для отображения исторических метрик, полученных с помощью cron-заданий.
00
Вопрос или проблема Я хотел бы иметь панель мониторинга (я думаю о чем-то вроде статической веб-страницы с динамическими данными) для отображения некоторых метрик, которые я генерирую с помощью cronjobs… Например, я подсчитываю файлы в папке, которую
Data Science
Используйте как дифференцирование, так и нормализацию в моделировании временных рядов, чтобы сделать его стационарным.
00
Вопрос или проблема Я работаю с временным рядом. Следует ли использовать и разностное преобразование, и нормализацию, или только одно из них, чтобы сделать ряд стационарным? Нормализация не делает временной ряд стационарным, поскольку, по определению
Data Science
Сгенерировать набор значений, который имеет заданную корреляцию с n заданными другими наборами значений.
00
Вопрос или проблема Даны списки $L_1, \dots, L_n$ с, скажем, 2000 значениями каждый, и произвольные числа $c_1, \dots, c_n$. Можно ли сгенерировать случайный список из 2000 значений, который имеет корреляцию $c_i$ с $L_i$ для всех $i$?
Data Science
Значение P и степень свободы в T-тесте
00
Вопрос или проблема Я прочитал о T-тесте и о том, как мы можем использовать его для сравнения двух моделей (https://towardsdatascience.com/paired-t-test-to-evaluate-machine-learning-classifiers-1f395a6c93fa) Есть некоторые моменты, которые я не уверен
Data Science
Указание и подгонка пользовательского распределения к данным
00
Вопрос или проблема У меня есть набор данных измерений $Y$, к которому я хочу применить пользовательское распределение, чтобы получить оценку параметров распределения. Основываясь на знаниях предметной области, я знаю, что процесс, генерирующий $Y$, представляет
Data Science
Временной ряд преобразует/суммирует серию значений в одно значение.
00
Вопрос или проблема Привет, у меня есть временной ряд, который выглядит следующим образом: Дата Значение1 2021/08/01 2 и Дата Значение1 2020/08/01 4 и Дата Значение1 2019/08/01 6 Я хочу сначала сравнить данные за 2021 год с данными за 2020 год, а затем
Программное обеспечение
Приложение для отображения использования программного обеспечения на Linux?
00
Вопрос или проблема Существует ли программа для отображения использования программного обеспечения в Linux? Она должна показывать Когда последний раз использовалась Сколько раз конкретное программное обеспечение было использовано График/интерфейс “
Data Science
Анализ выживаемости: псевдо-наблюдение против стратифицированной регрессии Кокса. Что лучше?
00
Вопрос или проблема Я изучаю метод регрессии Кокса для анализа выживаемости в прогнозировании оттока. Регрессия Кокса позволит нам определить вероятность того, что абонент откажется от подписки после времени $t$, определяемого коэффициентом риска: $$
Data Science
Как учесть неопределенность коэффициентов модели в интервале прогнозирования множественной линейной регрессии
00
Вопрос или проблема Я имею дело с моделированием небольших экспериментальных наборов данных. Поскольку большинство экспериментальных работ не генерируют тысячи образцов, а скорее всего лишь несколько, мне нужно быть изобретательным в том, как справляться