Data Science
Word2vec для кодирования медицинских процедур при использовании изолирующих лесов
00
Вопрос или проблема Я планирую использовать Isolation Forests в R (пакет solitude) для выявления выбросов в медицинских исках в моих данных. Каждая строка в моих данных представляет собой группу лекарств, которые каждый провайдер назначал за последние 12 месяцев.
Вопросы и ответы
Сгруппированная столбчатая диаграмма и линейная диаграмма с двойными осями Y, метками данных и легендой
00
Вопрос или проблема Я создал комбинированный график, используя код: name <- rep(c("ba", "EW", "RW", "Se", "St", "US", "VN"), 2) value <- c(0, 6323, 7397, 13945, 11801, 55255, 22519, 4124, 13540, 9616, 57724, 6646, 22021, 8841) type <
Вопросы и ответы
Как увеличить график корреляции в corrplot?
00
Вопрос или проблема Я следовал приведенным ниже шагам, чтобы выполнить корреляцию. Это дало мне график без хорошей визуализации. Я также попробовал использовать png. library(corrplot) c_df <- Hmisc::rcorr(cor(df), type="spearman") M = c_df$r[1:3, 4:134] p.
Вопросы и ответы
R GAMLSS : Как подогнать логарифмически-логистическое распределение (усеченное)?
00
Вопрос или проблема Я пытаюсь подогнать усеченное логистическое распределение (log-logistic) с помощью GAMLSS и не могу найти, как это сделать. В документации сказано, что для обобщенной бета-распределения 2 (GB2): установка ν = 1 и τ = 1 в (15.
Вопросы и ответы
Назначение параллельных задач на менее загруженные ядра на общем сервере Windows.
00
Вопрос или проблема В параллельной обработке в R (например, с использованием future) под Windows, возможно ли заставить R приоритизировать использование менее загруженных ядер на общем устройстве? Я использую общий сервер Windows (> 200 ядер) с многими другими коллегами.
Вопросы и ответы
Существует ли эффективный способ (или пакет) для динамической фильтрации набора данных по времени между датами?
00
Вопрос или проблема Предположим, есть набор данных с дублированными PersonID и несколькими датами. PersonID Дата 1 2024-01-01 1 2024-01-02 1 2024-01-09 1 2024-01-15 2 2024-08-05 2 2024-08-06 3 2024-01-07 3 2024-01-08 3 2024-01-15 Я хочу оставить только
Вопросы и ответы

Как заставить TAM::tam работать при исправлении трудностей с элементами и когда в R есть столбцы с одиночными значениями?

00
Вопрос или проблема library(TAM) # Данные с 3 элементами и 1 кандидатом data <- t(c(item1 = 1, item2 = 0, item3 = 1)) # Определяем фиксированную матрицу сложности difficulty_matrix <- cbind(1:3, c(1.5, 2.0, 1.0)) # Подгонка модели TAM с фиксированной
Вопросы и ответы
Почему следующий код вызывает конфликт импорта?
00
Вопрос или проблема библиотека(stats, исключить = c("filter", "lag")) библиотека(tidyverse) причины ── Присоединение основных пакетов tidyverse ──────────────────────── tidyverse 2.0.0 ── ✔ dplyr 1.1.4 ✔ readr 2.1.5 ✔ forcats 1.
Вопросы и ответы
Создание круга средств
00
Вопрос или проблема Я использую rnorm в качестве набора данных и пытаюсь сделать цикл, который возьмет 100 случайных выборок с n=25, средним = 10 и стандартным отклонением = 10. Затем я хочу получить среднее значение каждой выборки и превратить его в
Вопросы и ответы

Хорошая практика для фиксированной навигационной панели с bslib

00
Вопрос или проблема Функция bslib::page_navbar имеет параметр position, который позволяет нам сохранять видимость панели навигации при прокрутке вниз (position="fixed-top"). Однако, как указывает документация: Обратите внимание, что использование “
Вопросы и ответы

Установка/создание локального пакета в R с использованием devtools::install() и devtools::build() приводит к ошибке "Ошибка: HTTP ошибка 401".

00
Вопрос или проблема Я пытаюсь установить или собрать пакет, который у меня есть локально, используя devtools::install() и devtools::build(), но получаю ошибку: Ошибка: HTTP ошибка 401. Неверные учетные данные Осталось попыток: 51/60 Сброс лимита попыток
Data Science
Сопоставление сходства между двумя различными наборами данных (маркетинговое исследование)
00
Вопрос или проблема Я работаю в компании, которая продает различные продукты клиентам. Моя задача – найти клиентов, которые, вероятно, купят продукт X, основываясь на профилях клиентов, уже купивших продукт X. Моя первая идея заключалась в следующем
Вопросы и ответы
Как найти класс тега с помощью htmltools::tagQuery с несколькими классами?
00
Вопрос или проблема Я пытаюсь tagQuery тег div с классом sw-input-icon, но не получаю никаких результатов. Я действительно думаю, что это связано с тем, что есть несколько классов. Как я могу выбрать тег div.sw-input-icon? library(htmltools) library(shinyWidgets) # <
Data Science
Ищите предыдущую дату в датафрейме, у которой есть определенная категория столбца в R.
00
Вопрос или проблема У меня есть следующий дата-фрейм: Date.POSIXct Date WeekDay DayCategory Hour Holidays value 1 2018-05-01 00:00:00 2018-05-01 MA MA-MI-JU 0 0 30 2 2018-05-01 01:00:00 2018-05-01 MA MA-MI-JU 1 0 80 3 2018-05-01 02:00:00 2018-05-01 MA
Вопросы и ответы
FIML в двухуровневом svyglm / svylm?
00
Вопрос или проблема Я учу анализ данных в R, так что дайте мне знать, если это странный вопрос. Я анализирую сложные данные опросов, используя пакет survey. Я также хочу, чтобы моя модель была двухуровневой, то есть одна из моих переменных находится на уровне кластеров.
Вопросы и ответы
Извлечение последовательных строк, как только достигнут триггер/порог.
00
Вопрос или проблема В R у меня есть такой датафрейм: ID Значение Вероятность 1 112 0.48 2 113 0.49 3 114 0.50 4 115 0.51 5 116 0.52 6 117 0.53 7 118 0.54 8 119 0.55 9 120 0.56 10 121 0.57 11 122 0.58 12 123 0.56 13 124 0.55 14 125 0.54 […]
Вопросы и ответы
Shiny: Произошла ошибка. Приложение не удалось запустить. Код выхода 1
00
Вопрос или проблема Доброе утро! Я работаю над разработкой shiny приложения, где пользователи могут выбрать желаемого игрока и стадион, чтобы создать анимационный график домашнего забега. Мой код для графика, пользовательского интерфейса и сервера приведён ниже.
Data Science
Обработка пропущенных значений в наборе данных о преступности в Чикаго
00
Вопрос или проблема Я занимаюсь небольшим проектом по набору данных о уровне преступности в Чикаго, и я заметил, что в нем более 600 000 значений NA, в основном в полях местоположения.Мне кажется, что, несмотря на наличие около 6 миллионов строк (данные
Вопросы и ответы
R, почему пост-хок тест Данна обнаруживает значимую разницу в abundance только в паре лет, которые выглядят наиболее похожими?
00
Вопрос или проблема Я не понимаю, почему мой пост-хок тест Дунна, после значимого теста Краскала-Уоллиса, обнаруживает значительную разницу между 2022 и 2023 годами, когда они, кажется, имеют наиболее похожее распределение общего изобилия по местам.
Вопросы и ответы
pmap_dbl и mean, Странные результаты
00
Вопрос или проблема Когда я тестирую расчеты для каждой строки, функция суммы выдает результаты правильно, в то время как данные для функции среднего значения берутся только из первого столбца. Я не совсем понимаю причину этого…… library(tidyverse) data <