r
Вопросы и ответы
Вопрос или проблема Существует ли способ преобразовать приведенные ниже вложенные списки в датафрейм в R? Списки ниже имеют неравные размеры, поэтому я хотел бы узнать, можем ли мы преобразовать это в датафрейм. Если значение отсутствует, оно должно быть заменено на NA.
Вопросы и ответы
Вопрос или проблема Я хотел бы создать коробчатую диаграмму для моих данных, где сама диаграмма представляет IQR, а усики представляют значения от 5-го до 95-го процентов. Я хочу использовать geom_dotplot, чтобы показать только отдельные данные, которые
Вопросы и ответы
Вопрос или проблема Я создаю набор данных Parquet, разделённый по двум столбцам. Он создаётся непосредственно из 30 000 txt-файлов (по 100 тысяч строк каждый), которые слишком велики, чтобы загружать в память сразу. Я действую следующим образом: mydata <
Data Science
Вопрос или проблема Этот вопрос касается вопроса 4h из этого учебного задания. Вопрос заключается в том, чтобы сделать прогнозы на будущее на основе выбранной модели TSLM, которая включает эндогенно созданную (если я использую это правильно) дummies-переменную
Вопросы и ответы
Вопрос или проблема Когда я работаю с dataframe в pandas, мне нравится использовать цепочки методов, потому что это делает рабочий процесс похожим на подход tidyverse в R, где вы используете строку пайпов. Рассмотрим пример из этого ответа: N = 10 df = ( pd.
Вопросы и ответы
Вопрос или проблема Мне нужно установить проект R с использованием renv на сервере Debian12, у меня нет прав root. На Debian12 нет renv [package.debian r-cran-renv][1] Наивный подход — попытаться установить его в /usr/local/lib…
Unix-подобные системы
Вопрос или проблема Я запускаю интерактивный R в терминале, однако он не использует всю ширину терминала. Он использует только 72 символа из 226. Чтение данных с большим количеством столбцов в интерактивном R очень неудобно. Я использую urxvt на debian 9,8. Смотрите ?
Вопросы и ответы
Вопрос или проблема Я пытаюсь следовать этому руководству, и когда я пытаюсь его запустить и нажимаю кнопку загрузки, он выдает мне html-файл, и я не знаю почему. Это касается не только этого скрипта, но и моего личного проекта.
Вопросы и ответы
Вопрос или проблема У меня есть фрейм данных ниже, я хотел бы добавить столбец под названием Percentage. Упорядочить по каждой торговле. В строке CofQYr == 0 значение Percentage будет равно общей сумме по всем столбцам (с 2014 по 2024) деленной на общую
Вопросы и ответы
Вопрос или проблема Я пытаюсь добавить столбец в датафрейм на основе сложного условия, и не могу найти посты, которые соответствуют тому, что я пытаюсь сделать. У меня есть данные следующего типа с тремя категориальными столбцами (“
Вопросы и ответы
Вопрос или проблема У меня есть следующий датафрейм, в котором ось x представляет фазы проекта (от 1 до 5 в порядке возрастания), а ось y представляет названия проектов. df1 = data.frame(a = c("Проект1", "Проект2", "Проект3","Проект4"), b = c(2, 4, 2, 5)) проект 1 >
Вопросы и ответы
Вопрос или проблема В SAS я пишу код, который в журнале выглядит так: 2 proc sql; 3 create table test as 4 select 5 ID, 6 GENDER, 7 BIRTHYEAR 8 from 9 libname.dataset 10 group by ID 11 having count(*) > 1 12 ; ПРИМЕЧАНИЕ: Запрос требует повторного
Data Science
Вопрос или проблема Я планирую использовать Isolation Forests в R (пакет solitude) для выявления выбросов в медицинских исках в моих данных. Каждая строка в моих данных представляет собой группу лекарств, которые каждый провайдер назначал за последние 12 месяцев.
Вопросы и ответы
Вопрос или проблема Я создал комбинированный график, используя код: name <- rep(c("ba", "EW", "RW", "Se", "St", "US", "VN"), 2) value <- c(0, 6323, 7397, 13945, 11801, 55255, 22519, 4124, 13540, 9616, 57724, 6646, 22021, 8841) type <
Вопросы и ответы
Вопрос или проблема Я следовал приведенным ниже шагам, чтобы выполнить корреляцию. Это дало мне график без хорошей визуализации. Я также попробовал использовать png. library(corrplot) c_df <- Hmisc::rcorr(cor(df), type="spearman") M = c_df$r[1:3, 4:134] p.
Вопросы и ответы
Вопрос или проблема Я пытаюсь подогнать усеченное логистическое распределение (log-logistic) с помощью GAMLSS и не могу найти, как это сделать. В документации сказано, что для обобщенной бета-распределения 2 (GB2): установка ν = 1 и τ = 1 в (15.
Вопросы и ответы
Вопрос или проблема В параллельной обработке в R (например, с использованием future) под Windows, возможно ли заставить R приоритизировать использование менее загруженных ядер на общем устройстве? Я использую общий сервер Windows (> 200 ядер) с многими другими коллегами.
Вопросы и ответы
Вопрос или проблема Предположим, есть набор данных с дублированными PersonID и несколькими датами. PersonID Дата 1 2024-01-01 1 2024-01-02 1 2024-01-09 1 2024-01-15 2 2024-08-05 2 2024-08-06 3 2024-01-07 3 2024-01-08 3 2024-01-15 Я хочу оставить только
Вопросы и ответы
Вопрос или проблема library(TAM) # Данные с 3 элементами и 1 кандидатом data <- t(c(item1 = 1, item2 = 0, item3 = 1)) # Определяем фиксированную матрицу сложности difficulty_matrix <- cbind(1:3, c(1.5, 2.0, 1.0)) # Подгонка модели TAM с фиксированной
Вопросы и ответы
Вопрос или проблема библиотека(stats, исключить = c("filter", "lag")) библиотека(tidyverse) причины ── Присоединение основных пакетов tidyverse ──────────────────────── tidyverse 2.0.0 ── ✔ dplyr 1.1.4 ✔ readr 2.1.5 ✔ forcats 1.