Data Science
Должен ли я повторять разделение на тестовую/обучающую выборки при повторении кросс-валидации K-складок?
01
Вопрос или проблема Я подгоняю регрессии случайного леса к своим данным и использую 10-кратную кросс-валидацию для оценки качества модели. При повторном запуске кросс-валидации я заметил, что результаты различаются между каждым запуском, иногда значительно.
Data Science
Трудности в создании матрицы путаницы в R для “Да” или “Нет”
00
Вопрос или проблема Я новичок в регрессии и матрице ошибок и пытаюсь создать матрицу ошибок на основе модели логистической бинарной регрессии. Я пытаюсь создать матрицу ошибок из значений “Да” или “Нет”
Data Science
Как построить таблицу с несколькими столбцами в виде коробчатой диаграммы
00
Вопрос или проблема Я пытаюсь построить боксплот с триплетом в качестве оси x (так что 64 триплета на оси x) и частотой каждого триплета в каждом из 6 образцов, затем закодировать цвет графика в зависимости от образца. Это фрагмент таблицы и код, который
Data Science
Существуют ли пакеты R, которые поддерживают глубокие RNN?
00
Вопрос или проблема Недавно я нашел интересную статью о том, что на самом деле значит, что рекуррентная нейронная сеть (RNN) является глубокой здесь. Глубину можно добавлять несколькими способами (состояние к состоянию, вход к состоянию и т.
Data Science
Группировка по 2 переменным и разворот распределения на основе 2 других.
00
Вопрос или проблема Выполняю расчеты на датафрейме и застрял, пытаясь вычислить несколько процентов. Пытаюсь добавить 3 дополнительные колонки для %POS/NEG/NEU. Например, сумма колонки Amount для всех наблюдений с направлением POS в обеих строках Drew &
Data Science
Регрессионная модель для непрерывной зависимой переменной и количественных независимых переменных
00
Вопрос или проблема В данный момент я изучаю R и относительно новичок в этой области. Надеюсь, что смогу получить от вас советы! Я работаю над проектом, в котором мне необходимо оценить среднее время обработки различных рабочих заданий (задач).
Data Science
Разделение обучающих данных на несколько переменных с использованием R
00
Вопрос или проблема Итак, сейчас я пытаюсь создать несколько переменных с обучающими данными, и в процессе я столкнулся с ошибкой Ошибка в eval(predvars, data, env): объект ‘1.band1’ не найден которая возникает из этих строк: for(i in 1:length(data_split)){ assign(paste("fit.
Data Science
Модель линейной регрессии
00
Вопрос или проблема Я прохожу курс по Управляемому обучению в R: Регрессия. Есть раздел, в котором мне нужно предсказать артериальное давление, учитывая возраст и вес. Это был МОЙ подход # Создать формулу и вывести ее fmla <
Data Science
Оценка сходств и различий групп после PCA
00
Вопрос или проблема Цель состоит в оценке сходства и различия между 6 известными группами. Исходные данные начинались с 6 известных групп и 2700+ переменных, все на шкале от 0 до 100. Я выполнил PCA, чтобы уменьшить более чем 2700 переменных до 5 главных
Unix-подобные системы
Ошибка при установке пакета R: заголовки/lib не доступны
00
Вопрос или проблема Я устанавливаю пакет R (R-3.0.1) на Red Hat Linux 6.0. Сначала, когда я пытался установить его, возникла ошибка “Компилятор F77 не найден”. Я установил компилятор и попробовал снова, теперь я получаю следующую ошибку configure: error
Data Science
Удалите значения NA в импортированном документе xlxs с помощью R.
00
Вопрос или проблема У меня есть прикрепленный документ. Я импортировал документ xlxs в R. Я хотел бы избавиться от всех строк, содержащих NA. Я пробовал следующее, но это не работает. # установка пакетов Примечание# tidyverse устанавливает пакеты для dplyr и ggplot2 install.
Data Science
Почему изменение числа кластеров изменяет график в K-means?
00
Вопрос или проблема Может быть, это глупый вопрос, но я не могу найти на него ответ. У меня нет идеального математического понимания kmeans, так что прошу прощения, если это так. Мне просто интересно, почему я вижу другой график, когда изменяю количество
Data Science
Функция missForest в R не работает.
00
Вопрос или проблема Я пытаюсь использовать функцию missForest() из библиотеки ‘missForest’, но постоянно получаю одно и то же сообщение об ошибке. Вот код: библиотеки: library(dplyr) library(naniar) library(missForest) данные: url <
Убунту
“Общий размер экспортируемых глобальных переменных x для будущего выражения” в R-CMD-CHECK только на ubuntu-latest (devel)
00
Вопрос или проблема Извините, но я не уверен, что это правильное место для сообщения о моей проблеме, так как она связана с конгломератом трех систем, только одна из которых – Ubuntu. Я пришел сюда, только после того как сначала попробовал на форумах
Data Science
На каком алгоритме бустинга основан метод xgbLinear пакета xgboost/caret?
00
Вопрос или проблема В пакете caret для R есть метод ‘xgblinear’. Какой алгоритм лежит в основе этого метода? Не уверена, полезно ли это, но вот ссылка на академическую работу, в которой подробно описывается как алгоритм XGBoost, так и его применения.
Data Science
Выборка из конкретного варианта в данных mc2d mcnode в R
00
Вопрос или проблема Я пытаюсь выполнить выборку из конкретной вариаты в mcnode – фрейме данных, созданном двухмерным Монте-Карло пакетом mc2d. Я скопировал, как выглядит mcnode, ниже. Есть идеи, как выбрать конкретную вариату или извлечь все данные только из одной вариаты?
Data Science
Создание RiskScore на числовых данных
00
Вопрос или проблема Я работаю над созданием оценки риска на основе данных, где у меня есть переменные – сумма инвестиций, прибыль, возраст аккаунта в днях, общее количество торговых транзакций, прибыль на транзакцию и инвестиции на транзакцию.
Data Science
Становится ли с точки зрения статистики неправильно корректировать по полу и расе, а затем делать подгруппы на их основе в R?
00
Вопрос или проблема Я хочу узнать ваше мнение: Я провожу анализ подгрупп по ранней смертности (Результат), основанный на Переливании (С УЧЕТОМ как Пола, так и РАСЫ), и получил результаты, показывающие, что переливание ассоциировано с более высокой смертностью
Data Science
Руководство для модели распознавания изображений (для инвентаризации)
00
Вопрос или проблема У меня есть более 20,000 изображений произведений искусства (живопись, скульптуры, банки и т. д.), хранящихся в базе данных. Самие произведения распределены по нескольким складам. Идеально, чтобы физические предметы ДОЛЖНЫ были иметь
Data Science
Запуск запроса в R после установления соединения с базой данных
00
Вопрос или проблема Кажется, я не могу понять, что не так в следующем заявлении. Подключение к DWH установлено, но оператор запроса в R, похоже, не работает, с следующей ошибкой: LR=dbGetQuery(con, "select id as ID, date_c."Professional_Status" as Prof_Status, case when talk_sec >