Data Science
Data Science
Вопрос или проблема Orange содержит ряд регрессионных виджетов, но все они кажутся унивариабельными, т.е. одна независимая переменная коррелирует с одной зависимой переменной. Когда у меня есть больше независимых переменных, которые могут влиять на зависимую
Data Science
Вопрос или проблема Я использую Python, и у меня есть пример набора данных следующего вида: columns = ['product_id', 'market_value2015', 'market_value2016', 'market_value2017', 'market_value2018', 'market_value2019', 'market_value2020', 'market_value2021'
Data Science
Вопрос или проблема Я в настоящее время пытаюсь отсортировать фрейм данных, содержащий классы атрибутов и значения команд. Однако в моих данных есть несколько строк с разными классами и значениями одного и того же ID команды/ID атрибута.
Data Science
Вопрос или проблема Для проблем, связанных со временем, например, для предсказания акций: Предположим, у нас есть 300 дней данных, 10 признаков и одна целевая переменная: цена. Почему для тренировки нам нужна только цена 300-го дня?
Data Science
Вопрос или проблема У меня есть небольшой набор данных с 300 строками и несбалансированным распределением классов (35% положительных). Когда я обучаю модель логистической регрессии, она постоянно показывает результаты хуже случайного выбора.
Data Science
Вопрос или проблема Извините за любые неточности из-за начальной стадии в этой области. Я пытаюсь научиться, как вернуть набор данных с тремя классами для кластеризации с помощью TensorFlow. На данный момент я много читал и экспериментировал с несколькими
Data Science
Вопрос или проблема def get_pvalue(con_conv, test_conv, con_size, test_size,): lift = - abs(test_conv - con_conv) scale_one = con_conv * (1 - con_conv) * (1 / con_size) scale_two = test_conv * (1 - test_conv) * (1 / test_size) scale_val = (scale_one + scale_two)**0.
Data Science
Вопрос или проблема Я знаком с концепциями машинного обучения и глубокого обучения и посмотрел на Dolly, а также запустил предобученную модель на ноутбуке Jupyter lab в Databricks. Однако, когда я смотрю на формат их тренировочного набора данных, все
Data Science
Вопрос или проблема У меня есть ежедневные данные о моих продажах и ежедневное обновление о том, как увеличиваются случаи COVID-19. Мои ежедневные продажи содержат информацию о моих клиентах и о моем продукте. Моя конечная цель –
Data Science
Вопрос или проблема Если fcam=3, будет ли условное fp-дерево все равно c=4 или что-то другое? Я предполагаю, что это должно быть f=3, c=4, a=3, m=3. Я прав? Или что-то другое? Пожалуйста, подскажите. Также, на этой ниже приведенной фигуре (та же фигура
Data Science
Вопрос или проблема Почему так важно НИКОГДА не позволять модели видеть одни и те же тексты несколько раз, как мы делаем, например, в компьютерном зрении? Или на самом деле все должно быть наоборот, и из-за того, что у нас маленькие наборы данных изображений
Data Science
Вопрос или проблема Я использую набор данных, содержащий около 1,5 миллиона документов. Каждый документ сопровождается ключевыми словами, описывающими темы данного документа (то есть многоярлык). Каждый документ принадлежит нескольким авторам (не одному автору для документа).
Data Science
Вопрос или проблема Моя проблема имеет регрессионный характер – Как оценить вес рыбы, используя сигнал фиксированной длины (80 точек данных) изменения сопротивления, когда рыба проплывает через ворота с электроды (по сути, 4 секунды прохождения
Data Science
Вопрос или проблема Данные кубов хорошо известны в области экстремальной классификации. Каждое изображение имеет набор дескрипторов. В общей сложности набор данных содержит 312 дескрипторов. Вы можете найти список дескрипторов в этом файле.
Data Science
Вопрос или проблема ВОПРОСЫ: Не могли бы вы сказать, как можно преобразовать переменные типа int и factor в числовые переменные в R? Не могли бы вы объяснить, почему as.numeric(as.character(df$Account_Global_Region_Cascading_Band)) не работает?
Data Science
Вопрос или проблема У меня есть несколько вычислительных устройств. Я использовал алгоритм для распределения нагрузки между этими устройствами. Есть центральный координатор, который контролирует нагрузку на каждое устройство, и если одно устройство перегружено
Data Science
Вопрос или проблема Я использую партии по 100000 строк из CSV файла для обучения простой модели LASSO. Как мне объеденить все эти модели, обученные на разных партициях? Я хотел бы использовать все эти обученные модели для предсказания.
Data Science
Вопрос или проблема Вопрос: Какой из метрик лучше для сравнения разных моделей: RMSE или R-квадрат? Я немного поискал, обычно все блоги говорят, что обе метрики объясняют разные идеи: R-квадрат является мерой того, сколько вариации объясняет модель, а
Data Science
Вопрос или проблема У меня есть набор данных, состоящий из нескольких временных рядов для нескольких пользователей. У каждого пользователя есть несколько временных шагов, значение для предсказания на каждом временном шаге и список признаков на каждом временном шаге.
Data Science
Вопрос или проблема Я пытаюсь подогнать CNN UNet под задачу, очень похожую на перевод изображений. Входные данные сети – это бинарная матрица размером (64,256), а выход – размером (64,32). Колонки представляют собой статус канала связи, где