Data Science
Как выполнить мультивариантную регрессию в Orange?
00
Вопрос или проблема Orange содержит ряд регрессионных виджетов, но все они кажутся унивариабельными, т.е. одна независимая переменная коррелирует с одной зависимой переменной. Когда у меня есть больше независимых переменных, которые могут влиять на зависимую
Data Science
Как обрабатывать такие временные ряды
00
Вопрос или проблема Я использую Python, и у меня есть пример набора данных следующего вида: columns = ['product_id', 'market_value2015', 'market_value2016', 'market_value2017', 'market_value2018', 'market_value2019', 'market_value2020', 'market_value2021'
Data Science
Как удалить предыдущие строки базы данных на основе совпадающего значения в столбце?
00
Вопрос или проблема Я в настоящее время пытаюсь отсортировать фрейм данных, содержащий классы атрибутов и значения команд. Однако в моих данных есть несколько строк с разными классами и значениями одного и того же ID команды/ID атрибута.
Data Science
Почему моделям LSTM не требуются метки на каждом этапе?
00
Вопрос или проблема Для проблем, связанных со временем, например, для предсказания акций: Предположим, у нас есть 300 дней данных, 10 признаков и одна целевая переменная: цена. Почему для тренировки нам нужна только цена 300-го дня?
Data Science
Проблема: Производительность логистической регрессии и моделей на основе деревьев на малом несбалансированном наборе данных
00
Вопрос или проблема У меня есть небольшой набор данных с 300 строками и несбалансированным распределением классов (35% положительных). Когда я обучаю модель логистической регрессии, она постоянно показывает результаты хуже случайного выбора.
Data Science
Как кластеризовать текст с использованием TensorFlow
00
Вопрос или проблема Извините за любые неточности из-за начальной стадии в этой области. Я пытаюсь научиться, как вернуть набор данных с тремя классами для кластеризации с помощью TensorFlow. На данный момент я много читал и экспериментировал с несколькими
Data Science
Нахождение значения P – объяснение
00
Вопрос или проблема def get_pvalue(con_conv, test_conv, con_size, test_size,): lift = - abs(test_conv - con_conv) scale_one = con_conv * (1 - con_conv) * (1 / con_size) scale_two = test_conv * (1 - test_conv) * (1 / test_size) scale_val = (scale_one + scale_two)**0.
Data Science
Можем ли мы обучить модель Dolly v-2 на большом объеме общего неразмеченного текста?
00
Вопрос или проблема Я знаком с концепциями машинного обучения и глубокого обучения и посмотрел на Dolly, а также запустил предобученную модель на ноутбуке Jupyter lab в Databricks. Однако, когда я смотрю на формат их тренировочного набора данных, все
Data Science
Как найти корреляции между данными во времени?
00
Вопрос или проблема У меня есть ежедневные данные о моих продажах и ежедневное обновление о том, как увеличиваются случаи COVID-19. Мои ежедневные продажи содержат информацию о моих клиентах и о моем продукте. Моя конечная цель –
Data Science
Недоразумения о числовом росте fp-дерева:
00
Вопрос или проблема Если fcam=3, будет ли условное fp-дерево все равно c=4 или что-то другое? Я предполагаю, что это должно быть f=3, c=4, a=3, m=3. Я прав? Или что-то другое? Пожалуйста, подскажите. Также, на этой ниже приведенной фигуре (та же фигура
Data Science
Почему LLM обучаются только в одну эпоху?
00
Вопрос или проблема Почему так важно НИКОГДА не позволять модели видеть одни и те же тексты несколько раз, как мы делаем, например, в компьютерном зрении? Или на самом деле все должно быть наоборот, и из-за того, что у нас маленькие наборы данных изображений
Data Science
Примените Labeled LDA к большим данным
00
Вопрос или проблема Я использую набор данных, содержащий около 1,5 миллиона документов. Каждый документ сопровождается ключевыми словами, описывающими темы данного документа (то есть многоярлык). Каждый документ принадлежит нескольким авторам (не одному автору для документа).
Data Science
Какая архитектура машинного обучения подходит для регрессии сигналов фиксированной длины?
00
Вопрос или проблема Моя проблема имеет регрессионный характер – Как оценить вес рыбы, используя сигнал фиксированной длины (80 точек данных) изменения сопротивления, когда рыба проплывает через ворота с электроды (по сути, 4 секунды прохождения
Data Science
Как найти векторное представление для каждого дескриптора?
00
Вопрос или проблема Данные кубов хорошо известны в области экстремальной классификации. Каждое изображение имеет набор дескрипторов. В общей сложности набор данных содержит 312 дескрипторов. Вы можете найти список дескрипторов в этом файле.
Data Science
Проблемы с матрицей корреляции: Невозможно преобразовать переменные в числовые значения
00
Вопрос или проблема ВОПРОСЫ: Не могли бы вы сказать, как можно преобразовать переменные типа int и factor в числовые переменные в R? Не могли бы вы объяснить, почему as.numeric(as.character(df$Account_Global_Region_Cascading_Band)) не работает?
Data Science
Показ времени отклика на графике
00
Вопрос или проблема У меня есть несколько вычислительных устройств. Я использовал алгоритм для распределения нагрузки между этими устройствами. Есть центральный координатор, который контролирует нагрузку на каждое устройство, и если одно устройство перегружено
Data Science
Объединить результаты нескольких моделей
00
Вопрос или проблема Я использую партии по 100000 строк из CSV файла для обучения простой модели LASSO. Как мне объеденить все эти модели, обученные на разных партициях? Я хотел бы использовать все эти обученные модели для предсказания.
Data Science
RMSE и R-квадрат
00
Вопрос или проблема Вопрос: Какой из метрик лучше для сравнения разных моделей: RMSE или R-квадрат? Я немного поискал, обычно все блоги говорят, что обе метрики объясняют разные идеи: R-квадрат является мерой того, сколько вариации объясняет модель, а
Data Science
Как разделить временной ряд на обучающую и тестовую выборки?
00
Вопрос или проблема У меня есть набор данных, состоящий из нескольких временных рядов для нескольких пользователей. У каждого пользователя есть несколько временных шагов, значение для предсказания на каждом временном шаге и список признаков на каждом временном шаге.
Data Science
Как справиться с сильным переобучением в сверточной нейронной сети UNet с кодировщиком/декодировщиком в задаче, очень похожей на перевод изображений?
00
Вопрос или проблема Я пытаюсь подогнать CNN UNet под задачу, очень похожую на перевод изображений. Входные данные сети – это бинарная матрица размером (64,256), а выход – размером (64,32). Колонки представляют собой статус канала связи, где