Data Science
Стохастический градиентный спуск и его варианты
00
Вопрос или проблема Насколько я понимаю, SGDW и SGD + моментум — это две разные техники оптимизации, а SGDWR — это SGDW + планировщик в форме косинусного остывания с теплым перезапуском. Я прав? Если нет, пожалуйста, исправьте меня.
Data Science
Классификация на основе нерегулярного количества признаков
00
Вопрос или проблема Итак, я пытаюсь классифицировать довольно большой набор данных, где обучающий набор имеет некоторые странные проблемы… Для каждой строки доступно разное количество признаков. Например, для одного предсказания у меня может быть
Data Science
Развертывание ML модели на AWS
00
Вопрос или проблема Итак, я обучил модель машинного обучения и мне нужно использовать ее на AWS, чтобы делать предсказания на основе новых данных на периодической ежедневной основе и выводить эти данные в виде приложенного электронного письма.
Data Science
Алгоритм K-средних для множественных переменных
00
Вопрос или проблема Я новичок в машинном обучении и сейчас читаю о алгоритме K-Means и пробую его с инструментом ORANGE. После того как я просмотрел несколько примеров на YouTube и в различных других местах, я немного запутался в том, как работает расчет
Data Science
Как я могу использовать расстояние Хеллингера на массивах разной длины?
01
Вопрос или проблема Мне нужно использовать расстояние Хеллингера для сравнения массивов, которые не одинаковой длины. Как правильно это сделать? Ставить ноль в отсутствующих полях для более короткого массива не кажется мне лучшим методом.
Data Science
Пространственно ограниченная геопространственная схожесть
00
Вопрос или проблема Какова текущая методология кластеризации геопространственных данных по признакам? Пример: у меня есть демографический набор данных. Допустим, он содержит среднюю цену на жилье и плотность населения. Таким образом, пример корреляции
Data Science
Какая модельная техника используется для синтеза данных на основе наборов последовательных булевых выборок?
00
Вопрос или проблема У меня есть около 100 наборов данных, каждый из которых представляет собой независимый процесс, описывающий состояние независимой машины. Если машина находится в первом состоянии, это “Правда”, а если во втором состоянии, то “
Data Science
Как настроить GPT-J с небольшим набором данных
00
Вопрос или проблема Во-первых, большое спасибо за то, что вы посмотрели этот пост. Мне действительно нужна помощь. Я следовал этому руководству настолько близко, насколько это возможно: https://github.com/kingoflolz/mesh-transformer-jax Я пытаюсь дообучить
Data Science
Как эффективно уменьшить размерности категориальных значений, закодированных методом one-hot?
00
Вопрос или проблема В настоящее время я работаю над проектом, в котором использую LSTM для обучения и предсказания последовательностей категориальных данных. Мой набор данных состоит из последовательностей переменной длины элементов $s_i = [x_{i_0}, x_{i_1}, …
Data Science
Ошибка значения input_shape модели Keras Conv1D
00
Вопрос или проблема Я не уверен, почему я получаю эту ошибку значения. Кроме того, я не нашел учебного пособия, которое явно обсуждало бы уместность размера фильтров и ядра. Я был бы признателен за некоторые советы и ссылки. Я предсказываю следующий предпоследний или последний столбец.
Data Science
Использование переменных накопления, специфичных для пользователя, вызывает утечку данных?
00
Вопрос или проблема Предположим, у меня есть сценарий, в котором моей объектом наблюдения является счет, который был выставлен после оказания определенной услуги, и моя цель — предсказать, будет ли этот счет оплачен или нет. У меня есть пользователи в
Data Science
Классификация текста неверно классифицирует?
00
Вопрос или проблема Я пытаюсь решить задачу бинарной классификации. Мои метки — абьюзивные (1) и не абьюзивные (0). Мой набор данных был несбалансирован (больше 1, чем 0), и я использовал увеличенное количество выборок для меньшинства (т.
Data Science
Стационарные временные ряды для алгоритмов кластеризации
00
Вопрос или проблема У меня есть набор временных рядов, который я хотел бы передать в алгоритм кластеризации (например, k-средние, используя динамическое время для измерения расстояния). После стандартизации данных со средним значением 0 и дисперсией 1
Data Science
Мультимодальное обнаружение насилия
00
Вопрос или проблема Я пытаюсь создать мультимодальную систему обнаружения насилия, которая учитывает как аудиоданные, так и визуальные данные. Для визуальной классификации я хочу использовать трансформеры. Я хочу узнать, как можно извлечь характеристики
Data Science
Оранжевое чтение новых функций из таборазделенного файла
00
Вопрос или проблема В моем табличном файле с разделителями я имею 65 признаков и 1 целевую переменную, которые являются числовыми и непрерывными. Мои данные должны использоваться для регрессионных моделей. При загрузке файла в Orange должно быть 65 признаков
Data Science
Tensorflow Conv3D с переменным размером входа
00
Вопрос или проблема У меня гипотетический вопрос: возможно ли обучить Conv3D с переменным размером входа? Размер выборки = Длина x Ширина x Глубина; Глубина фиксирована для каждой выборки, скажем, 500. Однако Длина x Ширина может варьироваться, например
Data Science
Использование клея для включения информации о выбранном наблюдении
00
Вопрос или проблема Я хотел бы, чтобы мой ggplot отображал выбранный мной штат для лучшей ясности, но кажется, что glue ищет только первое наблюдение, а не желаемый результат. library(tidyverse) library(glue) death_state=read_csv("https://raw.
Data Science
Какова правильная форма использования реального кода генетического алгоритма?
00
Вопрос или проблема Я новичок в генетических алгоритмах, но не нашел конкретной информации о генетических алгоритмах с действительными кодами. Я хочу оптимизировать антенную решетку, используя реальные значения позиции антенны, фазы и амплитуды, но я
Data Science
Литература по выбору конкретных измерений в векторе встраивания слов
00
Вопрос или проблема Я понимаю, что разные размеры в векторном представлении слов представляют собой различную информацию, и между двумя векторами можно выполнять алгебраические операции, например. Может кто-нибудь указать мне на литературу по выбору конкретных
Data Science
Байесовская оптимизация с использованием Keras Tuner для временных рядов
00
Вопрос или проблема Цель: попытаться использовать стратегию валидации с помощью «walk-forward» с keras tuner для временных рядов при обучении нейронной сети (в основном LSTM и/или CNN). Кто-нибудь нашел прямой способ сделать это?