Data Science
Как я могу использовать расстояние Хеллингера на массивах разной длины?
00
Вопрос или проблема Мне нужно использовать расстояние Хеллингера для сравнения массивов, которые не одинаковой длины. Как правильно это сделать? Ставить ноль в отсутствующих полях для более короткого массива не кажется мне лучшим методом.
Data Science
Пространственно ограниченная геопространственная схожесть
00
Вопрос или проблема Какова текущая методология кластеризации геопространственных данных по признакам? Пример: у меня есть демографический набор данных. Допустим, он содержит среднюю цену на жилье и плотность населения. Таким образом, пример корреляции
Data Science
Какая модельная техника используется для синтеза данных на основе наборов последовательных булевых выборок?
00
Вопрос или проблема У меня есть около 100 наборов данных, каждый из которых представляет собой независимый процесс, описывающий состояние независимой машины. Если машина находится в первом состоянии, это “Правда”, а если во втором состоянии, то “
Data Science
Как настроить GPT-J с небольшим набором данных
00
Вопрос или проблема Во-первых, большое спасибо за то, что вы посмотрели этот пост. Мне действительно нужна помощь. Я следовал этому руководству настолько близко, насколько это возможно: https://github.com/kingoflolz/mesh-transformer-jax Я пытаюсь дообучить
Data Science
Как эффективно уменьшить размерности категориальных значений, закодированных методом one-hot?
00
Вопрос или проблема В настоящее время я работаю над проектом, в котором использую LSTM для обучения и предсказания последовательностей категориальных данных. Мой набор данных состоит из последовательностей переменной длины элементов $s_i = [x_{i_0}, x_{i_1}, …
Data Science
Ошибка значения input_shape модели Keras Conv1D
00
Вопрос или проблема Я не уверен, почему я получаю эту ошибку значения. Кроме того, я не нашел учебного пособия, которое явно обсуждало бы уместность размера фильтров и ядра. Я был бы признателен за некоторые советы и ссылки. Я предсказываю следующий предпоследний или последний столбец.
Data Science
Использование переменных накопления, специфичных для пользователя, вызывает утечку данных?
00
Вопрос или проблема Предположим, у меня есть сценарий, в котором моей объектом наблюдения является счет, который был выставлен после оказания определенной услуги, и моя цель — предсказать, будет ли этот счет оплачен или нет. У меня есть пользователи в
Data Science
Классификация текста неверно классифицирует?
00
Вопрос или проблема Я пытаюсь решить задачу бинарной классификации. Мои метки — абьюзивные (1) и не абьюзивные (0). Мой набор данных был несбалансирован (больше 1, чем 0), и я использовал увеличенное количество выборок для меньшинства (т.
Data Science
Стационарные временные ряды для алгоритмов кластеризации
00
Вопрос или проблема У меня есть набор временных рядов, который я хотел бы передать в алгоритм кластеризации (например, k-средние, используя динамическое время для измерения расстояния). После стандартизации данных со средним значением 0 и дисперсией 1
Data Science
Мультимодальное обнаружение насилия
00
Вопрос или проблема Я пытаюсь создать мультимодальную систему обнаружения насилия, которая учитывает как аудиоданные, так и визуальные данные. Для визуальной классификации я хочу использовать трансформеры. Я хочу узнать, как можно извлечь характеристики
Data Science
Оранжевое чтение новых функций из таборазделенного файла
00
Вопрос или проблема В моем табличном файле с разделителями я имею 65 признаков и 1 целевую переменную, которые являются числовыми и непрерывными. Мои данные должны использоваться для регрессионных моделей. При загрузке файла в Orange должно быть 65 признаков
Data Science
Tensorflow Conv3D с переменным размером входа
00
Вопрос или проблема У меня гипотетический вопрос: возможно ли обучить Conv3D с переменным размером входа? Размер выборки = Длина x Ширина x Глубина; Глубина фиксирована для каждой выборки, скажем, 500. Однако Длина x Ширина может варьироваться, например
Data Science
Использование клея для включения информации о выбранном наблюдении
00
Вопрос или проблема Я хотел бы, чтобы мой ggplot отображал выбранный мной штат для лучшей ясности, но кажется, что glue ищет только первое наблюдение, а не желаемый результат. library(tidyverse) library(glue) death_state=read_csv("https://raw.
Data Science
Какова правильная форма использования реального кода генетического алгоритма?
00
Вопрос или проблема Я новичок в генетических алгоритмах, но не нашел конкретной информации о генетических алгоритмах с действительными кодами. Я хочу оптимизировать антенную решетку, используя реальные значения позиции антенны, фазы и амплитуды, но я
Data Science
Литература по выбору конкретных измерений в векторе встраивания слов
00
Вопрос или проблема Я понимаю, что разные размеры в векторном представлении слов представляют собой различную информацию, и между двумя векторами можно выполнять алгебраические операции, например. Может кто-нибудь указать мне на литературу по выбору конкретных
Data Science
Байесовская оптимизация с использованием Keras Tuner для временных рядов
00
Вопрос или проблема Цель: попытаться использовать стратегию валидации с помощью «walk-forward» с keras tuner для временных рядов при обучении нейронной сети (в основном LSTM и/или CNN). Кто-нибудь нашел прямой способ сделать это?
Data Science
Оранжевая добыча данных: Балансировка набора данных с использованием кода imblearn
00
Вопрос или проблема Я использую несбалансированный набор данных. Я хотел переполнить свой набор данных, используя скрипт на Python (Скрипт для устранения дисбаланса классов в Biolabs Orange). Однако он все равно выдает мне ошибку "Нет модуля с именем imblearn".
Data Science
Кто-нибудь может порекомендуать хорошие книги или статьи по работе с временными рядами?
00
Вопрос или проблема Я прочитал несколько руководств, таких как эта ссылка. У меня большие трудности с пониманием того, как эффективно использовать временные ряды. Буду благодарен за любую помощь в понимании, желательно с примерами из практики.
Data Science
Регрессия – Модель в целом выглядит хорошо, но R2 неожиданно отрицательно высок.
00
Вопрос или проблема Я строил модель линейной регрессии с около 150 строками данных. Я проверил корреляцию параметров с целевой переменной и попытался оставить только их, так как у меня меньше данных, и я хотел получить простую линейную модель.
Data Science
Как обрезать признаки с помощью рекурсивного исключения признаков?
00
Вопрос или проблема У меня есть некоторые пространственные данные для почти 1000 мест, и в каждом месте около 5000 признаков. Я провожу анализ соседства, чтобы определить, какие признаки преобладают в местном окружении. Я читал, что с помощью рекурсивного