Data Science
Ищем ранговое расстояние с большими весами для начальных элементов
00
Вопрос или проблема Предположим, что результаты гонки следующие: ["a", "b", "c", "d", "e"], так что “a” – победитель. Перед гонкой человек X предсказал результаты как ["b", "a", "c", "d", "e"], а человек Y предсказал результаты как ["a", "b"
Data Science
Как обнаружить переобучение в машинном обучении для регрессии
00
Вопрос или проблема Я применил Xgboost к своему набору данных, который включает около 50 000 наблюдений. Я разделил набор данных на 80/20 и использовал 5-кратную кросс-валидацию. Ниже приведены результаты: Обучающая выборка R$^2$: 0.
Data Science
Различие между слоями внимания и полностью связанными слоями в глубоком обучении
00
Вопрос или проблема За последние несколько лет было несколько публикаций по так называемому механизму “Внимания” в глубоком обучении (например, 1 2). Концепция заключается в том, что мы хотим, чтобы нейронная сеть сосредоточилась или обратила
Data Science
Как передать данные переменной длины в нейронную сеть в качестве признака?
00
Вопрос или проблема Я работаю над созданием модели для классификации типа касания, которое делает пользователь (долгое нажатие, смахивание влево, смахивание вправо и так далее). У меня есть данные с характеристиками, которые описывают касание пользователя
Data Science
Исследовательский анализ данных на наборе, разделенном на победителей и проигравших
00
Вопрос или проблема У меня есть набор данных о характеристиках победителей теннисных турниров и о характеристиках проигравших: возраст_победителя, рейтинг_победителя / возраст_проигравшего, рейтинг_проигравшего Чтобы провести надлежащий EDA, мне нужно
Data Science
Машинное обучение на основе многомерного временного ряда – Как создать формат контролируемых данных
00
Вопрос или проблема Вопрос 1: У меня есть многомерный набор временных рядов. Для каждого временного шага есть 11 признаков и 1 выходное значение. Я собираюсь использовать контролируемое машинное обучение для прогнозирования выходного значения.
Data Science
R Studio – grepl сравнение столбца в dataframe с перечнем шаблонов
00
Вопрос или проблема У меня есть столбец с названием “MATCH” в датафрейме и список шаблонов с названием “PATTERN”. df1.MATCH <- c("ABC", "abc" ,"BCD") df1 <- as.data.frame(df1.MATCH) df2.PATTERN <
Data Science
Низкоразмерные бинарные классификационные наборы данных
00
Вопрос или проблема Если кто-то хочет изучить аспекты нейронных сетей (например, в академической статье) и хочет экспериментировать с бинарной классификацией векторов в низкоразмерном пространстве (например, размерность = 2 или размерность < 6);
Data Science
Настройка RandLA-Net для меньших облаков точек: KNN, подвыборка точек и ошибки изменения формы
00
Вопрос или проблема Я работаю с глубокой архитектурой RandLA-Net для сегментации облаков точек наземного лазерного сканирования (TLS) на классы листьев и древесины. Мой проект включает обработку меньшего набора данных (около 1-2 миллионов точек) по сравнению
Data Science
борьба с развертыванием проекта классификатора машинного обучения
00
Вопрос или проблема Пожалуйста, может кто-нибудь помочь мне с этим? Когда я пытаюсь отладить веб-приложение после применения алгоритмов машинного обучения (векторизация BagOfWords и классификаторы), я столкнулся с проблемами, и ошибка была следующей
Data Science
Какой тест корреляции можно использовать для малых таблиц сопряженности?
00
Вопрос или проблема Мне нужно найти корреляцию между оценками, данными двумя сторонами. Допустим, у нас есть 2 тренера, а именно А и Б. Тренер А оценит навыки 12 игроков как “Сильный”, “Умеренный” или “
Data Science
Машинное обучение временных рядов на основе нескольких временных рядов
00
Вопрос или проблема У меня есть набор из 192 датчиков. Для измерения требуется 4 датчика (например, это средняя температура между используемыми датчиками в сложном материале). Эти датчики распределены по определенной схеме, чтобы получать информацию из всего материала.
Data Science
Альтернативные минимальные квадраты
00
Вопрос или проблема Может ли кто-нибудь объяснить разницу между Alternating Least Squares (ALS) и системами推荐? Будет полезно, если вы приведете пример. Системы推荐, например рекомендации фильмов Netflix, предположительно достаточно понятны.
Data Science
Какой лучший подход к работе с пропущенными данными в наборе данных?
00
Вопрос или проблема У меня есть набор данных, содержащий пропущенные значения в некоторых столбцах. Я хотел бы знать, какой лучший подход для работы с этими недостающими данными. Следует ли мне удалять строки с пропущенными данными или заполнять отсутствующие
Data Science
Преобразование модели Keras в PyTorch
00
Вопрос или проблема У меня есть файл Keras h5, который я хочу загрузить в ту же модель, но эта модель создана с использованием PyTorch. Является ли ONNX приемлемым промежуточным вариантом? Что еще я могу использовать? Извините, что это не точное решение
Data Science
Есть ли безопасный и простой способ оценить стандартное отклонение для следующего подмножества?
00
Вопрос или проблема В случае, если я получаю только стандартное отклонение от датчика значения $v$ (которое, кстати, нормально распределено) каждые 4 минуты, но мне нужно предоставить стандартное отклонение $\sigma$ каждые 15 минут, есть ли безопасный способ это сделать.
Data Science
Использование текстовых векторных представлений напрямую для вычисления схожести против использования их в качестве признаков для модели, предсказывающей схожесть.
00
Вопрос или проблема Представьте, что у вас есть задача, где у вас есть запрос и набор документов с результатами, и вы хотите ранжировать документы с учетом запроса. Также предположим, что у вас есть векторные представления (эмбеддинги) для запроса и для документов.
Data Science
Извлечение структурированных данных из полуструктурированных данных
00
Вопрос или проблема Я хочу использовать машинное обучение и обработку естественного языка (NLP), чтобы преобразовать полуструктурированные данные в текстовых файлах в структурированные данные, предсказывая паттерны в файлах и разбивая поля.
Data Science
Как скопировать и обрезать карту признаков в Unet?
00
Вопрос или проблема Я запутался в принципе копирования и обрезки в U-net, как показано серой линией выше. Например, первая серая линия, как преобразовать (64, 568, 568)(C,W,H) в (128, 392, 392), использовал ли автор свертку или обрезал карту признаков
Data Science
DQN не удается найти оптимальную политику
00
Вопрос или проблема Основываясь на публикации DeepMind, я воссоздал среду и пытаюсь сделать так, чтобы DQN находил и сходился к оптимальной стратегии. Задача агента состоит в том, чтобы научиться устойчиво собирать яблоки (объекты), при этом восстановление