Data Science
Как создать сеть для многометочной классификации в Keras, если у меня есть обучающие данные с различной точностью?
00
Вопрос или проблема Я пытаюсь создать нейронную сеть, которая найдет наиболее эффективное лечение для каждого пациента. У меня есть медицинская база данных для обучения. Входными данными являются гистологические и патологические данные (в основном данные
Data Science
Выполнение 1D глубинной свертки с использованием 2D глубинной свертки Keras
00
Вопрос или проблема Я хотел бы выполнить 1D свертку по глубине (то есть первый шаг свертки с разделением по глубине) для модели машинного обучения, над которой я работаю. Это означает, что для входного активационного пространства h x w есть h кернелов
Data Science
Лучший способ сузить список и ранжировать по атрибутам?
00
Вопрос или проблема У меня есть набор данных по ипотечным кредитам, который содержит список клиентов (600 тысяч записей) и включает 100 колонок, включая общую информацию о клиентах (адрес, город, почтовый индекс и т.д.), доход, FICO-баллы, количество
Data Science
Как выполнить (модифицированный) t-тест для нескольких переменных и моделей в Python (машинное обучение)
00
Вопрос или проблема Я создал и проанализировал около 16 моделей машинного обучения, используя WEKA. В данный момент у меня есть CSV-файл, который показывает метрики моделей (такие как percent_correct, F-measure, recall, precision и т.
Data Science
Выбор признаков на агрегированных целевых данных
00
Вопрос или проблема У меня есть вопрос о выборе признаков в наборе данных, где целевая переменная агрегируется по сумме различных данных. Я хочу предсказать количество продаж в зависимости от различных признаков, таких как: неделя цена за единицу страна
Data Science
Какое лучшее средство для прогнозирования спроса на товары с использованием нерегулярных временных рядов?
00
Вопрос или проблема Я работаю над проектом по контролируемому машинному обучению для прогнозирования будущего спроса на аптечные товары. Моя цель заключается в том, чтобы прогнозировать спрос на следующий день, неделю и месяц для конкретного товара на
Data Science
Размерность целевой функции для обучения агента DQN
00
Вопрос или проблема Насколько я понимаю, агент DQN имеет столько выходов, сколько действий (для каждого состояния). Если мы рассматриваем скалярное состояние с 4 действиями, это будет означать, что DQN будет иметь 4-мерный выход.
Data Science
Потеря триплета – какой порог использовать для определения сходства между двумя встраиваниями?
00
Вопрос или проблема Я обучил свою модель с использованием функции потерь тройки, используя архитектуру FaceNet. Я использовал набор данных 11k hands. Теперь я хочу оценить, насколько хорошо работает моя модель, поэтому я подаю ей 2 изображения одного
Data Science
Методы кластеризации ежедневных паттернов для временных рядов
00
Вопрос или проблема Вопрос: Привет всем, В настоящее время я работаю над проектом, связанным с ежедневными паттернами использования GN2 (азотного газа). Моя основная цель – снизить вариацию ежедневных паттернов и минимизировать разрыв между производством
Data Science
Соответствие набора испорченных строк правильным строкам
00
Вопрос или проблема Я довольно новичок в науке о данных, но раньше сталкивался с ней. Следующая проблема вызывает у меня беспокойство, и я надеюсь, что вы можете направить меня в правильном направлении. Входными данными являются строки, из которых некоторые
Data Science
Может ли микроподсчет ROC AUC быть больше, чем ROC AUC для классов?
00
Вопрос или проблема Я работаю с несбалансированным набором данных. В обучающем наборе данных 11567 отрицательных и 3737 положительных образцов. В валидационном наборе данных 2892 отрицательных и 935 положительных образцов. Это задача бинарной классификации
Data Science
Прогноз на конкретный месяц
00
Вопрос или проблема Я пытаюсь построить предсказательную модель на основе прошлых исторических данных. У меня есть информация о конкретных сбоях машин на основе данных за прошлый год. У меня есть данные за некоторые месяцы 2016 года и с января по ноябрь 2017 года.
Data Science
Как применить модель на основе дерева с числовыми и категориальными значениями для выявления выбросов
00
Вопрос или проблема У меня есть набор данных, в котором есть колонка цен, колонка дат и различные другие колонки с числовыми и категориальными значениями. Я хотел бы найти выбросы цен на основе всех колонок в наборе данных, и для этого я решил использовать
Data Science
Высокие потери и высокая точность на валидационном наборе данных на раннем этапе обучения бинарного классификатора
00
Вопрос или проблема Я обучаю сеть ResNet50 на симуляционных данных, а мой валидационный набор данных — это экспериментальные данные. Симуляционные данные не являются на 100% точным представлением экспериментальных данных. Цель этой сети — двойная классификация.
Data Science
Вопрос о грид-поиске и KFold
00
Вопрос или проблема Я пробую пример, над которым я тренируюсь на огромном наборе данных в 5 миллионов (только 4 признака) строк с помощью Cudf и CUml, и я использую SGD логистическую регрессию, потому что я должен предсказать, болен ли пациент или нет.
Data Science
Классификация с множеством классов
00
Вопрос или проблема Я пытаюсь создать модель, которая будет классифицировать текст примерно на 500 разных классов. Я думаю, что мне нужно настроить архитектуру Pooling Classifier, которая сейчас выглядит следующим образом: (1): PoolingLinearClassifier(
Data Science
Как я могу улучшить точность своей регрессионной модели?
00
Вопрос или проблема Для университетского проекта я пытаюсь подогнать последовательную модель Keras к нескольким тысячам данных, которые находятся примерно в диапазоне $y \in [-0.03,0.03]$ и имеют область $x \in (0, 409.6)$. Я использую следующую модель
Data Science
Как улучшить классификацию документов между двумя похожими документами
00
Вопрос или проблема У меня есть задача классификации документов, где мне нужно определить, связан ли определённый документ с недвижимостью или нет. Я получаю URL веб-страницы, из которой извлекаю весь текст, а затем с помощью своей обученной модели, основанной
Data Science
Учитывая модель регрессии с множеством переменных признаков, какие инструменты вы бы использовали, чтобы определить, какие переменные признаков добавляют наибольшую дисперсию?
00
Вопрос или проблема Предположим, что у нас есть гипотетический набор данных {S} с 100 переменными признаков X и 10 предсказанными переменными Y. X1 … X100 Y1 …. Y10 1 .. 2 3 .. 4 4 .. 3 2 .. 1 Предположим, я хочу повысить точность Y1.
Data Science
Лучший способ решения проблемы с займом
00
Вопрос или проблема У меня есть данные о кредитах, которые мне нужно классифицировать в зависимости от причин получения кредитов, и использовать их для прогнозирования причин, по которым люди всегда обращаются за кредитом. Есть ли у вас предложения?